ソフトウェア

GPT-4の半分以下の計算でほぼ同等なIQを持つパーソナルAI「Pi」と基盤モデル「Inflection-2.5」が登場


AI企業・Inflectionが開発している生成AI「Pi」は、ユーザーひとりひとりに最適化された「パーソナルAI」です。そんなPiの能力を飛躍的に向上させた基盤モデルである「Inflection-2.5」をInflectionが発表しました。

Inflection-2.5: meet the world's best personal AI
https://inflection.ai/inflection-2-5

PiはAndroidiOSのスマートフォン、ブラウザなどを通じて会話する事が可能なAIで、日本語にも対応しています。


Inflectionによると、Piはデイリーアクティブユーザー数100万人、月間アクティブユーザー数400万人の利用者を抱えているとのこと。また、平均会話時間は33分で、10人に1人は1時間以上話し込んだり、使ったユーザーの60%は翌週にまたPiを使っていたりと、利用者の満足度の指標で競合サービスより高いスコアを出しています。


Piの人気を支えているのが、Piに搭載されている基盤モデルのInflection-2.5です。Inflection-2.5はトレーニングに費やされたコンピューティング量がGPT-4の40%、前モデルであるInflection-1に至ってはGPT-4の4%しかないにもかかわらず、マルチタスク性能を測定するMMLU(Massive Multi-task Language Understanding)や大学院レベルの知識を要求するGoogleのベンチマークGPQA(Baselines and analysis for the Google-proof Q&A)の最高位のデータセットであるDiamondでGPT-4に匹敵するスコアを示しました。


Inflection-2.5は、AIの数的処理の能力を推し量るのに使われるハンガリーの数学試験(Hungarian Math)や、北米で使われる共通試験「GRE」の物理学問題(Physics GRE)といったSTEM分野でも強みを見せています。


Inflection-2.5は理数の分野だけでなく、コーディングでも優れた成績を収めており、コーディングベンチマークであるMBPP+とHumanEval+ではInflection-1からスコアが大幅に改善されました。


これらのベンチマークスコアをInflection-1(黄緑色)、Inflection-2.5(緑色)、GPT-4(灰色)の棒グラフで比較すると以下のようになります。


Inflectionは「つまり、Inflection-2.5はPiのユニークで親しみやすい性格と並外れた安全基準を維持しながら、全体的にさらに有用なモデルになりました」と述べました。

この記事のタイトルとURLをコピーする

・関連記事
GPT-4超えをアピールするClaude-3がAIで初めてIQ100超えを達成したという報告 - GIGAZINE

ビル・ゲイツが「AIがパーソナルアシスタントとなる未来」について語る - GIGAZINE

OpenAIやGoogleなど大手AI開発企業が「AI生成コンテンツに透かしを入れる」などAIの安全性強化に取り組むことを発表 - GIGAZINE

「OpenAIやMetaのAIモデルを独立した研究者が調査する権利」の保護を求める公開書簡に250人を超えるトップAI研究者らが署名 - GIGAZINE

AIで職を失う危機が迫る中で「過去に本当に滅んだ職業」を確認してみた - GIGAZINE

GPT-4超えをアピールするClaude-3がAIで初めてIQ100超えを達成したという報告 - GIGAZINE

in ソフトウェア, Posted by log1l_ks

You can read the machine translated English article here.