ソフトウェア

Mistral AIがコード生成特化型AI「Codestral Mamba」をオープンソースライセンスでリリース


MetaとGoogle DeepMindの元従業員が立ち上げたAI開発企業のMistral AIが、コーディング用AIモデル「Codestral Mamba」を発表しました。オープンソースライセンスでのリリースであり、商用利用が可能となっています。

Codestral Mamba | Mistral AI | Frontier AI in your hands
https://mistral.ai/news/codestral-mamba/


Mistral AIは2024年5月に初のコーディング用生成AIモデルとして「Codestral」をリリースしていましたが、Codestralは商用利用が禁止されていました。

Mistral AIが初のコーディング用生成AIモデル「Codestral」をリリース、80以上のプログラミング言語でトレーニング済み - GIGAZINE


今回リリースされたCodestral Mambaは従来のモデルで広く使用されているTransformerアーキテクチャではなく「Mambaアーキテクチャ」が採用されており、シーケンス長に対して処理時間が線形で、長いシーケンスに対しても高速に処理することができたり、シーケンス長に制限がなかったりするなどの特徴があるとのこと。

ベンチマークの結果は下図の通り。Codestral Mambaはパラメーター数が70億(7B)で、同等サイズのモデルの中では最上位クラスの性能を発揮していることが分かります。220億(22B)パラメーターのCodestralモデルには全体的に性能で負けているものの、一部の指標では上回るなどMambaアーキテクチャのポテンシャルの高さを見せつけました。


Mistral AIのチームはCodestral Mambaのコンテキスト内検索機能を25万6000トークンまでテストしており、ローカルで動作するコードアシスタントとして優れた性能を発揮できることを期待しているとのこと。

Codestral MambaモデルはHugging Faceからダウンロードできるほか、Mistralの公式ライブラリであるMistral Inferenceから利用可能となっています。

この記事のタイトルとURLをコピーする

・関連記事
NVIDIAのCEOが「AIがコードを書くのでもうプログラミングを学ぶ必要はない」と発言して議論を巻き起こす - GIGAZINE

GPT-3.5ベースのChatGPTのコーディング能力は「古い問題には有効も新しい問題では困難に直面する」ことが明らかに - GIGAZINE

IBMが自社製AI「Granite」のコード生成モデルをオープンソース化、116のプログラミング言語でトレーニングされパラメータは30~340億 - GIGAZINE

「GitHub Copilotがコードを違法にコピーしている」と主張する開発者による訴訟の大部分を裁判所が棄却 - GIGAZINE

Slay the SpireをプレイできるAIを3時間で作成したエンジニアが構築方法を語る - GIGAZINE

in ソフトウェア, Posted by log1d_ts

You can read the machine translated English article here.