2024年11月11日 12時00分ソフトウェア

完全にオープンで再現可能な大規模言語モデル「OpenCoder」がリリースされる

上海のAI企業「INF Technology」やオープンソースのAI研究コミュニティ「M-A-P」などに在籍する研究者のチームにより、最終モデルだけでなくトレーニングデータやデータ処理パイプラインなど、モデルを再現するのに必要な情報全てがオープンな大規模言語モデル「OpenCoder」が公開されました。

OpenCoder: Top-Tier Open Code Large Language Models
https://opencoder-llm.github.io/

大規模言語モデルについて「オープンなモデル」と言う場合、どの程度オープンなのかについてはさまざまです。モデルのアーキテクチャが公開されていて誰でも独自のデータで大規模言語モデルをトレーニングできる場合を「オープンソース」、トレーニング済みのモデルが公開されていて誰でも自分のローカルPCで実行できる場合を「オープンウェイト」、トレーニングに使用したデータが公開されていて誰でもトレーニングを再現できる場合を「オープンデータ」と言いますが、OpenCoderは全てを公開している「完全にオープンなモデル」です。