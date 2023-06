・関連記事

ChatGPTなどの対話型AIの基礎となっている「Attention」を可視化した「Attention Viz」 - GIGAZINE



大規模言語モデルの開発者が知っておくと役立つさまざまな数字 - GIGAZINE



GPT-4やPaLMなどの大規模言語モデルは規模が大きくなると突然予想外の能力を開花させることがある - GIGAZINE



GPUメモリが小さくてもパラメーター数が大きい言語モデルをトレーニング可能になる手法「QLoRA」が登場、一体どんな手法なのか? - GIGAZINE



オープンソースの大規模言語モデル開発プロジェクト「RedPajama」が最初のモデル「RedPajama-INCITE」をリリース、無料で商用利用も可能 - GIGAZINE



「GPT-3」などの最新言語モデルが自然に他者の心を推察する能力である「心の理論」を獲得していたという研究論文 - GIGAZINE



Microsoftが発表したGPT-4の論文には数多くのコメントアウトされた内容が残されていた - GIGAZINE

2023年06月04日 19時10分00秒 in ソフトウェア, Posted by log1d_ts

You can read the machine translated English article here.