Metaは,画像とテキスト処理のためのオープンソースのマルチモダルAIモデルLlama 3.2をリリースした.

MetaはLlama 3.2をリリースしました 画像とテキストを処理できる最初のオープンソースのマルチモダルAIモデルです 異なるハードウェアに設計された,11億と90億のパラメータを持つビジョンモデルと10億と30億のパラメータを持つ軽量テキストモデルが含まれています. Llama 3.2は,拡張現実や文書分析などの分野におけるAIアプリケーションを強化し,OpenAIやAnthropicのようなライバルに対して,画像認識タスクで競争力のあるパフォーマンスを提供することを目指しています.

September 25, 2024
10 記事