Metaの新ジェネレーティブAI『CM3leon』

テクノロジー///
  1. ホーム
  2. テクノロジー
  3. Metaの新ジェネレーティブAI『CM3leon』

ロジウラデザイン」はMeta の新ジェネレーティブAI「CM3leon(カメレオン)」に関する記事を公開しました。

Meta の新しい最先端の多用途画像モデルは、ライセンスされたデータのみでトレーニングされています

最新の技術によって、画像とテキストの相互作用が進化し続けています。その中でも、FacebookやInstagramといったSNSを開発するMetaの人工知能(AI)研究所であるMeta AIが、テキストから画像を生成したり、画像からテキストを生成したりすることができる単一のAIモデル「CM3leon(カメレオン)」を発表しました。Meta の新しい最先端の多用途画像モデルであるCM3leonは、注目に値する存在です。

Introducing CM3leon, a first-of-its-kind multimodal model that achieves state-of-the-art performance for text-to-image generation with 5x the compute efficiency of competitive models.

MetaAI

最近のテキストから画像への変換技術は、拡散モデル(拡散=diffusion、Stable Diffusionの名前の由来)を使って画像を生成しており、CM3leon は、トークンベースの自己回帰モデルという異なるものを使用しています。CM3leonは、テキストと画像の両方を理解して生成できるため、多くのタスクに役立ちます。

画像とテキストの理解と生成が可能なCM3leon

最新の画像モデルであるMetaのCM3leonは、テキストと画像の両方を理解し、生成することができます。このモデルは、テキストの説明から画像を生成したり、画像に基づいてテキストを生成したりすることができるため、さまざまなタスクに非常に役立ちます。

我々は、画像キャプション生成、視覚的質問応答、テキストベースの編集、条件付き画像生成などの様々なタスクにおいて、命令チューニングがマルチモーダルモデルのパフォーマンスを顕著に増幅することを発見した。

Meta の研究論文)

この、「テキスト」と「画像」の双方向への変換が可能であるモデルは、現在のところ、このCM3leonだけであり、更にCM3leonは、テキストのみの言語モデルを応用したレシピで学習させた最初のマルチモーダルモデルでもあるという。

詳細については以下URLからご確認ください

 

記事URL

https://rojiuradesign.com/cm3leon-meta-latest-image-model/

※ 本サイトに記載された商品・サービス名は各社の商標です。