お知らせ: 酷似サイトにご注意ください

パナソニック、テキスト・画像・音を相互に変換可能なマルチモーダル生成AI開発

掲載日 2025/06/05 14:25

鍵アイコン

パナソニックホールディングス（以下、パナソニックHD）およびパナソニックR＆Dカンパニーオブアメリカは6月4日、カリフォルニア大学ロサンゼルス校（（以下、UCLA））の研究者らと共同で、テキスト、画像、音といった異なるデータ形式を自由に相互変換できる（以下、Any-to-Any）マルチモーダル生成AI「OmniFlow」を開発したと発表した。

OmniFlowによる生成例　引用：パナソニックホールディングス

マルチモーダルな生成AIが抱える課題

異なるデータ形式同士の変換を実現するマルチモーダルな生成AIは、学習データに通常、取り扱いたいデータ全てのペアを用意する必要がある。

しかし、テキスト、画像、音声がすべてそろったデータは入手方法が限られバリエーションを増やすにはコストがかかることが課題となっている。

この記事は
Members+会員の方のみ御覧いただけます

ログイン／無料会員登録

会員サービスの詳細はこちら

AIが勧める、あなたのための会員限定記事

アクセスランキング

ランキングをもっと見る

もっと見る

編集部が選ぶ関連記事

関連リンク

※本記事は掲載時点の情報であり、最新のものとは異なる場合があります。予めご了承ください。

新着記事

こちらも注目

このカテゴリーについて

サーバやストレージといった基本的な話題から、仮想化技術やクラウド、ビッグデータ、業務アプリケーションといった企業向けITの最新情報を紹介します。

	
		OSZAR »