GoogleがVeo、Imagen3、Music AI Sandboxを発表、高品質な動画・画像生成と音楽制作ツールで創造性を開拓
スポンサーリンク
Veo、Imagen 3、Music AI Sandboxに関する記事の要約
- GoogleがVeoとImagen 3、Music AI Sandboxを発表
- Veoは高品質の1080p動画生成モデル、Imagen 3は最高品質のテキスト画像生成モデル
- Music AI SandboxはWyclef Jean、Justin Tranter、Marc Rebilletとのコラボで新デモを公開
- 生成されたコンテンツにSynthIDによるデジタル透かしを埋め込み、責任ある開発と展開を推進
スポンサーリンク
GoogleがVeo動画生成モデルの限定プレビューを開始
Googleは2024年5月14日、高品質の1080p動画を生成できる最新モデル「Veo」を発表した。Veoは自然言語と視覚的意味の高度な理解により、ユーザーのクリエイティブなビジョンを忠実に再現する。映画的な用語の理解や、一貫性のある現実的な動きの表現が可能だ。[1]
Veoの性能を引き出すため、GoogleはDonald Gloverら様々な映画製作者やクリエイターを招いて実験を行っている。これらのコラボレーションは技術の設計や構築、展開の方法を改善し、クリエイターの声を開発に反映させるのにも役立つ。
Veoは、Generative Query Network(GQN)、DVD-GAN、Imagen-Video、Phenaki、WALT、VideoPoet、Lumiereなど、長年のジェネレーティブ動画モデル研究の集大成だ。アーキテクチャやスケーリング則、その他の新しい手法を組み合わせ、品質と出力解像度を向上させている。
最高品質のテキスト画像生成モデル「Imagen 3」発表
Googleは、昨年の間に画像生成モデルとツールの品質と忠実度を驚くほど向上させた。Imagen 3は同社の最高品質のテキスト画像生成モデルだ。以前のモデルよりも視覚的なアーティファクトが大幅に少なく、写真のようにリアルで生き生きとした画像を生成する。
Imagen 3は自然言語やプロンプトの意図をより深く理解し、長いプロンプトの小さな詳細も取り入れられる。高度な理解力により、さまざまなスタイルをマスターしており、画像生成モデルにとって課題であったテキストのレンダリングもImagen 3は最高の性能を発揮する。
Imagen 3は本日からImageFXで一部のクリエイターに限定公開され、近日中にVertex AIでも利用可能になる。これにより、パーソナライズされたバースデーメッセージやプレゼンテーションのタイトルスライドなどを生成できるようになるだろう。
スポンサーリンク
音楽業界とコラボしたMusic AI Sandboxの新デモを公開
GoogleはYouTubeと提携し、音楽家やソングライター、プロデューサーとコラボレーションを続けている。アートや音楽制作におけるAIの役割を探求し、Lyriaなどの生成音楽技術の開発にも生かされており、この一環としてMusic AI Sandboxと呼ばれる一連の音楽AI toolsを開発中だ。
Music AI Sandboxは、ゼロからの新しい楽器セクションの作成や斬新な方法でのサウンド変換など、クリエイティビティの新しい遊び場を開くことを目指している。グラミー受賞者のWyclef Jean、ノミネート経験のあるソングライターのJustin Tranter、電子音楽家のMarc Rebilletが、このツールを使って制作した新しいデモ録音をYouTubeチャンネルでリリースした。
これらのコラボレーションは、音楽制作プロセスにおける人工知能のエキサイティングな役割を調査するためのものだ。各デモはアーティストのYouTubeチャンネルで視聴可能で、Music AI Sandboxを使った初のリリースとなっている。
考察
GoogleのVeoやImagen3の発表は、ジェネレーティブAIの可能性を大きく広げるものだ。高品質な動画や画像をテキストから生成できるようになれば、映画制作やデザイン、マーケティングなど様々な分野に革新をもたらすだろう。一方で、悪用による偽情報の拡散やプライバシー侵害などの懸念もあり、技術の進歩に伴う倫理的・法的課題への対応が欠かせない。
Music AI Sandboxのようなツールは、音楽制作の民主化と多様化を促す可能性がある。プロのミュージシャンだけでなく、誰もが自由に音楽を作れる世界の実現に近づくかもしれない。ただし、AIによる音楽生成が進むと、人間のアーティストの独自性や存在意義が問われることになるため、機械との協働やすみ分けのあり方を模索する必要がある。
AIの活用が進むクリエイティブの世界では、人間の感性や創造性とアルゴリズムの処理能力をいかに融合させるかが問われている。単にAIを道具として使うだけでなく、人間らしさを最大限に引き出すパートナーとして活用する発想が求められる。芸術表現やコンテンツ制作の現場に、新たな才能と職種が生まれる可能性もあるだろう。
参考サイト
- ^ Google The Keyword. 「Google I/O 2024: Introducing Veo and Imagen 3 generative AI tools」. https://blog.google/technology/ai/google-generative-ai-veo-imagen-3/, (参照 24-05-28).
- Google. https://blog.google/intl/ja-jp/
※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。
- 2段階定額制とは?意味をわかりやすく簡単に解説
- FTサーバ(Fault Tolerant Server)とは?意味をわかりやすく簡単に解説
- GPT-4とは?意味をわかりやすく簡単に解説
- HULFTとは?意味をわかりやすく簡単に解説
- 3Dプリンタとは?意味をわかりやすく簡単に解説
- GPGPUとは?意味をわかりやすく簡単に解説
- Goクエリとは?意味をわかりやすく簡単に解説
- ICANN(Internet Corporation for Assigned Names and Numbers)とは?意味をわかりやすく簡単に解説
- Hailoとは?意味をわかりやすく簡単に解説
- GDDR6とは?意味をわかりやすく簡単に解説
- Microsoft CopilotがBuild 2024で新機能を発表、ビジネス価値の創出を加速
- Windows 11 version 24H2がリリースプレビューに登場、新機能とCopilotアプリ化で利便性向上
- Windows Copilot RuntimeでAI開発が加速、Microsoftが新たなプラットフォームと開発ツール群を発表
- EmEditor v24.2.0リリース、AI機能とセキュリティが強化されユーザビリティが向上
- ChatGPTにデータ分析機能が強化、Google DriveやOneDriveとの連携でインタラクティブ分析が可能に
- Chrome DevToolsにAIを活用したエラー・ワーニングの説明機能が追加、ウェブ開発の生産性向上に期待
- Google WorkspaceアップデートでドライブとGeminiが進化、管理性と言語サポートが向上
- SofTalk ver2.00.00リリース、独自エンジンでUTAU音源に対応し操作性も向上
- Windows 11にAIプラットフォーム「Copilot+ PCs」登場、高度なAIワークロードに対応
- 最新Surface ProとLaptopが登場、AIで進化するWindowsの新時代が幕開け
スポンサーリンク