GoogleがGeminiに動画生成AI機能を実装、8秒のハイクオリティ動画をテキストから生成可能に
スポンサーリンク
記事の要約
- GoogleがGeminiに動画生成機能Veo 2を搭載
- Gemini Advancedで8秒の720p動画を生成可能
- Google One AI Premiumユーザー向けに順次展開
スポンサーリンク
GoogleがGeminiに動画生成AIを実装、高品質な動画制作が可能に
米Googleは2025年4月15日、同社の生成AIアプリ「Gemini」に動画生成機能「Veo 2」を搭載したと発表した。Veo 2はリアルな物理演算と人の動きの理解に優れており、より自然な動きと細部の表現が可能な最新の動画生成モデルとなっている。[1]
Gemini Advanced上でVeo 2を選択することで、テキストプロンプトから8秒間の720p解像度の動画を16:9のMP4形式で生成できるようになった。生成された動画はTikTokやYouTube Shortsなどのプラットフォームへの共有も容易で、クリエイターの表現の幅を大きく広げることが期待される。
Googleは安全性への取り組みとして、ポリシーに違反するコンテンツの生成を防ぐための評価やレッドチーミングを実施している。また、生成されたすべての動画にはAI生成コンテンツであることを示すデジタルウォーターマーク「SynthID」が各フレームに埋め込まれる仕組みを採用した。
Gemini新機能の概要
動画生成機能 | Whisk Animate | |
---|---|---|
特徴 | テキストから動画を生成 | 画像から動画を生成 |
品質 | 720p解像度/8秒 | 8秒の動画 |
対象ユーザー | Gemini Advanced | Google One AI Premium |
提供状況 | グローバル展開中 | 60か国以上で提供 |
スポンサーリンク
生成AIについて
生成AIとは、機械学習技術を用いてテキストや画像、音声、動画などの新しいコンテンツを自動的に生成する人工知能システムのことを指す。主な特徴として以下のような点が挙げられる。
- 既存のデータから学習し新しいコンテンツを生成可能
- 自然言語処理による高度な文章生成
- 画像・動画などのマルチモーダル生成に対応
Geminiの動画生成機能では、テキストプロンプトから高品質な動画を生成することが可能となった。AIによる動画生成技術は、物理演算や人の動きの理解、細部の表現力が向上しており、より自然でリアルな映像表現を実現できるようになっている。
Geminiの動画生成機能に関する考察
Geminiに搭載された動画生成機能は、クリエイターの創作活動に革新的な可能性をもたらすものとなっている。従来は専門的なスキルや高価な機材が必要だった動画制作が、テキストプロンプトを入力するだけで実現できるようになり、表現手段としての動画の民主化が進むだろう。
一方で、AIによる動画生成技術の発展は、フェイクニュースやディープフェイクなどの悪用リスクも高めることが懸念される。SynthIDのような技術的対策と並行して、メディアリテラシーの向上やAI生成コンテンツの適切な使用に関するガイドラインの整備が必要となるだろう。
今後は、生成される動画の長さや解像度の向上、より複雑なシーンの表現、音声との連携など、技術的な進化が期待される。同時に、著作権や肖像権などの法的課題への対応も重要になってくるため、技術と制度の両面からの発展が求められる。
参考サイト
- ^ The Keyword Google. 「Try generating video in Gemini, powered by Veo 2」. https://blog.google/products/gemini/video-generation/, (参照 25-04-18). 4961
- Google. https://blog.google/intl/ja-jp/
※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。
- OpenAIが最新推論モデルo3とo4-miniを発表、長時間思考型AIで複雑な問題解決能力が向上
- NotionがAIメールアプリ「Notionメール」を無料で一般提供開始、自動整理機能でメール管理の効率化を実現
- AnthropicがClaudeにGoogle Workspace連携とリサーチ機能を追加、企業の意思決定支援を強化
- CVE Foundationが新設され脆弱性管理プログラムの独立性が強化、グローバルなセキュリティインフラの安定化へ
- AppleがiOS 18.4.1で重大なセキュリティ修正を実施、標的型攻撃に使用された可能性のある脆弱性に対処
- Google Chromeの安定版チャネルがアップデート、重大な脆弱性に対応しセキュリティ強化へ
- Visual Studio 17.14 Preview 3がGitHub Copilotの機能を強化、AIモデル選択とコード編集機能が大幅に向上
- Azure OpenAIが新音声モデル3種をプレビュー公開、高精度な音声認識と合成機能を提供開始
- MicrosoftのAzure OpenAI ServiceがDoD IL6認証を取得し米国政府の全データ分類レベルでの利用が可能に
スポンサーリンク