公開:

米AnlatanがNovelAI Diffusion V4 Fullを公開、最大6キャラクターの同時生成と構図制御機能を実装

text: XEXEQ編集部
(記事は執筆時の情報に基づいており、現在では異なる場合があります)


記事の要約

  • NovelAI Diffusion V4 Fullが正式公開、最大6キャラクターの同時生成が可能に
  • キャラクター同士の位置指定と構図制御機能を搭載
  • 自然言語プロンプトとテキストレンダリング機能を実装

NovelAI Diffusion V4 Fullが公開、高度な画像生成機能を実現

米Anlatanは2024年3月1日、アニメ・美少女イラストに特化した画像生成AIサービス「NovelAI Diffusion」の新バージョン「NovelAI Diffusion V4 Full」を公開した。約23万時間のNVIDIA H100 GPUコンピューティングリソースを活用して学習を行い、従来のV3と同等の処理速度を維持しながら高度な画像生成機能を実現している。[1]

NovelAI Diffusion V4 Fullでは、1つの画像に最大6人のキャラクターを同時に配置できる機能を実装し、各キャラクターのプロンプトを個別に指定することが可能になった。キャラクター同士の特徴が混ざり合う問題も解消され、画像の構図をより細かく制御できるようになっている。

さらに、自然言語によるプロンプト機能を最優先機能としてサポートし、英語の自然な文章での描写が可能になった。テキスト理解力が向上し、プロンプトの文脈サイズを512トークンに拡張したことで、より詳細な説明文による画像生成が実現できるようになっている。

NovelAI Diffusion V4 Fullの新機能まとめ

マルチキャラクター ポジション指定 アクションタグ
主な特徴 最大6キャラクターの同時生成 構図の細かい制御 キャラクター間の関係性制御
対応内容 個別プロンプト指定 自由な位置指定 行動の明確な指定

画像生成AIモデルについて

画像生成AIモデルとは、機械学習技術を用いて画像を生成する人工知能システムのことを指す。主な特徴として以下のような点が挙げられる。

  • テキストプロンプトから画像を自動生成する能力
  • 大規模なデータセットを活用した学習による高品質な出力
  • 特定のスタイルや表現に特化した画像生成が可能

NovelAI Diffusion V4 Fullでは、Flux VAEの採用とU-Netの細部表現機能の強化により、画像の鮮明さとプロンプトの忠実度が大幅に向上している。テキストレンダリング機能も改良され、吹き出し内のテキストや画像内の文字配置にも対応している。

参考サイト

  1. ^ Medium. 「NovelAI Diffusion V4 Full版、正式公開しました! - Anlatan - Medium」. https://blog.novelai.net/novelai-diffusion-v4-full%E7%89%88-%E6%AD%A3%E5%BC%8F%E5%85%AC%E9%96%8B%E3%81%97%E3%81%BE%E3%81%97%E3%81%9F-e1d9ba4057dd, (参照 25-03-05).
  2. NVIDIA. https://www.nvidia.com/ja-jp/

※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。

「AI」に関するコラム一覧「AI」に関するニュース一覧
アーカイブ一覧
AIに関する人気タグ
AIに関するカテゴリ
ブログに戻る

コメントを残す

コメントは公開前に承認される必要があることにご注意ください。