米AnlatanがNovelAIの初代画像生成モデル3種を無料公開、研究や個人利用目的で利用可能に

text: XEXEQ編集部
（記事は執筆時の情報に基づいており、現在では異なる場合があります）

記事の要約

AnlatanがNovelAIの初代モデルを無料公開
アニメ系とケモノ系の3種類のモデルを提供
非商用利用と二次創作が可能なライセンス

AnlatanがNovelAIの初代画像生成モデルを無料公開

米Anlatanは画像生成分野の進展に伴い研究や個人利用目的で同社の画像生成AIサービス「NovelAI」の初代モデルを無料公開した。公開されたのは「NovelAI Diffusion Anime V1（キュレート版）」「NovelAI Diffusion Anime V1（フル）」「NovelAI Diffusion Furry（ベータ V1.3）」の3種類のモデルウェイトだ。^[1]

キュレート版アニメモデルは少数の高画質画像でトレーニングされポップカルチャーの知識が豊富で画質に優れている。フルアニメモデルはより広範な画像でトレーニングされ柔軟性がある。さらに旧バージョンのFurryモデルも公開されており幅広い画像生成ニーズに対応している。

これらのモデルはCreativeML Open RAIL-MライセンスとクリエイティブコモンズBY-NC-SA 4.0ライセンスのデュアルライセンスで公開された。これにより適切な帰属と配布条件を満たせば非商用目的での利用再配布二次的著作物の作成が可能となっている。研究者や個人クリエイターにとって有用なリソースになるだろう。

NovelAI初代モデルの特徴まとめ

	Anime V1 (キュレート版)	Anime V1 (フル)	Furry (ベータ V1.3)
特徴	高画質・ポップカルチャー	広範な画像で柔軟性	ケモノ系特化
トレーニングデータ	少数の高画質画像	より広範な画像	ケモノ系画像
用途	高品質アニメ風画像	多様なアニメ風画像	ケモノ系キャラクター

CLIPについて

CLIPとは、Contrastive Language-Image Pretrainingの略で、OpenAIが開発した画像と自然言語を結びつける機械学習モデルのことを指している。主な特徴として以下のような点が挙げられる。

画像とテキストの関連性を学習
多様なタスクに転用可能
ゼロショット学習能力を持つ

NovelAIのモデルはCLIPのテキストエンコーダーの最後から2番目のレイヤーの出力を用いてトレーニングされている。このアプローチにより画像生成の精度と柔軟性が向上し多様なプロンプトに対応できるようになっている。CLIPの活用はNovelAIの画像生成能力の重要な要素となっているのだ。

NovelAI初代モデルの無料公開に関する考察

AnlatanによるNovelAIの初代モデル無料公開は画像生成AI技術の民主化という点で高く評価できる。研究者や個人クリエイターがこれらのモデルを自由に利用できることで新たな応用や改良が生まれる可能性が高まった。一方で著作権や倫理的な問題も懸念され適切な利用ガイドラインの策定が今後の課題となるだろう。

技術的な観点からは初代モデルの公開により最新モデルとの比較研究が可能になる点が興味深い。AIの進化の過程を追跡し改善点を明確にすることで今後の開発に活かせるはずだ。ただしオープンソース化によりモデルの悪用リスクも高まるため適切なセーフガードの実装が求められる。

長期的にはこうしたオープンな取り組みがAI業界全体の発展を加速させる可能性がある。AnlatanにはNovelAIの最新モデルの継続的な改良と並行して初期モデルの公開やコミュニティ支援を進めることで業界のリーダーシップを確立してほしい。ユーザーの創造性を引き出しつつ責任ある技術開発を両立させる姿勢が重要になるだろう。