PIXTA、人物実写と生成AIを比較できる「機械学習用データセット」を販売開始

ピクスタ株式会社は、人物の実写画像と生成AI画像を比較可能な「人物実写・生成AI比較画像データセット」の販売開始を発表した。
日本人を中心とした人物画像1,000点を収録し、機械学習用途での商用利用に対応する。
人物実写と生成AI画像1,000点の比較データを提供
2025年12月23日、ピクスタ株式会社は、同社が運営する素材マーケットプレイス「PIXTA」を通じて、機械学習向けの新商品「人物実写・生成AI比較画像データセット」の販売を開始したと発表した。
価格は9万9,000円(税込)で、法人や研究機関を主な対象とする。
本データセットは、人物の実写画像500点と生成AI画像500点の計1,000点で構成される。
内訳は、単独人物の実写300点、単独人物の生成300点、複数人物の実写200点、複数人物の生成200点となっている。
年齢層、性別、背景、撮影条件、行動やポーズなどにおいて、可能な範囲で幅広いバリエーションを含む。
実写画像は日本人の人物写真を使用し、生成AI画像は日本人の実写風表現を選定した。
いずれも商用利用が可能で、撮影者からは機械学習用途での利用許諾を取得している。
購入は専用の問い合わせ窓口を通じて行い、人物属性などのアノテーション(※)は有料オプションとして提供される。
※アノテーション:画像や動画に対して、人物、年齢層、性別、位置情報などのラベル情報を付与する作業。機械学習モデルの学習や精度評価に用いられる。
偽画像対策やeKYC用途での活用が期待される一方、拡張性が課題に
本データセットは、実写画像と生成AI画像を同一条件で比較できる点が特徴である。
偽画像・偽映像の検知モデル開発では、両者の差異を学習させる必要があり、単独人物と複数人物の両シーンを含む構成は、実運用に近い検証環境を整える利点があると考えられる。
また、オンライン本人確認(eKYC)における不正対策では、生成画像の混入や顔のすり替えを防ぐ識別精度が課題とされてきたが、日本人・アジア人の顔の特徴を反映した画像で学習できる点は、国内向けサービスの品質向上につながる可能性がある。
人物検出や属性推定、画像分類といった基盤的な画像認識タスクへの応用も想定できる。
一方で、収録点数は1,000点規模にとどまるため、大規模モデルの事前学習用途としては制約も残ると言える。
用途別やシーン別に細分化されたデータ拡充、継続的なアップデートが行われるかが今後の焦点となるだろう。
PIXTAが持つ大規模素材基盤を活かし、どこまで継続的なデータ提供体制を構築できるか、引き続き注目したい。
関連記事:
サイバーエージェントが「AI SCREAM」にNano Banana Pro実装 広告用画像生成の精度向上へ












