単一画像から動画を生成する話題のAI「FramePack」、Mac対応フォーク版が登場

2025年4月29日、海外の開発者brandon929氏が、動画生成AI「FramePack」のMac対応フォーク版をGitHub上で公開したことが報じられた。ASCIIなどが取り上げている。
これにより、Apple Silicon搭載のMacユーザーも、ローカル環境で高精度な動画生成が可能となる。
従来はCUDA環境に限定されていた「FramePack」がMacに対応したことで、動画生成AIの裾野が広がるだろう。
CUDA不要の「FramePack for macOS」
動画生成AI「FramePack」は、もともと単一画像から高品質な動画を自動生成できるとして、NVIDIA GPUユーザーの間で注目を集めていたツールだ。
従来はNvidiaのCUDA(※1)対応環境での動作が前提とされており、Macユーザーにとっては使用が難しかった。
しかし今月、GitHubユーザーbrandon929氏により、Mac向けのフォーク版が登場したことで、その状況が一変した。
このMac対応版はAppleのMetal/MPS(※2)バックエンドを利用して動作するが、あくまでPyTorchのMPS対応を用いたものであり、最適化はされていないことに注意が必要だ。
それでも、M3 Ultra(192GBメモリ)を搭載したMacでは、1フレームあたり約2.5分の処理時間で稼働するという。
RTX4090環境と比較すると約10〜15倍の差があるものの、「MacBook一台で動画生成が可能になった」という事実は、Appleユーザーにとって極めて意義深い。
RedditやX(旧Twitter)では、実測データやテンションの高い報告が相次いで投稿されている。
反応はポジティブで、「処理速度よりもローカルで完結することが大事」と評価する声が目立つという。
※1 CUDA:
NVIDIA社が開発したGPU向けの並列計算プラットフォーム。高速な計算処理が可能だが、NVIDIA製GPUが必要。
※2 MPS(Metal Performance Shaders):
Appleが提供するGPUアクセラレーションフレームワーク。PyTorchではmacOS上でGPU処理を行うためにMPSを介してAppleが提供する低レベルのグラフィックス/計算向けAPIであるMetalを利用する。
拡がる可能性と向き合うべき制約
「FramePack for macOS」の出現は、Appleユーザーにとって新たな創作の道を拓いた。
一方で、現時点では多くの制約も存在している。
例えば、M1/M2チップでは「–fp32」オプションを明示的に指定しなければならず、bfloat16の不安定さから高いメモリ消費を余儀なくされる。
現実的には、M3 Ultraのような高性能Macでさえ、長時間のレンダリングが前提となる。
さらに、導入には一定の技術的リテラシーが要求される。
Windows版のような簡易インストーラーは用意されておらず、GitHubのリポジトリを読み解き、必要なパッケージを手動で整える必要がある。
今後、Metal対応のコードが公式にマージされれば、Mac環境での最適化や処理速度の向上も見込める。
Macを主な制作環境とするクリエイターにとって、「FramePack」のローカル動作は一つの転機となるだろう。
あとはこの小さな突破口が、どれほど大きな波となって広がるかに注目が集まる。