米Metaは、画像や動画に特化した新たなAIモデル「Mango(マンゴー)」を開発中であることが明らかになった。これは、GoogleやOpenAIといった競合に対抗する狙いで進められているプロジェクトで、特に視覚情報を扱うマルチモーダルAI分野での存在感強化を目的としている。米Wall Street Journalの報道によれば、Metaはこの分野を次世代AI競争の中核と位置づけている。

Metaはこれまで、プログラミングやコード生成を主眼としたクローズドモデル「Avocado」を開発してきたが、Mangoでは戦略を転換。画像生成や動画理解・生成といった領域に重点を置き、現在市場をリードするGoogleの視覚AIや、OpenAIのChatGPTが提供する画像機能に正面から挑む構えだ。

MetaのAIディレクターであるAlexandr Wang氏と、最高製品責任者(CPO)のChris Cox氏は、MangoとAvocadoの両モデルを2026年前半にリリース予定であるとコメントしている。これらは、2025年7月に設立が発表された新組織「Meta Superintelligence Labs(MSL)」から初めて投入される主要プロダクトとなる。MSLは、社内に分散していたAI研究開発を集約し、開発スピードと競争力を高めるための中核拠点だ。

Mangoの登場により、MetaはGoogleの動画生成AI「Veo」などのビジュアル系AIや、進化を続けるChatGPTの画像生成機能と競合する立場となる。画像・動画を理解し、生成・編集できるAIへの需要は急速に高まっており、Metaはこの成長市場で主導権を握りたい考えだ。

また、この記事はMetaの経営戦略の変化にも触れている。近年注力してきたメタバース関連投資を抑制し、その分のリソースをAI開発へと振り向ける方針を示しており、視覚AIを含む高度なマルチモーダルAIこそが、より現実的で即効性のある成長分野だと判断していることがうかがえる。MetaはMangoを通じて、次のAI時代における主役の座を狙っている。