Meta(旧 Facebook)は、「Voicebox」と呼ばれる音声複製AIテクノロジーをリリースしないという決定で、最近注目を集めました。この画期的なAIモデルは、驚くべき精度で音声を複製及び模倣するという驚くべき能力を備えています。その優れた機能にも関わらず、Metaは、その誤用に伴う潜在的なリスクと危険性を理由にこの技術を一般公開しないことを選択しました。

Metaのプレスリリースでは、Voiceboxは幅広い用途を備えた強力なツールであると説明されています。オーディオ編集目的にも利用可能で、録音から不要なサウンドを除去することが出来ます。さらに、多言語音声生成機能を備えているため、メタバース内の仮想アシスタントやノンプレイヤーキャラクターに対して自然な音声を作成出来ます。Voiceboxは、書かれたメッセージを、友人の声を使って読み上げることも出来るので、視覚障害者の支援も目指しています。

しかし、Voiceboxを取り巻く興奮は、悪用の可能性についての懸念によって影が薄くなっています。Metaの開発者は、そのリリースによって生じる可能性のある危害を十分に認識しており、その公開よりも責任を優先しています。Metaの研究者らは声明の中で、AIの進歩を共有する際には微妙なバランスが必要であることを認め、予期せぬ結果を防ぐ必要性を強調しました。

Voiceboxは、ある人物の声の2秒間の短い音声サンプルからでも、その人の自然な声によく似た合成音声を生成することが可能である、という前提の上で動作します。これにより、悪意のある攻撃者が犯罪、政治、または個人的な目的でテクノロジーを利用する可能性が高まります。

詐欺師が親しい人や雇用主になりすますことで、信頼を損ない、疑いを持たない個人の脆弱性が利用されるため、それによって引き起こされる可能性のある大惨事は非常に憂慮されるべきことです(最近起きた事件はこちらからご覧下さい)。

MetaはVoiceboxに関する詳細な論文を発表し、その内部の仕組みや潜在的な緩和戦略についての洞察を提供していますが、このテクノロジーを一般公開しないという決定には、その潜在的な影響力に対する警戒が反映されています。同社は、オーディオ分野での共同開発やさらなる研究を促進することを目指していますが、そのような進歩を取り巻く不確実性と不安感があることも認識しています。

この記事は、編集部が日本向けに翻訳・編集したものです。

原文はこちら