最近のAI業界では、2022年11月30日にOpenAIによってリリースされた無料の自動言語処理ツール「ChatGPT」が大流行しています。その新しいAI駆動のチャットボットは、どのトピックに関しても、その分野の専門家よりも速く、人間のように回答します。

そして先月末、Googleは、文章の説明からあらゆるジャンルの音楽を作成出来るAI主導のソフトウェア「MusicLM」に関する研究を公開しました。さらに、その生成的なAIシステムは、説明に記載されている音楽スタイルに従って、鼻歌や口笛を歌に変換することも出来ます。

AI音楽や楽曲ジェネレーターは新しいものではなく、Amper Music、AIVA、Soundraw、Amadeus Code、そしてOpenAIのJukebox等が既に存在しています。しかし、MusicLMのシステムは”500万のオーディオクリップを含む、28万時間分の音楽に相当する膨大なデータセット”にアクセス出来るおかげで、既存のソフトウェアよりもバラエティに富んだ優れた音楽を提供出来るようです。

Googleは、このAI音楽ジェネレーターをリリースする予定はありませんが、MusicCapsをリリースすることで将来の研究をサポートすることを目指しています。MusicCapsは、ミュージシャンから提供された約5500個の”音楽とテキストの組み合わせ”からなる独自の厳選された高品質のデータセットです。Googleの研究者は、MusicCapsを使用して”彼らのメソッドが基準値よりも優れている”ことを実証しました。この研究チームは、ボットによって生成された音楽の品質を向上させるには、「イントロ、詩、コーラスといった曲構造の高レベルのモデリング」を含め、長い道のりがあることを認めています。

今回の論文の著者は、このAIシステムのリスクに関して「文化的な偏りが生じる可能性や、オリジナル楽曲の著作権侵害の恐れがある」とも説明しています。

この記事は、編集部が日本向けに翻訳・編集したものです。

原文はこちら