料理、お絵かき、物書きと同様、コーディングについても、どのようにアルゴリズムを設計するか、コードどうしをつなぎ合わせるかなどといった個人的な傾向があります。こうした好みは最終的には荒っぽい「署名」となります。今回研究者たちは、機械学習を使うことで匿名で書かれたコードであっても誰が書いたか特定可能とする研究を発表しました。
これはドレクセル大学でコンピュータ・サイエンス分野の准教授を務めるRachel Greenstadt氏と、元PhD課程の学生で現在ジョージ・ワシントン大学の助教であるAylin Caliskan氏による研究で、DefConハッキングエクスペリエンスでその成果を発表しました。
このAIは、コーディングの構造を学習するため、プログラマーが書いたコードの例を与えられます。そして、そのプログラマーのコードを見つけるべく自己訓練します。GoogleのCode Jamを用いて行ったテストでは、そのAIは83%の精度でそのプログラマーだと特定できました。
ハッキングのインスタンスを調べたり、本来は匿名であるべきマルウェアを誰が作ったかを特定したりといったことにこの技術を利用できます。コードがコピーされたと訴える際にも有効でしょう。
一方でプライバシーの問題もあります。ある理由で匿名性を維持したいプログラマーもいるでしょうし、人物を特定することは必ずしも良いことだとはいえません。
編集部が日本向けに翻訳編集したものです
原文はこちら