テキサス州は、採点プロセスを合理化し、年間数百万ドルを節約することを目的として、テキサス州学力試験(STAAR)の筆記部分の採点に人工知能(AI)を導入する。2023年に導入される改訂試験では、多肢選択式問題よりも自由記述式問題が重視され、その結果、記述式問題が大幅に増加する。
AI採点への移行はコスト削減が動機となっており、テキサス州教育庁(TEA)は、第三者請負業者から人間の採点者を雇う場合と比較して、年間最大2,000万ドルの節約の可能性があると見積もっている。機械が人間の採点者に完全に取って代わるわけではないが、一時的に必要とされる採点者の数は、約6,000人から2,000人以下に激減した。
AI採点エンジンは、過去に採点された3,000の回答のデータセットで訓練された自然言語処理を利用して回答を評価する。しかし、回答の一部(約4分の1)は、人間の採点者によって再評価されます。特に、英語以外の回答やスラングを含む回答など、AIにとって難しいと判断された回答は再評価されます。
TEAのクリス・ロズニック評価開発部長は、AIシステムは自律的な能力を持っておらず、各回答から「学習」するわけではないと強調した。その代わり、人間と同じように一貫した採点を行うために、最初の訓練に頼っている。AIが統合されたとはいえ、採点の正確性と公平性を確保するため、厳格な品質管理プロセスが実施されている。
AI採点へのシフトは、評価の実施方法における顕著な変化を示すものであり、教育評価におけるテクノロジーの利点を強調する一方で、プロセスにおける人間の監督と専門知識の重要な役割を依然として認識している。