米メディアUbergizmoは、OpenAIが発表した最新のコード特化型AIエージェント「GPT-5.3-Codex」について報じた。本モデルは前世代のGPT-5.2-Codexよりも約25%高速化され、複数の主要ベンチマークで過去最高水準の成績を記録したという。特にソフトウェアエンジニアリング能力を測定する「SWE-bench Pro(Public)」では56.8%の正答率を達成。さらに、ターミナル操作能力を評価する「Terminal-Bench 2.0」では従来の64.0%から77.3%へと大幅に向上した。

また、デスクトップ環境での実務遂行能力を測る「OSWorld-Verified」では64.7%を記録し、人間平均72%に迫る結果を示した。前世代の38.2%から大きく改善しており、単なるコード補完ツールから、環境全体を横断してタスクを完遂する自律型エージェントへの進化がうかがえる。

新たに導入された「guidance(ガイダンス)」機能では、Codexアプリ内で開発者がリアルタイムにモデルへ介入し、複雑な処理中でも文脈を維持したまま対話や修正指示を行える。これにより、人間とAIの協働開発がよりスムーズになる設計だ。

インフラ面ではNVIDIAのGB200 NVL72システム上で学習・運用され、推論効率やトークン消費の最適化が図られている点も特徴。さらにOpenAIは本モデルを生物安全性およびサイバーセキュリティ分野で「高能力(High Capability)」に分類。ソフトウェア脆弱性検出にも特化しており、防御的研究向けに監視体制とアクセス管理を強化している。

今回のリリースは、従来の“コード補助”から“自律型エンジニアリングAI”への転換を象徴するものといえる。低遅延かつ多言語対応の強化により、プロフェッショナル向け開発ワークフローの中核を担う存在として注目されている。