Claude Opus 4.7のReact習熟度をさっそく測る
Opus 4.7は平均75.4を記録し、これまで首位だったGPT-5.4(71.5)を抜いてベンチマーク首位に立ちました。 考察 4.6→4.7の変化で特筆すべきは、アクセシビリティのカテゴリ平均が2.46→3.38と大幅に伸びたことです。これまでのベンチマークでClaudeの弱点と目されてきた領域です。まだGPT-5.4(3.8)に追いついてはいませ...
みんなの反応
はてなブックマークでの反応
Opus 4.7は平均75.4を記録し、これまで首位だったGPT-5.4(71.5)を抜いてベンチマーク首位に立ちました。 考察 4.6→4.7の変化で特筆すべきは、アクセシビリティのカテゴリ平均が2.46→3.38と大幅に伸びたことです。これまでのベンチマークでClaudeの弱点と目されてきた領域です。まだGPT-5.4(3.8)に追いついてはいませ...