#swe-bench の記事
3 記事
-
Claude
Claude Opus 4.5 とは|Sonnet 4.5 比 76% 削減の性能を解説
Claude Opus 4.5 の性能と料金を解説。入力$5/出力$25 という Sonnet 級料金で Opus 4.1 比約67%値下げ、Effort 中設定なら Sonnet 4.5 同等精度をトークン76%削減で実現。Effort パラメータの使い分けとプロンプトキャッシュ・バッチ推論の活用方法も整理。
-
Claude
Claude Opus 4.1 / 4.5 / 4.6 / 4.7|性能・料金の比較
Claude Opus 4.1 / 4.5 / 4.7 を SWE-bench スコア・料金・速度・移行リスクの4軸で比較。自律エージェントには SWE-bench 87.6% の Opus 4.7、コスト削減なら入力 $5 の Opus 4.5、破壊的変更を避けるなら Opus 4.6 据え置きが現実解。
-
Claude
Claude Opus 4.1 とは|SWE-bench・料金・変更点を解説
Claude Opus 4.1 の変更点と料金・API 識別子の使い方を解説。Opus 4 と同価格(入力$15/出力$75 per 1M tokens)でマルチファイル refactoring と長文検索品質を強化、SWE-bench Verified 74.5%。本番で挙動を固定したい場合のスナップショット指定の判断基準も整理。