GPT-5が出た。Claude 4との違いを整理する

GPT-5が公開された。OpenAIが「これまでのGPTシリーズで最も賢い」と位置づけるモデルで、Anthropicが昨年末にリリースしたClaude 4との比較が各所で始まっている。

結論を先に言う。どちらが優れているかではなく、何に使うかで選ぶべきモデルが変わる。この記事ではその分かれ目を整理する。

GPT-5が変えたのはどこか

GPT-5の最大の変化は、推論の深さだ。GPT-4oと比べると、曖昧な質問への対応が明らかに上手くなっている。「なんとなく書いてほしい」という雑な指示でも、意図を読んで形にしてくる。

もう一つ目立つのが、ツール呼び出しの精度。コードを書かせながら同時にウェブ検索させる、といった並列処理がスムーズになった。エージェント的な使い方をするなら、GPT-5の恩恵を受けやすい。

Claude 4の強みは、長い文脈を扱う安定感にある。10万トークンを超えるような長文ドキュメントを読み込んで要約・分析させる用途では、GPT-5と比べてもまだ一歩リードしている印象だ。

文章のトーンも違う。Claude 4が生成する文章は、どこか落ち着いていて読みやすい。ビジネス文書や丁寧な説明文を求めるときに向いている。GPT-5はどちらかと言えばテンポよく、情報量を詰め込む方向に振れている。

コーディング性能については、正直なところ甲乙つけがたい。どちらも実用的なレベルに達していて、普段のエンジニアリング業務なら大きな差は感じない。

GPT-5はChatGPT Plusのサブスクリプション（月20ドル）に含まれる形での提供が基本になっている。Claude 4はClaude.ai Proが月20ドルで、API利用の場合は別途従量課金となる。

単純に毎日使うだけなら、どちらかを契約すれば事足りる。両方に課金してシーンで使い分けるのが理想だが、費用対効果を考えると、まずメインの用途を決めてから選ぶのが現実的だ。

文章・ライティング寄りなら Claude 4、エージェント・検索連携を重視するなら GPT-5、というのが今のところの使い分けの基準になる。

ベンチマークのスコアは GPT-5 がわずかに上回るケースが多い。ただしベンチマークと実使用感は一致しないことの方が多い。

自分の仕事に引き寄せて考えると、どちらのモデルも「使い込んでプロンプトを磨いた側が勝つ」という状況は変わっていない。モデルを変えても、指示の仕方が変わらなければ結果は大して変わらない。