GPT vs Claude

OpenAI与Anthropic两大模型系列深度对比

系列对比概览

特点：生态完善、多模态领先、工具链丰富

特点：安全对齐、长上下文、代码能力强

对比项	GPT-4o	Claude 3.5 Sonnet	胜出
MMLU	88.7%	88.3%	GPT-4o
HumanEval	90.2%	92.0%	Claude 3.5
GSM8K	95.3%	96.4%	Claude 3.5
MATH	76.6%	71.1%	GPT-4o
上下文长度	128K	200K	Claude 3.5
输入价格	$2.50	$3.00	GPT-4o
输出价格	$10.00	$15.00	GPT-4o
多模态	文/图/音/视频	文/图	GPT-4o
Chatbot Arena	1287 Elo	1271 Elo	GPT-4o

* 价格单位为美元/百万tokens

Claude 3.5 Sonnet在编程方面有明显优势，尤其在复杂代码生成和SWE-bench上表现突出。

胜出：Claude 3.5 Sonnet

GPT-4o支持文本、图像、音频、视频四种模态，Claude仅支持文本和图像。

胜出：GPT-4o

Claude提供200K上下文，且在长文本理解上表现更稳定。

胜出：Claude 3.5 Sonnet

GPT-4o响应速度较快，Claude 3.5速度中等。

胜出：GPT-4o

Claude采用宪法AI，安全性和可控性更强。

胜出：Claude

GPT拥有最完善的API生态、插件系统和工具链。

胜出：GPT

选择GPT-4o的场景

选择Claude 3.5 Sonnet的场景

----