Qwen-72B

通义千问旗舰级开源模型

模型概述

Qwen-72B是通义千问系列的旗舰版本,720亿参数,在多项基准测试中表现接近GPT-4, 是开源模型中的顶级选手。

72B
参数量
32K
上下文
3.4T
训练tokens
GQA
注意力机制

性能表现

基准Qwen-72BLLaMA 2 70BGPT-4
MMLU77.469.886.4
C-Eval83.3--
HumanEval65.229.987.1
GSM8K78.956.892.0
MATH35.218.752.9

核心能力

中文理解

C-Eval等中文基准领先

代码生成

HumanEval得分超LLaMA 2一倍

数学推理

GSM8K和MATH表现出色

长文本处理

32K上下文支持长文档

部署需求

# 显存需求
FP16: ~144GB (需要2张A100-80G)
INT8: ~72GB (1张A100-80G)
INT4: ~40GB (1张A100-40G)

应用建议

企业级应用

客服、知识库、文档处理

代码助手

代码生成、补全、解释

学术研究

论文阅读、数据分析

微调基座

垂直领域微调

----