广州日报讯 (全媒体记者 张露)近日,一家名为DeepSeek的中国AI企业异军突起,其自研的大模型 DeepSeek R1在多项国际评测中表现突出,受到国内外市场的关注。业内人士表示,DeepSeek的低成本、高性能以及开源模式,为中国AI产业的发展提供了新的思路和方向,中国AI产业正在加速发展。
1月24日,在国外大模型排名Arena上,DeepSeek R1基准测试已升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与OpenAI o1并列第一。
“DeepSeek爆火的原因主要可以归结为两点:性能和成本。”萨摩耶云科技集团首席经济学家郑磊告诉记者。DeepSeek解释称,R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。更值得关注的是,DeepSeek R1成本很低。DeepSeek的R1的预训练费用只有557.6万美元,仅是OpenAI GPT-4o模型训练成本的不到十分之一。
“DeepSeek以较低的成本实现了高性能的AI模型,这使得其在市场竞争中具备了显著的优势,这种成本效益比无疑会吸引大量企业和个人用户选择其产品和服务。”北京社科院副研究员王鹏表示,其高性能、低成本的AI模型在国际市场上取得了显著的优势,为中国在全球AI竞争中赢得了更多的话语权。