DeepSeek 通过新模型彻底改变 AI - OpenAI 竞赛!

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

中国初创公司 DeepSeek 推出了新的人工智能模型,其性能优于美国竞争对手,并展示了创新的推理能力。

DeepSeek 通过新模型彻底改变 AI - OpenAI 竞赛!

2025年5月29日,中国初创公司DeepSeek为其R1推理模型发布了新的FOCUS。 R1-0528模型已在开发者平台Hugging Face上展示,但没有正式发布。有关模型本身的详细信息,包括它与其他人工智能模型的比较,尚未发布。在目前的LiveCodeBench排名中,DeepSeek的R1推理模型在代码生成方面排名第三,仅次于OpenAI的o4 mini和o3模型。

据报道,DeepSeek 的 R1 模型也优于其竞争对手,包括 xAI 的 Grok 3 mini 和阿里巴巴的 Qwen 3。 DeepSeek 的一位代表在微信群中表示,该模型的“小测试升级”目前正在进行中。尽管人们普遍认为美国的出口管制阻碍了中国人工智能研究的进展,但 DeepSeek 强调,其新发布的人工智能模型与美国的模型相当甚至优于美国的模型,而且成本更低。

与科技行业的相关性

1月份R1车型的推出也导致中国以外的科技股下跌。此后,阿里巴巴和腾讯等中国主要公司发布了 700 个新模型,据称这些模型的性能优于 DeepSeek。在这种竞争格局中,谷歌的应对措施是为其 Gemini 模型引入折扣访问级别。 OpenAI 还降低了服务价格,并推出了需要更少计算能力的 o3 Mini 模型。

DeepSeek 已经计划推出其后继模型 R2,该模型原定于 2025 年 5 月发布。该公司已于今年 3 月推出了其大型语言模型 V3 的升级版。

创新的人工智能模型

除了R1模型之外,DeepSeek还推出了两款新的AI模型:DeepSeek-R1-Zero和DeepSeek-R1。 R1-Zero 模型专门使用强化学习 (RL) 进行训练,不依赖监督数据。这表明人工智能模型可以在没有人类输入的情况下发展推理能力。

DeepSeek R1 模型利用初始数据,在数学、编程和推理方面实现了与 OpenAI 模型相当的性能。 DeepSeek 还发布了六个更紧凑的模型,它们通过蒸馏继承了较大模型的知识。其中,32B模型在各项基准测试中均优于OpenAI-o1-mini。

DeepSeek 的所有新模型都是开源的,可以通过 DeepSeek 平台或本地使用,使该技术更容易访问。

欲了解更多信息,请访问 路透社 或者 不来梅港市