快科技1月27日消息,最近一周,中国的神秘AI公司、被称为AI界拼多多”的人工智能初创企业深度求索(DeepSeek)刷屏全球各大主流媒体和社交网站,尤其让美国AI科技圈极为震撼。
其最新发布的R1模型不仅在性能上比肩甚至超越了OpenAI的 o1,并完全开源,且以极低的成本实现了这一突破。
1月20日,极少露面的DeepSeek老板梁文锋首次亮相新闻联播,受邀参加座谈会并发言。同一天,DeepSeek在官微上,发布了DeepSeek-R1发布,性能对标OpenAI o1正式版,并同步开源模型权重。
按照官方说法,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。
DeepSeek-R1 API 服务定价为每百万输入tokens 1 元(缓存命中)/ 4元(缓存未命中),每百万输出tokens 16元。
对比OpenAI o1的 API定价:每百万输入tokens 15美元、每百万输出tokens 60美元。
也就是说,每百万输出定价,DeepSeek-R1大概仅为OpenAI o1的3.65%,拥有极高的性价比。
更让人惊讶的是,DeepSeek-V3在仅使用2048块H800 GPU的情况下,完成了6710亿参数模型的训练,成本仅为557.6万美元,远低于其他顶级模型的训练成本(如GPT-4的10亿美元)。
因此,一些人认为,DeepSeek可能会颠覆NVIDIA在AI硬件领域的主导地位。
1月24日,在国外大模型排名Arena上,DeepSeek-R1基准测试已经升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与OpenAI o1并列第一。
就在Arena放榜之后,全球关于DeepSeek的讨论再次升级。
NVIDIA的高级研究科学家Jim Fan(范麟熙)评价道:我们生活在这样一个时代:一家非美国公司正在让OpenAI的初衷得以延续真正开放、为所有人赋能的前沿研究。”
1月25日,NVIDA的老对手”AMD火速为DeepSeek站台”,宣布全新的DeepSeek-V3模型已集成至AMD InstinctGPU上。
美国私人投资基金Noahs Arc Capital Management认为,DeepSeek-V3模型的突破显著降低了AI培训成本,使AMD GPU成为比NVIDIA更具有成本效益的替代品,增强了AMD的市场地位。
那DeepSeek-R1为何让美国乃至全球的AI圈有如此大的反应?因为它突破了一个规则,一个由美国和OpenAI建立起的规则。
以往,全球AI的底层发展路线,是由OpenAI引领的,倡导大力出奇迹”,以规模制胜。但也种军备竞赛”的发展模式也将AI发展带入了一个怪圈,为追求更高的性能,大模型的体积只能不断膨胀,参数数量呈现指数级增长,同时带来了惊人的能源消耗和训练成本,一家公司想发展AI,就必须投入高昂的成本向NVIDIA买GPU训练,绝大多数公司根本难以为继。
但DeepSeek的诞生,让低成本、高性能AI成为了可能。大模型对算力投入的需求可能会从训练侧向推理侧倾斜,即未来对推理算力的需求将成为主要驱动力。而NVIDIA等硬件商的传统优势更多集中在训练侧,这可能会对其市场地位和战略布局产生影响。
要知道,前不久美国总统特朗普刚刚在白宫宣布,日本软银集团、美国开放人工智能研究中心和美国甲骨文公司三家企业将投资5000亿美元,用于在美国建设支持人工智能(AI)发展的基础设施。
美股大VTHE SHORT BEAR”在社交媒体上表示,DeepSeek创造了一个AI巨头们的痛苦时刻,根据红杉,美国AI公司每年必须产生约6000亿美元收入来支付其AI硬件费用。但现在看来,这种冒险行为变得越来越无利可图!
还有不少人把DeepSeek称为美国股市最大的威胁”,甚至把DeepSeek与近期NVIDIA的回调联系在一起。1月24日,NVIDIA股价大跌3.12%,创下公司在年初CES展产品不及预期表现后的最大跌幅。
更重要的是,DeepSeek来自中国!一家名不见经传的小公司”!
在美国每天发生的大量创新里,这是非常普通的一个。他们之所以惊讶,是因为这是一个中国公司,在以创新贡献者的身份,加入到他们游戏里去。毕竟大部分中国公司习惯 follow,而不是创新。” 梁文锋说。
他认为,中国AI不可能永远处在跟随的位置。我们经常说中国AI和美国有一两年差距,但真实的gap是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。
NVIDIA的领先,不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势,手里有路线图。中国 AI 的发展,同样需要这样的生态。
很多国产芯片发展不起来,也是因为缺乏配套的技术社区,只有第二手消息,所以中国必然需要有人站到技术的前沿。
0 条