当前位置:首页 > 经济纵横 > DeepSeek成功的底层逻辑及产业影响

DeepSeek成功的底层逻辑及产业影响

2025年02月19日74580

  仿佛是一夜之间,DeepSeek迎来了“滔天的流量”。它不仅在全球引发了新一轮的AI应用热潮,而且给全球的算力资本市场带来了重大冲击。究其原因,DeepSeek不仅在训练成本及使用成本、模型训练及优化方式等领域实现了大量的工程创新,而且打破了AI领域许多的传统叙事逻辑。简而言之,DeepSeek正在改变游戏规则。

DeepSeek成功的底层逻辑及产业影响
图片来源于网络,如有侵权,请联系删除

  DeepSeek最新推理模型R1的横空出世,带来了一个非常大的惊喜,仅用6天就发展了1亿用户。“用好奇心来揭开AGI的神秘面纱”这一愿景,更增添了神秘色彩。那么,DeepSeek在技术上究竟有哪些创新,成功的背后有哪些深层次的原因?这一切将对中美下一个十年的科技竞争产生哪些影响?

DeepSeek成功的底层逻辑及产业影响
图片来源于网络,如有侵权,请联系删除

本图片为AI生成并进行了人为后期加工。 遥歌/制作

DeepSeek成功的底层逻辑及产业影响
图片来源于网络,如有侵权,请联系删除

工程创新

成就与众不同

  DeepSeek不仅引发了全球新一轮的AI应用热潮,而且对全球的算力资本市场产生重大冲击。究其原因,DeepSeek在训练成本及使用成本、模型训练及优化方式方面均实现了大量工程创新。

  成本是最大的亮点。DeepSeek-R1的整体训练成本比OpenAI少了一个数量级以上。R1在整个训练过程中的工程优化和创新亮点非常多,包括“Multi-Head Latent Attention——多头隐形注意力机制”“Multi-token predication——多token预测”“有选择性地使用8个浮点数精度FP8来替代FP16甚至FP31”等。这些优化其实都不容易实现。每一个看似不显著的优化,在层级叠加效应下却产生了非常惊人的效果。

  DeepSeek其实一共发布了两个模型,分别是R1和R1-zero。DeepSeek基于V3这个基础模型聚焦强化学习获得了R1-zero。但是,R1-zero在回答一些问题的时候容易产生包括“多语言混杂”在内的诸多问题。Deep-Seek又对这个模型进行了SFT(监督微调优化),从而产生了R1。R1的强化学习功能可以实现自动化,是比较容易去scale的。这样一来,该模型未来的想象空间接近无限。

  颠覆性改变

  打破传统叙事逻辑

  DeepSeek之所以备受关注,本质在于打破了很多AI领域的传统叙事逻辑,例如OpenAI对于推理模型的算力堆叠霸权逻辑、AI应用圈的OpenAI寡头垄断格局逻辑、美国对中国的高制程芯片封锁逻辑以及AI大模型的开源闭源逻辑……

  首先,AI圈公认这种推理模型的实现难度是极大的。此前,比较好的推理模型只有OpenAI的GPT o1。Anthropic做不出来,Google“卡”了很久才推出表现一般的Germini 2.0。DeepSeek-R1至少是o1的平替,甚至部分能力还要强于o1。进一步来看,R1不仅免费还开源,训练成本和使用成本均实现了指数级下降。原先o1凭借领先性可以“收割”相当长一段时间的价值,但DeepSeek-R1的出现以及开源的举措,让绝大多数开发者以及聚焦应用的创业公司都能够以更低的门槛去做开发。更加便宜且更容易私有化部署的R1,击碎了华尔街对于所有大模型公司的估值逻辑。

  其次,DeepSeek的出现打破了AI应用圈原有的竞争枷锁。就算是美国的顶尖应用公司选择DeepSeek和ChatGPT时,答案也很清楚。Cursor、Perplexity这些AI领域的超级明星应用,都第一时间进行了DeepSeek模型的部署,而且设置了推荐第一优先级。此外,Google、Amazon、NV等平台也都部署了Deep-Seek模型。这些改变,同步影响了云服务的市场格局。国内大量从事应用开发的企业,在DeepSeek-R1出现之前不得不使用微软云(为了便捷使用GPT-4的API);现在,使用阿里云上部署的Deep-Seek成为可选项。

  再其次,DeepSeek带来了芯片封锁逻辑的崩塌。DeepSeek在辉达CUDA生态的更底层(例如PTX层),通过微调底层代码来优化性能,从而解决“连接通信能力和调度能力被阉割”的问题。专家普遍认为,目前中美AI大模型领域的技术差距约为4个月。从技术能力发展的趋势来看,这一差距继续缩小的概率大于扩大的概率。

  最后,开源让DeepSeek在舆论战中至少“不落下风”。在AGI的道路上做出最强大的模型并开源,应该是OpenAI最早的初心和使命。市场永远不会说谎,谁的模型能力强谁就能掌握最终的话语权。2024年12月DeepSeek V3发布的时候,国际主流媒体主要关注其“成本低廉”;当Deep-Seek-R1发布时,情况则截然不同,因为“滔天的流量”来了。作为一个开源模型,DeepSeek让所有用户在任何领域都增加了一个“顶尖专家”,免费且24小时随时在线。(作者:郑涛)

【责任编辑:朱家齐】

扫描二维码推送至手机访问。

版权声明:本文由经济快讯网发布,如需转载请注明出处。

“DeepSeek成功的底层逻辑及产业影响” 的相关文章

耀坤液压IPO:夸张的研发投入、异常的成本数据均指向报表可靠性问题

耀坤液压IPO:夸张的研发投入、异常的成本数据均指向报表可靠性问题

(原标题:耀坤液压IPO:夸张的研发投入、异常的成本数据均指向报表可靠性问题)图片来源于网络,如有侵权,请联系删除 液压系统,是一种利用液体传递压力和能量的动力传输系统。主要由液压泵、液压缸(或液压马达)、控制阀、油箱、油管等部件组成。液压系统优势在于结构紧凑、输出力大、操作简便,广泛应用于...

拉普拉斯首发上市,开盘最高涨幅468.83%

拉普拉斯首发上市,开盘最高涨幅468.83%

(原标题:拉普拉斯首发上市,开盘最高涨幅468.83%)图片来源于网络,如有侵权,请联系删除 中宏网股票10月29日电 10月29日,拉普拉斯新能源科技股份有限公司(简称:拉普拉斯,688726.SH)科创板首发上市,开盘价100元/股,涨幅达468.83%。本次IPO发行价17.58元/股,发行...

胜科纳米IPO:专注检测分析二十年,举债增持打造芯片全科医院

胜科纳米IPO:专注检测分析二十年,举债增持打造芯片全科医院

(原标题:胜科纳米IPO:专注检测分析二十年,举债增持打造芯片全科医院)图片来源于网络,如有侵权,请联系删除 10月21日,胜科纳米(苏州)股份有限公司(以下简称“胜科纳米”)审核状态更新为已问询,并披露了最新的招股说明书和问询回复,这意味着这家主要服务于半导体产业链研发环节的实验室距离科创板I...

天威新材北交所IPO:实际竞争力存疑,真实盈利能力有待检验

天威新材北交所IPO:实际竞争力存疑,真实盈利能力有待检验

(原标题:天威新材北交所IPO:实际竞争力存疑,真实盈利能力有待检验)图片来源于网络,如有侵权,请联系删除 2023年12月29日,珠海天威新材料股份有限公司(以下简称天威新材/公司/发行人)的上市申请材料成功获得北交所受理,正式向北交所发起冲击。保荐机构为东莞证券股份有限公司,会计师为致同会计...

安孚科技此次收购业绩承诺覆盖率极低,评估预测数据合理性存疑

安孚科技此次收购业绩承诺覆盖率极低,评估预测数据合理性存疑

(原标题:安孚科技此次收购业绩承诺覆盖率极低,评估预测数据合理性存疑)图片来源于网络,如有侵权,请联系删除 安徽安孚电池科技股份有限公司(以下简称“安孚科技”或上市公司,股票代码:603031.SH)原为一家传统百货零售企业,近年来在其线下零售业务经营日渐举步维艰的情况下,安孚科技通过将原有...

华兴股份募资补流金额“突然”砍半 募资合理性乃至测算严谨性引关注

华兴股份募资补流金额“突然”砍半 募资合理性乃至测算严谨性引关注

(原标题:华兴股份募资补流金额“突然”砍半 募资合理性乃至测算严谨性引关注)图片来源于网络,如有侵权,请联系删除 选择北交所上市的汕头华兴冶金设备股份有限公司(以下简称“华兴股份”)此次原计划募资2.48亿元,投向华兴股份年产3000吨精密铜件及电炉铜冷却设备生产线项目等3个募投项目,其中原募资9...