DeepSeek能不能第二次震惊全世界 deepwise conv-青耀台手游网

摘要：去年7月的事儿估计还有人记得——DeepSeek量从8000多万暴跌到2000万，“跌落神坛”的话题刷遍科技圈。谁能想到，才过一年这家公司就攒够了劲儿，要在春节前后搞个大动作：2月中旬发布新一代,DeepSeek能不能第二次震惊全世界 deepwise conv

去年7月的事儿估计还有人记得——DeepSeek量从8000多万暴跌到2000万，“跌落神坛”的话题刷遍科技圈。谁能想到，才过一年这家企业就攒够了劲儿，要在春节前后搞个大动作：2月中旬公开新一代模型DeepSeek-V4，这次的靶子直接对准了AI编程的核心赛道。

要是说去年R1模型靠推理能力证明了“低成本也能做大事”，那V4就是冲着“代码生成”这个当下最卷的领域去的。根据知情人士透露，V4在内部基准测试里，编程任务表现已经超过了Claude和GPT系列。更决定因素的是，它化解了两个困扰AI很久的“病”：以前让R1栽跟头的“数strawberry里有多少r”难题（模型死记硬背数据，把正确的3说成2），V4能彻底杜绝——它不是死记答案，是真的“领会”了“数”的逻辑；还有训练时“学新忘旧”的“灾难性遗忘”，V4也搞定了——变伶俐的同时没丢旧能力，刚好踩中了“Agent时代”的痛点：现在改一行代码也许牵动几千行依赖，以前的模型根本hold不住，V4这波等于于给编程Agent“搭了脚手架”。

其实DeepSeek的底气早有伏笔。去年R1登《Nature》封面时，团队就公开过一组刺心数据：从V3-Base到R1只花了29.4万美元——直接把“中国大模型靠烧钱”的说法怼了回去；年底那篇《mHC：流形约束超连接》论文更狠，给模型信号加了个“精密阀门”，把增益控制在1.6倍左右，化解了大模型“越做越不稳定”的物理难题，这就是V4的技术底子。再说现在赛道有多卷？至知创造的IQuest-Coder-V1才40B参数，就拿到了SWE-benchVerified81.4%的高分；字节豆包的Trae工具能从构思到部署一站式完成，还和中兴合作出了能跨应用操作的手机助手；阿里通义千问都能并行处理四个任务了——DeepSeek要是没点真物品，根本不敢往这堆里扎。

最近资本市场的动静也在“补刀”：智谱AI1月8日港交所敲钟，首日涨13%；MiniMax更夸大，上市当天暴涨109%，直接冲进千亿市值俱乐部。这说明啥子？“百模大战”的泡沫散了，现在市场只认“有硬实力的头部”。DeepSeek作为曾经用低成本倾败行业的“黑马”，这次带着V4杀回战场，能不能再复制去年的“震惊时刻”？

春节的脚步越来越近，大家一边抢火车票一边等消息——毕竟去年DeepSeek跌落时，没人想到他们能憋出这么个大招。这次V4要是真能在代码生成赛道站稳，说不定又能给AI行业搅起一阵风浪。至于能不能“第二次震惊全全球”？反正就等春节那几天了，咱们搬个小马扎，等着看DeepSeek的“新年答卷”。

— end —

好文稿，值得被更多人看到

免责声明：这篇文章小编将内容由键盘侠自发贡献，版权归原作者全部，本站不承担相应法律职责。如无论兄弟们发现有涉嫌抄袭侵权的内容，请联系

DeepSeek能不能第二次震惊全世界 deepwise conv

延伸阅读