DeepSeek能不能第二次震惊全世界 deepwise conv

去年7月的事儿估计还有人记得——DeepSeek量从8000多万暴跌到2000万,“跌落神坛”的话题刷遍科技圈。谁能想到,才过一年这家企业就攒够了劲儿,要在春节前后搞个大动作:2月中旬公开新一代模型DeepSeek-V4,这次的靶子直接对准了AI编程的核心赛道。
要是说去年R1模型靠推理能力证明了“低成本也能做大事”,那V4就是冲着“代码生成”这个当下最卷的领域去的。根据知情人士透露,V4在内部基准测试里,编程任务表现已经超过了Claude和GPT系列。更决定因素的是,它化解了两个困扰AI很久的“病”:以前让R1栽跟头的“数strawberry里有多少r”难题(模型死记硬背数据,把正确的3说成2),V4能彻底杜绝——它不是死记答案,是真的“领会”了“数”的逻辑;还有训练时“学新忘旧”的“灾难性遗忘”,V4也搞定了——变伶俐的同时没丢旧能力,刚好踩中了“Agent时代”的痛点:现在改一行代码也许牵动几千行依赖,以前的模型根本hold不住,V4这波等于于给编程Agent“搭了脚手架”。
其实DeepSeek的底气早有伏笔。去年R1登《Nature》封面时,团队就公开过一组刺心数据:从V3-Base到R1只花了29.4万美元——直接把“中国大模型靠烧钱”的说法怼了回去;年底那篇《mHC:流形约束超连接》论文更狠,给模型信号加了个“精密阀门”,把增益控制在1.6倍左右,化解了大模型“越做越不稳定”的物理难题,这就是V4的技术底子。再说现在赛道有多卷?至知创造的IQuest-Coder-V1才40B参数,就拿到了SWE-benchVerified81.4%的高分;字节豆包的Trae工具能从构思到部署一站式完成,还和中兴合作出了能跨应用操作的手机助手;阿里通义千问都能并行处理四个任务了——DeepSeek要是没点真物品,根本不敢往这堆里扎。
最近资本市场的动静也在“补刀”:智谱AI1月8日港交所敲钟,首日涨13%;MiniMax更夸大,上市当天暴涨109%,直接冲进千亿市值俱乐部。这说明啥子?“百模大战”的泡沫散了,现在市场只认“有硬实力的头部”。DeepSeek作为曾经用低成本倾败行业的“黑马”,这次带着V4杀回战场,能不能再复制去年的“震惊时刻”?
春节的脚步越来越近,大家一边抢火车票一边等消息——毕竟去年DeepSeek跌落时,没人想到他们能憋出这么个大招。这次V4要是真能在代码生成赛道站稳,说不定又能给AI行业搅起一阵风浪。至于能不能“第二次震惊全全球”?反正就等春节那几天了,咱们搬个小马扎,等着看DeepSeek的“新年答卷”。
— end —
好文稿,值得被更多人看到
免责声明:这篇文章小编将内容由键盘侠自发贡献,版权归原作者全部,本站不承担相应法律职责。如无论兄弟们发现有涉嫌抄袭侵权的内容,请联系
