DeepSeek V4发布前,梁文锋连发3篇论文,我读完发现一个规律

1.35萬
2026-01-14
314
AI进化论花生
DeepSeek V4传闘愈演愈烈,2月中旬春节前后发布几成定局。但在V4到来之前,DeepSeek连发三篇梁文锋署名论文,透露了下一代模型的技术方向。 本期视频带你读懂这三篇论文的核心思想: Engram:给模型装上"记忆",75%思考+25%记忆是最优解。博尔赫斯1942年就写过:完美的记忆会杀死思考。 mHC:残差连接用了10年,DeepSeek证明它不是最优解。稳定性提升3个数量级,只增加6.7%训练时间。 R1论文更新:从22页扩展到86页,29.4万美元训练成本首次公开,连失败案例都写进去了。 DeepSeek的风格:先发论文,再发模型。看完这三篇,V4发布时你就能看懂它到底强在哪。
DeepSeek V4传闘愈演愈烈,2月中旬春节前后发布几成定局。但在V4到来之前,DeepSeek连发三篇梁文锋署名论文,透露了下一代模型的技术方向。 本期视频带你读懂这三篇论文的核心思想: Engram:给模型装上"记忆",75%思考+25%记忆是最优解。博尔赫斯1942年就写过:完美的记忆会杀死思考。 mHC:残差连接用了10年,DeepSeek证明它不是最优解。稳定性提升3个数量级,只增加6.7%训练时间。 R1论文更新:从22页扩展到86页,29.4万美元训练成本首次公开,连失败案例都写进去了。 DeepSeek的风格:先发论文,再发模型。看完这三篇,V4发布时你就能看懂它到底强在哪。
13:41
Microsoft Excel 基礎教學 (EP.5) 查詢參照函數 VLOOKUP / XLOOKUP / IFERROR / INDEX / MATCH
11:37
我試了所有AI視頻工具,這6個最強大,Hailuo、Kling、Seedance、Pixerse、Veo3...2025 AI自媒體必備神器(AI Video Generator )
22:25
誰說做 App 一定要會寫程式?Google AppSheet 零程式碼開發術,連文組生也能快速打造客製化 App!
15:46
2025非常特别的一张虚拟卡,免费开卡0资费,集万事达信用卡+瑞士银行+冷钱包+热钱包一体,欧洲个人iban ,国内避免黑钱封卡合法出金最佳方案,最新safepal fiat24瑞士银行保姆级开卡教程
43:02
Michael Saylor 在2025 BBW 的這場演講震撼全球!為什麼機構都在聽他?

༺ 資料蒐集來源: YouTube
本站不需註冊加入會員,保障個人隱私,完全不用Cookei