DeepSeek到底是真开源还是假开源?业内人士:已经有足够多细节值得学习
2025/2/3 10:56:35 作者:admin
近日,在国内某问答平台上,一则关于 DeepSeek 的提问登上问题热门排行榜。这一问题的描述是:“如何评价 DeepSeek 自称开源?但似乎并未开源(Open Source),仅为 Open Model?”
对于 DeepSeek 的开源,香港城市大学宋林琦教授十分形象地说:“我们这次虽然没能吃上猪肉,但是至少近距离的看了下猪跑。”其表示,此前他和团队一直关注 AI 领域的商业模式,其中最赚钱的往往是“卖卡”和“卖课”,即 GPU 硬件销售和 AI 课程销售。
而专注于 AI 技术研发和 AI 应用的企业则普遍面临盈利难题。DeepSeek 的贡献在于有效降低了大规模训练对于 GPU 资源的依赖,缓解了 AI 产业链中的关键瓶颈。
这一变革有望推动 AI 价值链的重塑,使 GPU 端长期积累的超额利润向 AI 技术和应用端转移,进而形成一个健康的商业闭环,助力 AI 产业的可持续发展。
此前曾在 Meta 担任 Staff 研究科学家、现任北京大学助理教授李萌也表示,从 DeepSeek 开源技术细节来说,对于他这样一名 AI 研究者来说,这里面已经有非常多的细节值得学习了。
他说:“我相信 DeepSeek 在工程中一定还有很多技术细节,例如数据如何清洗、训练过程的细节等。这些都需要很多额外的实验和探索。”
李萌表示,大模型的训练包括模型、训练框架、训练数据和其他训练细节。目前,DeepSeek 已经把模型架构和参数开源,而训练框架尤其是训练数据的开源在业界少有先例。