DeepSeek被称为AI界拼多多,训练2个月仅花费了557.6万美元!
- 发布于:2025-01-28 14:19:27
- 来源:看球吧
1月28日讯 据钱江晚报报道,此次DeepSeek-V3在AI行业引发关注,关键的原因在于——超低的预训练成本。
“预训练”是AI大模型学习中的一种方法,指的是通过海量的数据,训练一个大模型。训练时需要大量的数据和算力支持,每次迭代可能耗资数百万至数亿美元。

官方技术论文披露,DeepSeek-V3在预训练阶段仅使用2048块GPU训练了2个月,且只花费557.6万美元。这个费用是什么概念?
据报道,GPT-4o的模型训练成本约为1亿美元。简单粗暴地说,这相当于DeepSeek-V3比同等性能的AI大模型,降了十几倍的成本。
早在2024年5月,深度求索发布DeepSeek-V2时,就曾因给模型的定价太过于便宜,开启了中国大模型的价格战,被称之为“AI界的拼多多”。

“相比于说它是‘拼多多’,它更像小米,贴近成本定价,并且自产自销。”马千里认为,训练成本比较低的原因,离不开深度求索团队自研的架构和算力,他们自身的算力储备可以与大厂比肩,并且更注重底层的模型。
“ChatGPT走的是大参数、大算力、大投入的路子,DeepSeek-V3的路径用了更多的巧思,依托数据与算法层面的优化创新,从而高效利用算力,实现较好的模型效果。”马千里说道。
相关资讯
- 体育战报 | 何诗蓓夺得十五运会女子200米自由泳金牌
- 体育战报 | 王楚钦要和樊振东碰面了!王楚钦战胜林高远,晋级男单四强
- 体育战报 | 首届世界网球洲际对抗赛,选你所爱
- 体育战报 | 王曼昱战胜王艺迪晋级全运会女单半决赛,下一场对决陈梦
- 体育战报 | 郑英昊夺得十五运会男子50米蛙泳金牌
- 体育战报 | 赛道上追风,远离兴奋剂!
- 体育战报 | 王曼昱41进四强冲冠:女单半决赛对决陈梦!孙颖莎大战朱雨玲
- 体育战报 | 这一次他游到了最高领奖台!
- 体育战报 | 覃海洋被取消成绩
- 体育战报 | 覃海洋被取消成绩
最新资讯
- NBA | 官方:新疆男篮签下前NBA球员泰隆华莱士
- CBA | CBA官宣杯赛赛程,广东男篮首战对阵山西,辽宁两对手实力不强
- CBA | 自己主动解约!杜锋外甥离开CBA,被辽宁球迷网暴
- CBA | 新外援首秀,辽宁男篮杯赛首战弱旅赵继伟或缺阵大韩接班人爆发
- 中超 | 意外!国安队年底解约离队第一人预测,本赛季刚加盟却表现平平
- 中超 | 津门虎战申花球票明日12点开售:主队区80380元,客队区160元
- CBA | 永远是榜样!周鹏透露易建联近况身材管理特别棒
- CBA | 招募青岛男篮票务志愿者招募,期待你的加入
- 中超 | 80后现役中超老将盘点!崇明岛走出500场传奇!吕文君的海港人生
- 中超 | 泰山下赛季教练是韩鹏就行了,但球队需要找一个好的助教才行
