DeepSeek被称为AI界拼多多,训练2个月仅花费了557.6万美元!
- 发布于:2025-01-28 14:19:27
- 来源:JRS低调看球
1月28日讯 据钱江晚报报道,此次DeepSeek-V3在AI行业引发关注,关键的原因在于——超低的预训练成本。
“预训练”是AI大模型学习中的一种方法,指的是通过海量的数据,训练一个大模型。训练时需要大量的数据和算力支持,每次迭代可能耗资数百万至数亿美元。
官方技术论文披露,DeepSeek-V3在预训练阶段仅使用2048块GPU训练了2个月,且只花费557.6万美元。这个费用是什么概念?
据报道,GPT-4o的模型训练成本约为1亿美元。简单粗暴地说,这相当于DeepSeek-V3比同等性能的AI大模型,降了十几倍的成本。
早在2024年5月,深度求索发布DeepSeek-V2时,就曾因给模型的定价太过于便宜,开启了中国大模型的价格战,被称之为“AI界的拼多多”。
“相比于说它是‘拼多多’,它更像小米,贴近成本定价,并且自产自销。”马千里认为,训练成本比较低的原因,离不开深度求索团队自研的架构和算力,他们自身的算力储备可以与大厂比肩,并且更注重底层的模型。
“ChatGPT走的是大参数、大算力、大投入的路子,DeepSeek-V3的路径用了更多的巧思,依托数据与算法层面的优化创新,从而高效利用算力,实现较好的模型效果。”马千里说道。

- 体育战报 | 体育时尚界不可忽视力量谷爱凌体育画报泳装长篇特刊
- 体育战报 | 亚洲举重锦标赛收官,中国队打破4项世界纪录和5项世界青年纪录
- 体育战报 | 泰国羽毛球公开赛次轮,陈清晨王汀戈、冯彦哲黄东萍顺利晋级
- 体育战报 | 世界排球联赛北京站:中国女排将对阵比利时、波兰、法国、土耳其
- 体育战报 | 泰国羽毛球公开赛男单18决赛:陆光祖鏖战三局逆转击败艾迪尔
- 体育战报 | 媒体人:F1车手说脏话的罚款额度从1万欧降到5000欧
- 体育战报 | 法拉利官方:勒克莱尔今天身体不适,预计明天可以上车
- 体育战报 | 赵心童:世锦赛冠军只是开始,希望有天能坐到世界第一位置
- 体育战报 | 陈雨菲20轻取沈有振,强势晋级泰国羽毛球公开赛女单八强
- 体育战报 | 普利斯科娃脚踝手术:一切都很顺利,希望快点回到球场

- 英超 | TA:利物浦若今夏出售基耶萨甚至可能获利,球员在意甲选择有限
- 英超 | 体图:决心签下乔布贝林厄姆,多特承诺球员计划让他立即当主力
- 西甲 | 世体:费兰托雷斯因阑尾炎手术缺席比赛,将迫使弗里克调整阵容
- 意甲 | 记者:费内巴切对奥斯梅恩很感兴趣,但球员不想加盟死敌球队
- 英超 | 天空:皇马是签下怀森的热门,多家英超俱乐部也在随时了解进展
- 英超 | 森林后卫埃纳:希望阿沃尼伊一切顺利不理解明显越位不举旗
- 中超 | “童心绘蓝图申花伴成长”申花六一儿童节征画活动开启
- 西甲 | 世体:巴萨计划在西甲夺冠后举行游行庆祝活动
- 英超 | 这树能上吗回声报证实:利物浦长期欣赏维尔茨,已与球员会面
- 英超 | 斯基拉:米兰不会500万欧买断沃克,球员也不在曼城计划之内