·设为首页收藏本站📧邮箱修改🎁免费下载专区📒收藏夹👽聊天室
返回列表 发布新帖

30美元复现DeepSeek模型

79 7
发表于 5 小时前 | 查看全部 阅读模式

马上注册,免费下载更多dz插件网资源。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
斯坦福大学地下室,三个学生干了件大事,用30美元成本复现了估值百亿的DeepSeek核心模型。


学生团队核心秘籍是知识蒸馏,把1750亿参数大模型浓缩成70亿参数精华版,数据来源也巧妙,大部分开源,合成成本才17美元,训练靠谷歌免费显卡,电费13美元。


他们用开源工具搭积木,HuggingFace微调方案、MoE架构组装等,还借助梯度缓存提升训练效率。项目火了,GitHub星标四千,大家都纳闷大公司咋没想到。


测试结果令人意外,MMLU基准测试72.3分,和原版差距极小。推理速度稍慢但用户几乎无感,能效比虽有损耗但成本低可忽略。网友实测,生成小说电费不到半分,大家都在思考企业级AI是否还值得高价购买。


这一事件引发行业地震,DeepSeek估值蒸发17亿美元。投资人慌了,专利律师核查侵权。复现团队收到高薪邀请,印度创业潮兴起,单周注册420家AI公司。
我要说一句 收起回复
创宇盾启航版免费网站防御网站加速服务

评论7

CrystαlLv.8 发表于 5 小时前 | 查看全部
投资人慌了是重点!卷来卷去,都死翘翘!
我要说一句 收起回复
TyCodingLv.8 发表于 5 小时前 | 查看全部
是的。deepseek打开了潘多拉魔盒,现在AI圈子全都在干知识蒸馏的事情。
30美元的这套系统,也会被别人蒸馏,最后,成本降到几块钱几毛钱几分钱。
哈哈,实在是太有意思了。
我要说一句 收起回复
浅生Lv.8 发表于 5 小时前 | 查看全部
部署到手机 都能离线应用了
我要说一句 收起回复
浅生Lv.8 发表于 5 小时前 | 查看全部
不错,现在多等等
我要说一句 收起回复
IT618发布Lv.8 发表于 5 小时前 | 查看全部
卧槽 这么刺激
我要说一句 收起回复
独家记忆Lv.8 发表于 5 小时前 | 查看全部
没看明白,意思是deepseek被噶了?
我要说一句 收起回复
IT618发布Lv.8 发表于 5 小时前 | 查看全部
直接拿人家的数据,成本肯定低的。
自己一手训练,成本是很高的。
我要说一句 收起回复

回复

 懒得打字嘛,点击右侧快捷回复【查看最新发布】   【应用商城享更多资源】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

图文热点
关闭

站长推荐上一条 /1 下一条

创宇盾启航版免费网站防御网站加速服务
投诉/建议联系

discuzaddons@vip.qq.com

未经授权禁止转载,复制和建立镜像,
如有违反,按照公告处理!!!
  • 联系QQ客服
  • 添加微信客服

联系DZ插件网微信客服|最近更新|Archiver|手机版|小黑屋|DZ插件网! ( 鄂ICP备20010621号-1 )|网站地图 知道创宇云防御

您的IP:3.135.213.128,GMT+8, 2025-2-6 19:21 , Processed in 0.489156 second(s), 112 queries , Gzip On, Redis On.

Powered by Discuz! X5.0 Licensed

© 2001-2025 Discuz! Team.

关灯 在本版发帖
扫一扫添加微信客服
QQ客服返回顶部
快速回复 返回顶部 返回列表