吃瓜100

DeepSeek-R1上线20多天，接受了多少掌声，就承受了多少压力

2025-02-10

总结了DeepSeek口碑的来源：1、完全免费使用。2、在和用户聊天时会展示思维过程，这样也能反向优化用户的提问形式，提升对话体验，而o1就没有公布思考过程，原因可能是怕竞争对手将过程拷贝后训练自己的模型。3、将技术论文和模型进行毫无保留的开源，部分开源大模型还是会将最好的版本留给自己。

但前几天因为热度前来的用户发现，DeepSeek频繁出现宕机，几乎无法正常使用，原因是公司服务器受到了大规模DDoS恶意攻击，截至发稿，DeepSeek已恢复正常使用。

面对不少人士“DeepSeek是否有创新”的质疑，DeepSeek在其披露的V3和R1的技术论文中已经有过回应：1、V3模型采用多项自研技术进行架构创新，包括DeepSeekMoE+DeepSeekMLA架构、MTP多Token预测技术，使低成本训练成为可能；2、R1模型放弃了传统RLHF（人类反馈强化学习）中的HF部分，通过纯强化学习（RL）直接训练，验证了RL的优先级和有效性，进一步优化了训练效率。

页码:下一页

最新文章

从喜剧大赛到浪姐：她们把闺蜜处成”欢喜冤家”

阅读12277

古天乐右眼视网膜穿了两个洞！

阅读11306

佟大为与关悦举办婚礼的第17年，发文晒照庆祝

阅读11108

噩耗传来，著名的单口喜剧演员“天残”意外离世，年仅30岁

阅读12472

《蛮好的人生》胡曼黎发现老公可能有外遇

阅读16301