返回 吃瓜100

DeepSeek-R1上线20多天,接受了多少掌声,就承受了多少压力

2025-02-10

总结了DeepSeek口碑的来源:1、完全免费使用。2、在和用户聊天时会展示思维过程,这样也能反向优化用户的提问形式,提升对话体验,而o1就没有公布思考过程,原因可能是怕竞争对手将过程拷贝后训练自己的模型。3、将技术论文和模型进行毫无保留的开源,部分开源大模型还是会将最好的版本留给自己。

但前几天因为热度前来的用户发现,DeepSeek频繁出现宕机,几乎无法正常使用,原因是公司服务器受到了大规模DDoS恶意攻击,截至发稿,DeepSeek已恢复正常使用。

面对不少人士“DeepSeek是否有创新”的质疑,DeepSeek在其披露的V3和R1的技术论文中已经有过回应:1、V3模型采用多项自研技术进行架构创新,包括DeepSeekMoE+DeepSeekMLA架构、MTP多Token预测技术,使低成本训练成为可能;2、R1模型放弃了传统RLHF(人类反馈强化学习)中的HF部分,通过纯强化学习(RL)直接训练,验证了RL的优先级和有效性,进一步优化了训练效率。

最新文章

从喜剧大赛到浪姐:她们把闺蜜处成”欢喜冤家”

娱乐

 

阅读12277

古天乐右眼视网膜穿了两个洞!

娱乐

 

阅读11306

佟大为与关悦举办婚礼的第17年,发文晒照庆祝

娱乐

 

阅读11108

噩耗传来,著名的单口喜剧演员“天残”意外离世,年仅30岁

娱乐

 

阅读12472

《蛮好的人生》胡曼黎发现老公可能有外遇

电视剧

 

阅读16301

晋ICP备2024051176号-1