
清华一作1B暴打405B巨无霸,7B逆袭DeepSeek R1!测试时Scaling封神
清华一作1B暴打405B巨无霸,7B逆袭DeepSeek R1!测试时Scaling封神【新智元导读】仅凭测试时Scaling,1B模型竟完胜405B!多机构联手巧妙应用计算最优TTS策略,不仅0.5B模型在数学任务上碾压GPT-4o,7B模型更是力压o1、DeepSeek R1这样的顶尖选手。
【新智元导读】仅凭测试时Scaling,1B模型竟完胜405B!多机构联手巧妙应用计算最优TTS策略,不仅0.5B模型在数学任务上碾压GPT-4o,7B模型更是力压o1、DeepSeek R1这样的顶尖选手。
我是先看到了一张极其意料之外的图。首先我要说除了DeepSeek 官方,其他家都很稳定(这里没有吐槽官方的意思,毕竟情况特殊) 至少我没检测到超时或者断开。
DeepSeek的爆火来得很突然。1月27日一早,DeepSeek在中国区和美国区苹果App Store免费榜上同时冲到了下载量第一,超过原先霸榜的ChatGPT。而半个月前,DeepSeek的App才刚刚上线iOS和安卓的应用市场。
这应该是我知道的第一家有自己大模型的大厂,第一次在面向C端的AI助手应用中,第一次接入DeepSeek R1。这个意义影响还是非常深远的,腾讯在AI这一步上,好像走的格外的开放,从之前的批量开源MoE、混元绘图模型、混元视频模型、混元3D模型,还有今天这神之一手接入DeepSeek R1。
GPT-4.5将在未来几个周/月内发布!
关乎当红炸子鸡DeepSeek,奥特曼最新观点出炉:
整个春节假期,我眼睁睁看着 DeepSeek 从“全民狂欢”变成“全民卡顿”——官网十问九崩,还有谁没被“服务器正忙,请稍后重试”的提示,搞崩溃过。
现在,人人都可以构建DeepSeek智能体了!
席卷全球的 DeepSeek 依然是科技圈最大的话题,连 San Altman 都承认每天醒来都会担忧。因此本周在巴黎举办的 AI 行动峰会聚光灯稍显黯淡,但这里依然汇聚了全球大量重要的头脑。
最近,外媒Bloomberg曝出了惊人消息:DeepSeek的估值竟已飙至1500亿美元,已经达到OpenAI的一半?在巴黎AI峰会现场,DeepSeek已经如同房间里的大象。甚至巴黎地铁里的70岁老人也开始讨论DeepSeek!