
DeepSeek推理最高提速6倍!开源研究:加装「思维进度条」,计算量减少30%
DeepSeek推理最高提速6倍!开源研究:加装「思维进度条」,计算量减少30%DeepSeek推理要详细还是要迅速,现在可以自己选了?
DeepSeek推理要详细还是要迅速,现在可以自己选了?
多模态模型学会“按需搜索”!字节&NTU最新研究,优化多模态模型搜索策略——通过搭建网络搜索工具、构建多模态搜索数据集以及涉及简单有效的奖励机制,首次尝试基于端到端强化学习的多模态模型自主搜索训练。
我们独家获悉,具身智能初创公司它石智航近期完成 1.22 亿美元天使 + 轮融资。本轮融资由美团战投领投,钧山投资、碧鸿投资、国汽投资、临港科创投、赛富投资基金、建发新兴投资共同跟投。老股东线性资本、 襄禾资本等也在本轮追加投资。其中,美团的投资额约在3亿—4亿元。
你有没有想过,为什么实体店的转化率能达到30-35%,而在线购物网站却只有可怜的1.5%?
AI现在真能救命!传统的心脏MRI(磁共振成像)检查可能遗漏的关键风险信号,现在能够被AI捕捉了。
清华大学朱军教授团队提出SageAttention3,利用FP4量化实现推理加速,比FlashAttention快5倍,同时探索了8比特注意力用于训练任务的可行性,在微调中实现了无损性能。
当LangChain在6月23日发布那篇著名的Context Engineering博客时,IBM Research的研究者们早在10天前就已经用严格的学术实验证明了这套方法的有效性。
刷到1分钟AI短视频别只顾着点赞,背后的算力成本让人惊叹。MIT和英伟达等提出的径向注意力技术让长视频生成成本暴降4.4倍,速度飙升3.7倍,AI视频的未来已来!
为什么 DeepSeek-V3 据说在大规模服务时快速且便宜,但本地运行时却太慢且昂贵?为什么有些 AI 模型响应很慢,但一旦开始运行就变得很快?
在互联网信息检索任务中,即使是很强的LLM,有时也会陷入“信息迷雾”之中:当问题简单、路径明确时,模型往往能利用记忆或一两次搜索就找到答案;但面对高度不确定、线索模糊的问题,模型就很难做对。