AI资讯新闻榜单内容搜索-模型

阿里云昨夜春晚首秀，随后上线AI重磅，透露哪些信号？

时隔7年，阿里巴巴再次成为春晚上“最靓的仔”。据了解，阿里云主要为春晚提供两部分技术支持：一是阿里云云转播技术支持全球华人云上看春晚，二是阿里云通义大模型技术支持春晚节目创新，创造全新的视听效果。此前，阿里云已连续多年为央视总台提供护航服务，保障春晚稳定直播。

来自主题: AI资讯

9607 点击 2025-01-29 15:55

DeepSeek、迅雷、虎扑其实都在思考同一个问题：数字时代发展到当下，科技行业应该何去何从？龙年年底，科技界和体育界分别迎来两宗大事件——2025年1月20日，DeepSeek-R1开源人工智能模型发布；2025年1月27日，迅雷宣布作价5亿元人民币收购体育媒体及数据平台虎扑。

来自主题: AI资讯

6857 点击 2025-01-29 14:20

DeeSeek R1横空出世撼动了整个硅谷，这波AI恐惧仍在蔓延扩散。奥特曼、OpenAI首席研究官不得不发文承认DeeSeek的技术突破，预告未来会加快新模型的发布。与此同时，研究人员们也纷纷展开了对DeepSeek技术的深入分析。

来自主题: AI资讯

8059 点击 2025-01-29 14:10

基于一段文本提问时，人类和大模型会基于截然不同的思维模式给出问题。大模型喜欢那些需要详细解释才能回答的问题，而人类倾向于提出更直接、基于事实的问题。

来自主题: AI技术研报

5868 点击 2025-01-29 13:32

「除了 Claude、豆包和 Gemini 之外，知名的闭源和开源 LLM 通常表现出很高的蒸馏度。」这是中国科学院深圳先进技术研究院、北大、零一万物等机构的研究者在一篇新论文中得出的结论。

来自主题: AI技术研报

10275 点击 2025-01-29 13:26

昨晚，杭州大模型又双叒不睡，给大伙儿拜年啦～就在春晚直播进行时，阿里通义Qwen发布新春节礼第三弹：Qwen2.5-Max来袭，多个基准测试中超越当红炸子鸡DeepSeek V3。

来自主题: AI资讯

8601 点击 2025-01-29 12:40

RAG系统的搭建与优化是一项庞大且复杂的系统工程，通常需要兼顾测试制定、检索调优、模型调优等关键环节，繁琐的工作流程往往让人无从下手。

来自主题: AI资讯

9881 点击 2025-01-29 12:34

今天（1月28日）凌晨，国内火爆的AI大模型公司深度求索（DeepSeek）称遭受大规模恶意攻击。据悉，DeepSeek旗下AI（人工智能）服务在24小时内经历多次宕机。

来自主题: AI资讯

9175 点击 2025-01-28 12:28

ETH Zurich等机构提出了推理语言模型（RLM）蓝图，超越LLM局限，更接近AGI，有望人人可用o3这类强推理模型。

来自主题: AI技术研报

8555 点击 2025-01-28 12:20

VARGPT是一种新型多模态大模型，能够在单一框架内实现视觉理解和生成任务。通过预测下一个token完成视觉理解，预测下一个scale完成视觉生成，展现出强大的混合模态输入输出能力。

来自主题: AI技术研报

8432 点击 2025-01-28 12:07