AI资讯新闻榜单内容搜索-deepseek

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: deepseek
面对无解问题大模型竟会崩溃?港中文&华为联合提出首个大模型推理可靠性评估基准

面对无解问题大模型竟会崩溃?港中文&华为联合提出首个大模型推理可靠性评估基准

面对无解问题大模型竟会崩溃?港中文&华为联合提出首个大模型推理可靠性评估基准

今年初以 DeepSeek-r1 为代表的大模型在推理任务上展现强大的性能,引起广泛的热度。然而在面对一些无法回答或本身无解的问题时,这些模型竟试图去虚构不存在的信息去推理解答,生成了大量的事实错误、无意义思考过程和虚构答案,也被称为模型「幻觉」 问题,如下图(a)所示,造成严重资源浪费且会误导用户,严重损害了模型的可靠性(Reliability)。

来自主题: AI技术研报
7295 点击    2025-07-17 11:24
AI圈水太深:OpenAI保密、Meta作弊!国产MoE却异军突起

AI圈水太深:OpenAI保密、Meta作弊!国产MoE却异军突起

AI圈水太深:OpenAI保密、Meta作弊!国产MoE却异军突起

从GPT-2到Llama 4,大模型这几年到底「胖」了多少?从百亿级密集参数到稀疏MoE架构,从闭源霸权到开源反击,Meta、OpenAI、Mistral、DeepSeek……群雄割据,谁能称王?

来自主题: AI技术研报
6937 点击    2025-07-16 16:18
你的 AI 回答,可能早被人夹了私货

你的 AI 回答,可能早被人夹了私货

你的 AI 回答,可能早被人夹了私货

最近大家有没有发现,好多店家开始用 DeepSeek 来营销了?

来自主题: AI资讯
7684 点击    2025-07-15 15:36
Kimi K2里找到了DeepSeek V3架构

Kimi K2里找到了DeepSeek V3架构

Kimi K2里找到了DeepSeek V3架构

Kimi新模型热度持续高涨ing!

来自主题: AI资讯
6808 点击    2025-07-15 13:16
美国版梁文锋来了

美国版梁文锋来了

美国版梁文锋来了

DeepSeek火爆全球,现在美国版“梁文锋”来了。来自美国的互联网券商巨头Robinhood的CEO——Vlad Tenev决定投身人工智能创业浪潮,与Tudor Achim联合打造了一家专注于人工智能的初创公司——Harmonic AI。

来自主题: AI资讯
6519 点击    2025-07-11 17:22
全球首个科研LLM竞技场上线!23款顶尖模型火拼:o3夺冠,DeepSeek第四

全球首个科研LLM竞技场上线!23款顶尖模型火拼:o3夺冠,DeepSeek第四

全球首个科研LLM竞技场上线!23款顶尖模型火拼:o3夺冠,DeepSeek第四

最近,Ai2耶鲁NYU联合推出了一个科研版「Chatbot Arena」——SciArena。全球23款顶尖大模型火拼真实科研任务,OpenAI o3领跑全场,DeepSeek紧追Gemini挤入前四!不过从结果来看,要猜中科研人的偏好,自动评估系统远未及格。

来自主题: AI技术研报
7140 点击    2025-07-11 17:12
一手实测让马斯克睡帐篷的Grok4,DeepSeekR2又多一位可笑的对手

一手实测让马斯克睡帐篷的Grok4,DeepSeekR2又多一位可笑的对手

一手实测让马斯克睡帐篷的Grok4,DeepSeekR2又多一位可笑的对手

“Grok”一词不是马斯克原创,而是源于科幻作家罗伯特·海因莱因 (Robert A. Heinlein) 1961年的经典小说《异乡异客》(Stranger in a Strange Land)。在小说中,“Grok”是一个火星词汇,其含义远超“理解”,它代表着一种深刻、直观、感同身受的领悟,一种与被理解对象融为一体的境界。

来自主题: AI资讯
6926 点击    2025-07-11 11:32
2025上半年,AI Agent领域有什么变化和机会?| 峰瑞研究所

2025上半年,AI Agent领域有什么变化和机会?| 峰瑞研究所

2025上半年,AI Agent领域有什么变化和机会?| 峰瑞研究所

2025上半年AI Agent领域经历模型竞争加剧和范式演进,DeepSeek等新模型打破垄断,推动Tool Use和强化学习突破。Agent从Prompt、Workflow发展为自主决策、环境感知和工具使用的智能体。编程领域验证PMF,落地机会集中于垂直场景和C端创新,但商业壁垒和技术挑战仍待解决。

来自主题: AI资讯
7790 点击    2025-07-11 09:22
DeepSeek-R1超级外挂!“人类最后的考试”首次突破30分,上海交大等开源方案碾压OpenAI、谷歌

DeepSeek-R1超级外挂!“人类最后的考试”首次突破30分,上海交大等开源方案碾压OpenAI、谷歌

DeepSeek-R1超级外挂!“人类最后的考试”首次突破30分,上海交大等开源方案碾压OpenAI、谷歌

“人类最后的考试”首次突破30分,还是咱国内团队干的! 该测试集是出了名的超难,刚推出时无模型得分能超过10分。

来自主题: AI技术研报
8639 点击    2025-07-10 11:21