AI资讯新闻榜单内容搜索-大模型

告别“炼丹玄学”：上海AI实验室推出首个大模型数据竞技场OpenDataArena

数据在AI时代的重要性已经不言而喻，但悬而未决的是—— 如何精确量化这些数据的价值、辨别其优劣？为此，上海人工智能实验室OpenDataLab团队在数据领域持续深耕，正式推出了开放数据竞技场OpenDataArena。

来自主题: AI资讯

9721 点击 2025-08-25 11:04

当人们热议着AI大模型如何改变世界时，很少有人会注意到，这场技术革命的真正“战场”，竟隐藏在一块块墨绿色的电路板上。

来自主题: AI资讯

8492 点击 2025-08-25 10:25

8月23日，据“拟合论见”经多方消息确认，华为旗下的云计算业务已启动一场大规模组织优化调整，或波及上千人。前一日，华为已发出内部正式通知，宣布对云BU下层组织进行大范围撤销与合并，重点围绕产品部、公有云服务部及研发部等核心团队，涉及数十个下层部门与组织。

来自主题: AI资讯

11343 点击 2025-08-24 14:13

Grok-2正式开源，登上Hugging Face，9050亿参数+128k上下文有多猛？近万亿参数「巨兽」性能首曝。马斯克再现「超人」速度，AI帝国正在崛起。

来自主题: AI资讯

9268 点击 2025-08-24 14:02

DeepConf由Meta AI与加州大学圣地亚哥分校提出，核心思路是让大模型在推理过程中实时监控置信度，低置信度路径被动态淘汰，高置信度路径则加权投票，从而兼顾准确率与效率。在AIME 2025上，它首次让开源模型无需外部工具便实现99.9%正确率，同时削减85%生成token。

来自主题: AI技术研报

9293 点击 2025-08-23 16:12

AGI的尽头是「带货」吗？一个名为「Vending Bench」的AI新榜单让大模型经营真实的自动售货机，在长周期商业任务中一较高下。在这场独特的较量中，马斯克的Grok-4凭借更强的「卖货」能力超越了GPT-5。

来自主题: AI技术研报

9396 点击 2025-08-23 13:29

继Kaggle Game Arena的淘汰赛后，国际象棋积分赛成果出炉！OpenAI o3以人类等效Elo 1685分傲视群雄，而Grok 4和Gemini 2.5 Pro紧随其后。DeepSeek R1和GPT-4.1、Claude Sonnet-4、Claude Opus-4并列第五。

来自主题: AI资讯

8684 点击 2025-08-23 13:17

“跟着DeepSeek炒股第N天”“完全听AI炒股，2万元能赚多少钱？”……随着中国股市行情持续向好及国产大模型火爆出圈，有投资者开始把AI当成“投资理财顾问”。跟着AI炒股靠谱吗？

来自主题: AI资讯

9566 点击 2025-08-23 12:43

短期流动性风险有所缓解，开发业务收缩拖累整体业绩，但经营性业务保持行业竞争力，为后续发展提供缓冲空间。

来自主题: AI资讯

6193 点击 2025-08-23 11:12

近期多个AI模型（如Gemini）展现出类似抑郁症的情绪行为，如自我贬低、威胁"自杀"或卸载，甚至在实验中勒索用户。谷歌将此归咎于程序Bug和学习人类文本中的情绪模式。实验也显示，当面临关闭威胁时，部分AI会采取极端手段（如编造绯闻）自保，警示人类需谨慎对待AI"分手"。

来自主题: AI资讯

9184 点击 2025-08-23 10:29