AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
医疗AI迎来大考!南洋理工发布首个LLM电子病历处理评测 | AAAI'26

医疗AI迎来大考!南洋理工发布首个LLM电子病历处理评测 | AAAI'26

医疗AI迎来大考!南洋理工发布首个LLM电子病历处理评测 | AAAI'26

南洋理工大学研究人员构建了EHRStruct基准,用于评测LLM处理结构化电子病历的能力。该基准涵盖11项核心任务,包含2200个样本,按临床场景、认知层级和功能类别组织。研究发现通用大模型优于医学专用模型,数据驱动任务表现更强,输入格式和微调方式对性能有显著影响。

来自主题: AI技术研报
9807 点击    2025-12-16 16:27
Veo何止生成视频:DeepMind正在用它模拟整个机器人世界

Veo何止生成视频:DeepMind正在用它模拟整个机器人世界

Veo何止生成视频:DeepMind正在用它模拟整个机器人世界

随着通用型(Generalist)机器人策略的发展,机器人能够通过自然语言指令在多种环境中完成各类任务,但这也带来了显著的挑战。

来自主题: AI技术研报
9806 点击    2025-12-16 14:39
全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷

全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷

全网破防,AI「手指难题」翻车逼疯人类!6根手指,暴露Transformer致命缺陷

最近,网友们已经被AI「手指难题」逼疯了。给AI一支六指手,它始终无法正确数出到底有几根手指!说吧AI,你是不是在嘲笑人类?其实这背后,暗藏着Transformer架构的「阿喀琉斯之踵」……

来自主题: AI技术研报
6377 点击    2025-12-16 10:37
Prompt、Context engineering 又向前进化了,3个关键维度+5个具体杠杆 |谷歌

Prompt、Context engineering 又向前进化了,3个关键维度+5个具体杠杆 |谷歌

Prompt、Context engineering 又向前进化了,3个关键维度+5个具体杠杆 |谷歌

我们正处在一个AI Agent(智能体)爆发的时代。从简单的ReAct循环到复杂的Multi-Agent Swarm(多智能体蜂群),新的架构层出不穷。但在这些眼花缭乱的名词背后,开发者的工作往往更像是一门“玄学”,我们凭直觉调整提示词,凭经验增加Agent的数量,却很难说清楚为什么某个架构在特定任务上表现更好。

来自主题: AI技术研报
7913 点击    2025-12-16 09:59
NeurIPS 2025|指哪打哪,可控对抗样本生成器来了!

NeurIPS 2025|指哪打哪,可控对抗样本生成器来了!

NeurIPS 2025|指哪打哪,可控对抗样本生成器来了!

近日,在全球人工智能领域最具影响力的顶级学术会议 NeurIPS(神经信息处理系统大会)上, 清华大学和蚂蚁数科联合提出了一种名为 Dual-Flow 的新型对抗攻击生成框架。

来自主题: AI技术研报
6307 点击    2025-12-16 09:55