AI资讯新闻榜单内容搜索-Arc

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Arc
Search版o1:推理过程会主动查资料,整体性能优于人类专家,清华人大出品

Search版o1:推理过程会主动查资料,整体性能优于人类专家,清华人大出品

Search版o1:推理过程会主动查资料,整体性能优于人类专家,清华人大出品

一个新框架,让Qwen版o1成绩暴涨: 在博士级别的科学问答、数学、代码能力的11项评测中,能力显著提升,拿下10个第一! 这就是人大、清华联手推出的最新「Agentic搜索增强推理模型框架」Search-o1的特别之处。

来自主题: AI技术研报
6184 点击    2025-01-18 15:00
Transformer作者初创重磅发布Transformer²!AI模型活了,动态调整自己权重

Transformer作者初创重磅发布Transformer²!AI模型活了,动态调整自己权重

Transformer作者初创重磅发布Transformer²!AI模型活了,动态调整自己权重

Sakana AI发布了Transformer²新方法,通过奇异值微调和权重自适应策略,提高了LLM的泛化和自适应能力。新方法在文本任务上优于LoRA;即便是从未见过的任务,比如MATH、HumanEval和ARC-Challenge等,性能也都取得了提升。

来自主题: AI技术研报
8348 点击    2025-01-16 10:23
科研界的"哥白尼时刻"已到来!AMD的Agent Laboratory能自己查文献、写论文、整代码

科研界的"哥白尼时刻"已到来!AMD的Agent Laboratory能自己查文献、写论文、整代码

科研界的"哥白尼时刻"已到来!AMD的Agent Laboratory能自己查文献、写论文、整代码

发表于昨天的论文《Agent Laboratory: Using LLM Agents as Research Assistants》对于科研界具有划时代意义,过去几周才能完成的科研任务现在仅需20分钟到一两个小时左右(不同LLM),花费2-13个美金的Token即可完成!

来自主题: AI技术研报
3158 点击    2025-01-10 11:13
检验创业想法是否靠谱的AI神器!洞察市场机会,定位用户痛点,pmf验证…

检验创业想法是否靠谱的AI神器!洞察市场机会,定位用户痛点,pmf验证…

检验创业想法是否靠谱的AI神器!洞察市场机会,定位用户痛点,pmf验证…

Reddit 作为一个充满活力的全球社区平台,里面有非常丰富的兴趣小组和只有想不到没有找不到的话题,类似国内的百度贴吧、豆瓣,我们不仅可以从中发现灵感、验证想法,还可以找到对应的客户,非常适合验证创业想法。

来自主题: AI资讯
6580 点击    2024-12-30 10:30
o3挑战ARC-AGI,遇见大网格就懵圈?英国工程师:ARC-AGI不适合大模型

o3挑战ARC-AGI,遇见大网格就懵圈?英国工程师:ARC-AGI不适合大模型

o3挑战ARC-AGI,遇见大网格就懵圈?英国工程师:ARC-AGI不适合大模型

o3在超难推理任务ARC-AGI上的成绩,属实给人类带来了不少震撼。 但有人专门研究了它不会做的题之后,有了更有趣的发现—— o3之所以不会做这些题,原因可能不是因为太难,而是题目的规模太大了。

来自主题: AI资讯
6476 点击    2024-12-26 15:49
Meta建了一所学校,教AI“情商”

Meta建了一所学校,教AI“情商”

Meta建了一所学校,教AI“情商”

AI缺乏情商,需设计训练数据提高社交认知能力。 当你觉得AI不够好用时,很可能是因为它还不够“懂”你。

来自主题: AI资讯
6277 点击    2024-12-25 09:05
某机构:JSON 输出会让 AI 变笨!大佬:是你们太菜了

某机构:JSON 输出会让 AI 变笨!大佬:是你们太菜了

某机构:JSON 输出会让 AI 变笨!大佬:是你们太菜了

近期,知名研究机构 Appier AI Research 和国立台湾大学,联合发表了一篇论文

来自主题: AI技术研报
6085 点击    2024-12-23 15:31