AI技术研报-这里有最前沿的人工智能技术解读

CVPR 2025 Oral | 多模态交互新基准OpenING，新版GPT-4o杀疯了？

文生图 or 图生文？不必纠结了！

来自主题: AI技术研报

9766 点击 2025-04-06 16:37

大语言模型变身软体机器人设计「自然选择器」，GPT、Gemini、Grok争做最佳

大型语言模型 (LLM) 在软体机器人设计领域展现出了令人振奋的应用潜力。

来自主题: AI技术研报

9742 点击 2025-04-06 16:27

CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo

本文介绍了 FoundationStereo，一种用于立体深度估计的基础模型，旨在实现强大的零样本泛化能力。

来自主题: AI技术研报

9228 点击 2025-04-06 16:13

从0到1玩转MCP：AI的「万能插头」，代码手把手教你！

在人工智能飞速发展的今天，LLM 的能力令人叹为观止，但其局限性也日益凸显 —— 它们往往被困于训练数据的「孤岛」，无法直接触及实时信息或外部工具。

来自主题: AI技术研报

9448 点击 2025-04-06 15:58

中科大华为发布生成式推荐大模型，昇腾NPU可部署，背后认知一同公开

推荐大模型也可生成式，并且首次在国产昇腾NPU上成功部署！

来自主题: AI技术研报

10442 点击 2025-04-06 15:46

AI也有人格面具，竟会讨好人类？大模型的「小心思」正在影响人类判断

最新研究发现，LLM在面对人格测试时，会像人一样「塑造形象」，提升外向性和宜人性得分。AI的讨好倾向，可能导致错误的回复，需要引起警惕。

来自主题: AI技术研报

6798 点击 2025-04-06 15:11

LLM「想太多」有救了！高效推理让大模型思考过程更精简

大模型虽然推理能力增强，却常常「想太多」，回答简单问题也冗长复杂。Rice大学的华人研究者提出高效推理概念，探究了如何帮助LLM告别「过度思考」，提升推理效率。

来自主题: AI技术研报

7324 点击 2025-04-06 14:59

250多篇论文，上海AI Lab综述推理大模型高效思考

最近，像 OpenAI o1/o3、DeepSeek-R1 这样的大型推理模型（Large Reasoning Models，LRMs）通过加长「思考链」（Chain-of-Thought，CoT）在推理任务上表现惊艳。

来自主题: AI技术研报

9850 点击 2025-04-05 14:45

思维链不可靠：Anthropic曝出大模型「诚信」问题，说一套做一套

AI 可能「借鉴」了什么参考内容，但压根不提。

来自主题: AI技术研报

7627 点击 2025-04-05 14:33

Multi-Token突破注意力机制瓶颈，Meta发明了一种很新的Transformer

Attention 还在卷自己。

来自主题: AI技术研报

9412 点击 2025-04-05 14:17

多榜单登顶！华为 & 哈工深团队提出 AdaReTaKe，突破长视频理解极限

随着视频内容的重要性日益提升，如何处理理解长视频成为多模态大模型面临的关键挑战。长视频理解能力，对于智慧安防、智能体的长期记忆以及多模态深度思考能力有着重要价值。

来自主题: AI技术研报

8131 点击 2025-04-05 14:07

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！

DeepSeek新论文来了！在清华研究者共同发布的研究中，他们发现了奖励模型推理时Scaling的全新方法。DeepSeek R2，果然近了。

来自主题: AI技术研报

10125 点击 2025-04-05 01:14

从裁员到年薪百万：程序员靠RAG技术逆袭的“核心密码”

作为一名从业七年的程序员，最近听到很多程序员朋友都喜提了n+1裁员大礼包。

来自主题: AI技术研报

8543 点击 2025-04-04 17:36

GPU租赁市场调研

前几天有朋友还在问我GPU租赁市场的情况，正好SemiAnalysis出了这篇文章：GPU云ClusterMA评级系统 | GPU租用指南。

来自主题: AI技术研报

9460 点击 2025-04-04 16:23

当LLM遇到结构化思维困境，这个70年前的心理学框架竟成为救星 | 最新

当大多数AI Agent仍在挣扎于结构化推理能力不足的困境时，本文带来了一个来自认知科学领域的突破性解决方案。

来自主题: AI技术研报

8962 点击 2025-04-04 15:50

GPT-4.5创造力比GPT-4o弱！浙大上海AI Lab发布新基准，寻找多模态创造力天花板

近来风头正盛的GPT-4.5，不仅在日常问答中展现出惊人的上下文连贯性，在设计、咨询等需要高度创造力的任务中也大放异彩。

来自主题: AI技术研报

10066 点击 2025-04-04 15:22

移动通信领域有了新SOTA：华为出品，精准预测用户行为

专门解决电信行业用户行为建模的难题。

来自主题: AI技术研报

6976 点击 2025-04-04 14:42

o3狂烧3万美金解一题，反被AGI榜单除名！试错1024次不如10岁小孩哥4分钟

OpenAI o3推理成本从3000美元飙至3万美元，暴增10倍。o3-high靠暴力试错生成4300万字解题，却被ARC-AGI「除名」。

来自主题: AI技术研报

8820 点击 2025-04-04 14:21

浙大校友重磅革新Transformer！多token注意力让LLM开挂，错误率归0

简单的任务，传统的Transformer却错误率极高。Meta FAIR团队重磅推出多token注意力机制（MTA），精准捕捉复杂信息，带来模型性能飞升！

来自主题: AI技术研报

7727 点击 2025-04-04 14:14

ICLR 2025 Spotlight | 参数高效微调新范式！上海交大联合上海AI Lab推出参数冗余微调算法

低秩适配器（LoRA）能够在有监督微调中以约 5% 的可训练参数实现全参数微调 90% 性能。

来自主题: AI技术研报

10008 点击 2025-04-04 14:03

DeepMind闭关修炼「我的世界」，自学成才挖钻登Nature！人类玩家瑟瑟发抖

谷歌DeepMind研发的DreamerV3实现重大突破：无需任何人类数据，通过强化学习与「世界模型」，自主完成《我的世界》中极具挑战的钻石收集任务。该成果被视为通往AGI的一大步，并已登上Nature。

来自主题: AI技术研报

8899 点击 2025-04-03 16:56

近千个反现实视频构建了「不可能」基准，哪个AI不服？来战！

随着人工智能合成视频（AIGC）技术的飞速发展，我们正步入一个由 AI 主导的视频创作时代。

来自主题: AI技术研报

8756 点击 2025-04-03 16:33

Claude 3.5首战复现21%顶会论文，人类博士无法取代，OpenAI：AI全是草台班子

自己「打脸」自己？

来自主题: AI技术研报

10874 点击 2025-04-03 16:23

AMD GPU性能暴涨7倍，优化算法首次开源！高效MoE支持任意专家数量

通过完全启用并发多块执行，支持任意专家数量（MAX_EXPERT_NUMBER==256），并积极利用共享内存（5kB LDS）和寄存器（52 VGPRs，48 SGPRs），MoE Align & Sort逻辑被精心设计，实现了显著的性能提升：A100提升3倍，H200提升3倍，MI100提升10倍，MI300X/MI300A提升7倍...

来自主题: AI技术研报

5505 点击 2025-04-03 16:14