AI资讯新闻榜单内容搜索-模型训练

让AI像人类一样认知真实世界！UCLA谷歌强强联手，长时记忆+3D空间理解超越基线16.5%

想象一下，你在一个陌生的房子里寻找合适的礼物盒包装泰迪熊，需要记住每个房间里的物品特征、位置关系，并根据反馈调整行动。

来自主题: AI技术研报

7185 点击 2025-06-04 10:08

最近AI圈子里有两个特别有意思的项目，一个是谷歌DeepMind的AlphaEvolve，另一个是UBC大学的Darwin Gödel Machine（简称DGM）。

来自主题: AI技术研报

6609 点击 2025-06-04 09:52

在数字化时代，视觉信息在知识传递和决策支持中的重要性日益凸显。然而，传统的检索增强型生成（RAG）方法在处理视觉丰富信息时面临着诸多挑战。一方面，传统的基于文本的方法无法处理视觉相关数据；另一方面，现有的视觉 RAG 方法受限于定义的固定流程，难以有效激活模型的推理能力。

来自主题: AI技术研报

7529 点击 2025-06-04 09:28

发展教育大模型需要新的数据和评估体系！北京理工大学高扬老师团队推出EduBench，是首个专为教育场景打造的综合评估基准，涵盖9大教育场景、12个多视角评估维度、超4000个教育情境。通过多维度评估指标体系和人工标注一致性计算，确保评估可靠性，助力教育大模型发展，推动教育智能化。

来自主题: AI技术研报

8643 点击 2025-06-03 16:47

首个专为ALLMs（音频大语言模型）设计的多维度可信度评估基准来了。

来自主题: AI技术研报

8761 点击 2025-06-03 15:11

人类的思维是非透明的，没有继承的记忆，因此需要通过语言交流的环境来学习。人类的知识传递长期依赖符号语言：从文字、数学公式到编程代码，我们通过符号系统将知识编码、解码。但这种方式存在天然瓶颈，比如信息冗余、效率低下等。

来自主题: AI技术研报

8421 点击 2025-06-03 14:57

端午节前OpenAI发布了o3/o4-mini模型的Function Calling指南，这份指南可以说是目前网上最硬核权威的大模型函数调用实战手册，没有之一。

来自主题: AI技术研报

7757 点击 2025-06-03 12:19

大语言模型（LLMs）作为由复杂算法和海量数据驱动的产物，会不会“无意中”学会了某些类似人类进化出来的行为模式？这听起来或许有些大胆，但背后的推理其实并不难理解：

来自主题: AI资讯

5127 点击 2025-06-03 10:57

新加坡国立大学等机构的研究者们通过元能力对齐的训练框架，模仿人类推理的心理学原理，将演绎、归纳与溯因能力融入模型训练。实验结果显示，这一方法不仅提升了模型在数学与编程任务上的性能，还展现出跨领域的可扩展性。

来自主题: AI技术研报

9723 点击 2025-06-03 10:36

杯子在我的左边还是右边？

来自主题: AI技术研报

7438 点击 2025-06-03 10:31