AI资讯新闻榜单内容搜索-机器学习

告别Transformer，重塑机器学习范式：上海交大首个「类人脑」大模型诞生

当前 GPT 类大语言模型的表征和处理机制，仅在输入和输出接口层面对语言元素保持可解释的语义映射。相比之下，人类大脑直接在分布式的皮层区域中编码语义，如果将其视为一个语言处理系统，它本身就是一个在全局上可解释的「超大模型」。

来自主题: AI技术研报

7921 点击 2025-08-14 11:11

北大、蚂蚁三个维度解构高效隐私保护机器学习：前沿进展+发展方向

在数据隐私日益重要的 AI 时代，如何在保护用户数据的同时高效运行机器学习模型，成为了学术界和工业界共同关注的难题。

来自主题: AI技术研报

6706 点击 2025-08-06 11:53

AI 智能体，让每个人可以像科学家一样工作和思考

科研是 AI 最早实现广泛落地的行业之一。在 ChatGPT 掀起这一轮生成式 AI 热潮之前，甚至可以追溯到上一轮由机器学习主导的技术浪潮中，AI 就已被用于气候模型参数校准、分子动力学模拟加速等科研任务。尤其在 2018 年前后，DeepMind 推出的 AlphaFold 在蛋白质结构预测方面实现突破，不仅引发了医药行业的技术革命，更被《自然》杂志评价为「解决了生物学五十年来的重大挑战」。

来自主题: AI资讯

7748 点击 2025-07-31 11:58

一个“蠢问题”改写模型规则！Anthropic联创亲曝：瞄准Claude 5开发爆款应用，最强模型的价值会让人忽略成本负担

Anthropic 联合创始人 Jared Kaplan 是一名理论物理学家，研究兴趣广泛，涉及有效场论、粒子物理、宇宙学、散射振幅以及共形场论等。过去几年，他还与物理学家、计算机科学家们合作开展机器学习研究，包括神经模型以及 GPT-3 语言模型的 Scaling Law。

来自主题: AI资讯

7604 点击 2025-07-31 11:05

ICML 2025 | CoTo：让LoRA训练「渐入佳境」，模型融合、剪枝样样精通

还在为 LoRA 训练不稳定、模型融合效果差、剪枝后性能大降而烦恼吗？来自香港城市大学、南方科技大学、浙江大学等机构的研究者们提出了一种简单的渐进式训练策略，CoTo，通过在训练早期随机失活一部分适配器，并逐渐提高其激活概率，有效缓解了层级不均衡问题，并显著增强了模型在多任务融合和剪枝等操作上的鲁棒性和有效性。该工作已被机器学习顶会 ICML 2025 接收。

来自主题: AI技术研报

7127 点击 2025-07-27 13:12