AI技术研报-这里有最前沿的人工智能技术解读

小模型越级挑战14倍参数大模型，谷歌开启Test-Time端新的Scaling Law

不必增加模型参数，计算资源相同，小模型性能超过比它大14倍的模型！

来自主题: AI技术研报

5259 点击 2024-09-11 13:27

英伟达 JimFan：大模型基准测试像"魔术表演"一样充满漏洞

大模型基准测试还能信吗？

来自主题: AI技术研报

3937 点击 2024-09-11 11:43

GraphRAG + GPT-4o mini 低成本构建 AI 图谱知识库

更好的效果，更低的价格，听起来是不是像梦呓？

来自主题: AI技术研报

8106 点击 2024-09-11 11:37

苹果能引领端侧AI时代吗？

端云结合是长期状态

来自主题: AI技术研报

5812 点击 2024-09-11 09:52

高盛的最新AI洞察：关于“科技的理性繁荣”

今年 6 月，高盛曾发布一份名为《GEN AI: TOO MUCH SPEND, TOO LITTLE BENEFIT?》报告，高盛策略师 Peter Oppenheimer 及其团队近日发布了该系列最新观察，旨在更深入地理解所谓的“科技的理性繁荣”。

来自主题: AI技术研报

9789 点击 2024-09-10 21:37

【AI+知识库】商业化问答场景，让AI回复更准确，一篇专为所有“小白”讲透RAG的实例教程（下篇）

上篇已经详细介绍了AI使用知识库进行时到底发生了什么

来自主题: AI技术研报

10449 点击 2024-09-10 21:34

【AI+知识库】商业化问答场景，让AI回复更准确，一篇专为所有“小白”讲透RAG的实例教程（上篇）

在把AI大模型能力接入微信后，发现很多朋友想要落地在类似客服的应用场景。但目前大模型存在幻觉，一不留神就胡乱回答，这在严肃的商用场景下是不可接受的。

来自主题: AI技术研报

10414 点击 2024-09-10 21:25

走近张大鹏教授：哈工大走出的中国第一位人工智能博士

张大鹏，加拿大皇家科学院院士，加拿大工程院院士，国际电气与电子工程师协会终身会士（IEEE Fellow），国际模式识别协会会士，亚太人工智能学会会士，香港中文大学（深圳）数据科学学院校长学勤讲座教授，深圳市人工智能与机器人研究院（AIRS）计算机视觉研究中心主任，香港中文大学（深圳）—联易融计算机视觉与人工智能联合实验室主任，以及香港理工大学荣誉教授。

来自主题: AI技术研报

8265 点击 2024-09-10 17:25

清华、北大等发布Self-Play强化学习最新综述

本文作者来自于清华大学电子工程系，北京大学人工智能研究院、第四范式、腾讯和清华-伯克利深圳学院。其中第一作者张瑞泽为清华大学硕士，主要研究方向为博弈算法。通讯作者为清华大学电子工程系汪玉教授、于超博后和第四范式研究员黄世宇博士。

来自主题: AI技术研报

8303 点击 2024-09-10 11:48

还在死磕AI咒语？北大-百川搞了个自动提示工程系统PAS

论文共同第一作者郑淼，来自于周泽南领导的百川对齐团队，毕业于北京大学，研究方向包括大语言模型、多模态学习以及计算机视觉等，曾主导MMFlow等开源项目。

来自主题: AI技术研报

5458 点击 2024-09-10 11:40

表格增强生成TAG登场：解锁AI自然语言与数据库的完美结合

与 Text2SQL 或 RAG 不同，TAG 充分利用了数据库系统和 LLM 的功能。

来自主题: AI技术研报

6413 点击 2024-09-10 11:34

还在人工炼丹？自动提示工程指南来了，还带从头实现

人工设计提示词太麻烦了！想过让 LLM 帮你设计用于 LLM 的提示词吗？

来自主题: AI技术研报

6549 点击 2024-09-10 11:29

多数据中心训练：OpenAI 击败谷歌 Infra 的大计（两万字精校）

最近，国外的一份研究报告揭秘了 OpenAI、围绕和谷歌在 AI Infra 层的布局，我们将文章提炼出了核心观点，并进行精校翻译。

来自主题: AI技术研报

10815 点击 2024-09-10 11:24

重磅！DeepMind推出首个AI蛋白质设计模型，亲和力提升300倍！

DeepMind又闷声放大招了！

来自主题: AI技术研报

9000 点击 2024-09-09 21:56

分享一波，近期GitHub上有哪些免费的神级AI项目

之前已经分享过一次AI领域GitHub上那些神级项目，大家可以回顾下这篇文章《震撼来袭，盘点GitHub上那些免费的神级AI项目，建议立刻收藏！》。但是AI发展那么迅速，所以今天继续来给大家盘点一下近期在Github上，AI领域又有哪些神级的项目，最后一个特别推荐。

来自主题: AI技术研报

12122 点击 2024-09-09 21:53

上科大团队带来“双子座”模型，AI筛选药物如何实现“集百家之长”？| 上海国际计算生物学创新大赛

基于已有配体来开发新分子，药效会更好吗？

来自主题: AI技术研报

9194 点击 2024-09-09 21:51

智创未来·价值链接，第五届深圳国际人工智能展开幕

本次展会为广大人工智能企业、高校科研机构搭建技术交流、深化产业合作的重要平台，构筑供需对接、场景牵引的产业生态。

来自主题: AI技术研报

9556 点击 2024-09-09 21:16

DeepMind Alpha家族新成员：AlphaProteo蛋白质设计成功率破纪录

在大模型对话框之外，DeepMind 始终坚持做一些独特的工作。

来自主题: AI技术研报

8111 点击 2024-09-07 17:40

突破传统：AI如何应对心电图中的长尾挑战？

近日，上海交通大学、上海人工智能实验室和上海交通大学附属瑞金医院联合团队发布基于异常检测预训练的心电长尾诊断模型。

来自主题: AI技术研报

6922 点击 2024-09-07 17:35

名场面来了，李云龙、徐江、王多鱼同台飙戏，背后是小红书的AI

近日，来自小红书的技术团队 FireRed，提出了基于大语言模型的 FireRedTTS 语音合成系统，并分享了在短视频配音及聊天式语音对话等应用的一些实践。

来自主题: AI技术研报

6189 点击 2024-09-07 17:32

GPT-4结合SAM2：免训练多模态分割的全新解决方案！| 已开源

免训练多模态分割领域有了新突破！

来自主题: AI技术研报

5500 点击 2024-09-07 17:22

GPT-4o不会数r，被外国小哥原地逼疯！谷歌论文揭秘Transformer「数不到n」

提示工程师Riley Goodside小哥，依然在用「Strawberry里有几个r」折磨大模型们，GPT-4o在无限次PUA后，已经被原地逼疯！相比之下，Claude坚决拒绝PUA，是个大聪明。而谷歌最近的论文也揭示了本质原因：LLM没有足够空间，来存储计数向量。

来自主题: AI技术研报

5758 点击 2024-09-07 17:07

谷歌DeepMind祭出蛋白质设计新AI，有望攻克癌症！蛋白亲和力暴增300倍

今天，DeepMind又发布了Alpha模型家族的新成员，堪称是「专精版」的AlphaFold，专注于设计蛋白质结合剂，将大幅减少所需的实验室工作，提升开发效率。

来自主题: AI技术研报

5696 点击 2024-09-07 11:30

PyTorch官宣：告别CUDA，GPU推理迎来Triton加速新时代

用英伟达的GPU，但可以不用CUDA？PyTorch官宣，借助OpenAI开发的Triton语言编写内核来加速LLM推理，可以实现和CUDA类似甚至更佳的性能。

来自主题: AI技术研报

4766 点击 2024-09-07 11:26

Nature子刊：AI模型测「大脑年龄」，究竟哪些因素会加速大脑衰老？

Nature子刊新研究「大脑时钟」可以判断一个人的大脑衰老速度是否快于实际年龄。结果显示，女性、不平等现象严重的国家和拉丁美洲国家的人，大脑衰老速度更快。

来自主题: AI技术研报

5159 点击 2024-09-07 11:19

用60%成本干80%的事，DeepSeek分享沉淀多年的高性能深度学习架构

硬件发展速度跟不上 AI 需求，就需要精妙的架构和算法。

来自主题: AI技术研报

6700 点击 2024-09-07 11:08

让大模型能听会说，国内机构开源全球首个端到端语音对话模型Mini-Omni

本文出自启元世界多模态算法组，共同一作是来自清华大学的一年级硕士生谢之非与启元世界多模态负责人吴昌桥，研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。

来自主题: AI技术研报

8074 点击 2024-09-07 11:04

ECCV 2024 | 比基准高30%，媲美Gemini 1.5 Pro，基于记忆的视频理解智能体来了

视频理解仍然是计算机视觉和人工智能领域的一个主要挑战。最近在视频理解上的许多进展都是通过端到端地训练多模态大语言模型实现的[1,2,3]。然而，当这些模型处理较长的视频时，内存消耗可能会显著增加，甚至变得难以承受，并且自注意力机制有时可能难以捕捉长程关系 [4]。这些问题阻碍了将端到端模型进一步应用于视频理解。

来自主题: AI技术研报

7999 点击 2024-09-06 11:59

北大领衔，多智能体强化学习研究登上Nature子刊

近日，由北京大学人工智能研究院杨耀东课题组牵头完成的研究成果 ——「大规模多智能体系统的高效强化学习」在人工智能顶级学术期刊 Nature Machine Intelligence 上发表。

来自主题: AI技术研报

7964 点击 2024-09-06 11:55

吴恩达，对 Agentic Workflow 持续兴奋

继吴恩达在今年 4 月红杉 AI 峰会演讲过去之后，Agent > GPT5？吴恩达最新演讲：四种 Agent 设计范式（通俗易懂版）。

来自主题: AI技术研报

6945 点击 2024-09-06 11:48

AI技术研报-这里有最前沿的人工智能技术解读

小模型越级挑战14倍参数大模型，谷歌开启Test-Time端新的Scaling Law

英伟达 JimFan：大模型基准测试像"魔术表演"一样充满漏洞

GraphRAG + GPT-4o mini 低成本构建 AI 图谱知识库

苹果能引领端侧AI时代吗？

高盛的最新AI洞察：关于“科技的理性繁荣”

【AI+知识库】商业化问答场景，让AI回复更准确，一篇专为所有“小白”讲透RAG的实例教程（下篇）

【AI+知识库】商业化问答场景，让AI回复更准确，一篇专为所有“小白”讲透RAG的实例教程（上篇）

走近张大鹏教授：哈工大走出的中国第一位人工智能博士

清华、北大等发布Self-Play强化学习最新综述

还在死磕AI咒语？北大-百川搞了个自动提示工程系统PAS

表格增强生成TAG登场：解锁AI自然语言与数据库的完美结合

还在人工炼丹？自动提示工程指南来了，还带从头实现

多数据中心训练：OpenAI 击败谷歌 Infra 的大计（两万字精校）

重磅！DeepMind推出首个AI蛋白质设计模型，亲和力提升300倍！

分享一波，近期GitHub上有哪些免费的神级AI项目

上科大团队带来“双子座”模型，AI筛选药物如何实现“集百家之长”？| 上海国际计算生物学创新大赛

智创未来·价值链接，第五届深圳国际人工智能展开幕

DeepMind Alpha家族新成员：AlphaProteo蛋白质设计成功率破纪录

突破传统：AI如何应对心电图中的长尾挑战？

名场面来了，李云龙、徐江、王多鱼同台飙戏，背后是小红书的AI

GPT-4结合SAM2：免训练多模态分割的全新解决方案！| 已开源

GPT-4o不会数r，被外国小哥原地逼疯！ 谷歌论文揭秘Transformer「数不到n」

谷歌DeepMind祭出蛋白质设计新AI，有望攻克癌症！蛋白亲和力暴增300倍

PyTorch官宣：告别CUDA，GPU推理迎来Triton加速新时代

Nature子刊：AI模型测「大脑年龄」，究竟哪些因素会加速大脑衰老？

用60%成本干80%的事，DeepSeek分享沉淀多年的高性能深度学习架构

让大模型能听会说，国内机构开源全球首个端到端语音对话模型Mini-Omni

ECCV 2024 | 比基准高30%，媲美Gemini 1.5 Pro，基于记忆的视频理解智能体来了

北大领衔，多智能体强化学习研究登上Nature子刊

吴恩达，对 Agentic Workflow 持续兴奋

GPT-4o不会数r，被外国小哥原地逼疯！谷歌论文揭秘Transformer「数不到n」