AI技术研报-这里有最前沿的人工智能技术解读

速度秒杀GPT-4o！Mistral开源首个22B代码模型破记录，支持80+编程语言

就在刚刚，法国AI初创公司Mistral发布了自家首款代码生成模型Codestral。不仅支持32K长上下文窗口以及80多种编程语言，而且还用22B的参数量取得了与70B的Llama 3相近的性能。目前，已经开放API与IDE插件供用户使用。

来自主题: AI技术研报

10157 点击 2024-05-30 15:16

27岁华裔天才少年对打UC伯克利，首发SEAL大模型排行榜！Claude 3 Opus数学封神

一直以来，UC伯克利团队的LMSYS大模型排行榜，深受AI圈欢迎。如今，最有实力的全新大模型排行榜SEAL诞生，得到AI大佬的转发。它最大的特点是在私有数据上，由专家严格评估，并随时间不断更新数据集和模型。

来自主题: AI技术研报

8794 点击 2024-05-30 15:10

清华天眸芯登Nature封面！世界首个类脑互补视觉芯片问世，或开辟AGI新路

时隔3年，清华团队的研究再次登上Nature封面。刚刚，世界首个类脑互补视觉芯片Tianmouc重磅发布，灵感来源于人类视觉系统。它能以极低带宽和功耗采集图像信息，突破了传统的视觉感知挑战，自如应对开放世界中极端场景难题。

来自主题: AI技术研报

9322 点击 2024-05-30 14:55

用GPT-3.5生成数据集！北大天工等团队图像编辑新SOTA，可精准模拟物理世界场景

高质量图像编辑的方法有很多，但都很难准确表达出真实的物理世界。那么，Edit the World试试。

来自主题: AI技术研报

8821 点击 2024-05-30 10:48

北大北邮的门，机器人开

搜集了328×204条数据，只为让机器人把开门这一件事做到极致。

来自主题: AI技术研报

10930 点击 2024-05-30 10:44

AlphaFold 3不开源，统一生物语言大模型阿里云先开了！

把169861个生物物种数据装进大模型，大模型竟get到了生物中心法则的奥秘——

来自主题: AI技术研报

6988 点击 2024-05-30 10:38

Karpathy新教程爆火，网友抢着送他H100：从头复现GPT-2训练

大神Karpathy已经不满足于用C语言造Llama了！他给自己的最新挑战：复现OpenAI经典成果，从基础版GPT-2开始。

来自主题: AI技术研报

9024 点击 2024-05-30 10:30

搞医学影像，为什么都青睐于CPU？

医学影像，越来越需要AI的帮助了。

来自主题: AI技术研报

9961 点击 2024-05-30 10:14

ACL 2024 | 提升大模型持续学习性能，哈工大、度小满提出共享注意力框架SAPT

在大模型实际部署落地的过程中，如何赋予大模型持续学习的能力是一个至关重要的挑战。这使其能够动态适应新的任务并不断获得新的知识。大模型的持续学习主要面临两个重大挑战，分别是灾难性遗忘和知识迁移。灾难性遗忘是指模型在学习新任务时，会忘记其已掌握的旧任务。知识迁移则涉及到如何在学习新任务时有效地应用旧任务的知识来提升新任务学习的效果。

来自主题: AI技术研报

8881 点击 2024-05-29 16:18

填补AlphaFold3空白，字节跳动提出物理引导的方法让蛋白质动起来

世界是变化的，分子是运动的，从预测静态单一结构走向动态构象分布是揭示蛋白质等生物分子功能的重要一步。探索蛋白质的构象分布，能帮助理解蛋白质与其他分子相互作用的生物过程；识别蛋白质表面下的潜在药物位点，描绘各个亚稳态之间的过渡路径，有助于研究人员设计出具有更强特异性和效力的目标抑制剂和治疗药物。但传统的分子动力学模拟方法昂贵且耗时，难以跨越长的时间尺度，从而观察到重要的生物过程。

来自主题: AI技术研报

10061 点击 2024-05-29 16:05

和GPT-4这些大模型玩狼人杀，人类因太蠢被票死，真·反向图灵测试

这是一次「反向图灵测试」，几个全球最先进的大模型坐在一起，坐着火车唱着歌，但其中混进了人类：而 AI 的任务，是把这个人类揪出来。

来自主题: AI技术研报

8883 点击 2024-05-29 15:59

斯坦福新研究：RAG能帮助LLM更靠谱吗？

斯坦福大学的研究人员研究了RAG系统与无RAG的LLM （如GPT-4）相比在回答问题方面的可靠性。研究表明，RAG系统的事实准确性取决于人工智能模型预先训练的知识强度和参考信息的正确性。

来自主题: AI技术研报

6774 点击 2024-05-29 15:49

马斯克烧60亿美元难题，国内大厂有解？开源MoE模算效率黑马登场，3.7B参数单挑Llama 3-70B

马斯克最近哭穷表示，xAI需要部署10万个H100才能训出Grok 3，影响全球的大模型算力荒怎么解？昨天开源的这款MoE大模型，只用了1/19算力、1/19激活参数，性能就直接全面对标Llama 3-70B！

来自主题: AI技术研报

8059 点击 2024-05-29 15:14

AI来了，玻璃基板概念也火过头了

这一把火，似乎烧得有点太猛烈。

来自主题: AI技术研报

9673 点击 2024-05-29 10:39

国产开源Sora上新：全面支持国产AI算力，可用ReVideo视频编辑，北大-兔展团队出品

北大-兔展联合发起的Sora开源复现计划Open-Sora-Plan，今起可以生成最长约21秒的视频了！

来自主题: AI技术研报

8079 点击 2024-05-28 21:06

多模态CoT思维链架构来了，现已开源｜来自厦大&腾讯优图

多模态大模型，也有自己的CoT思维链了！厦门大学&腾讯优图团队提出一种名为“领唱员（Cantor）”的决策感知多模态思维链架构，无需额外训练，性能大幅提升。

来自主题: AI技术研报

10781 点击 2024-05-28 20:56

AGI渐行渐近，该加速还是要踩刹车？

AGI发展观点多元，技术风险需警惕管理。

来自主题: AI技术研报

9403 点击 2024-05-28 20:46

不影响输出质量还能追踪溯源，「大模型无偏水印」入选ICLR 2024 Spotlight

随着大语言模型（LLM）的快速发展，其在文本生成、翻译、总结等任务中的应用日益广泛。如微软前段时间发布的Copilot+PC允许使用者利用生成式AI进行团队内部实时协同合作，通过内嵌大模型应用，文本内容可能会在多个专业团队内部快速流转，对此，为保证内容的高度专业性和传达效率，同时平衡内容追溯、保证文本质量的LLM水印方法显得极为重要。

来自主题: AI技术研报

7352 点击 2024-05-28 20:05

适应多形态多任务，最强开源机器人学习系统「八爪鱼」诞生

一位优秀的相声演员需要吹拉弹唱样样在行，类似地，一个优秀的机器人模型也应能适应多样化的机器人形态和不同的任务，但目前大多数机器人模型都只能控制一种形态的机器人执行一类任务。现在 Octo（八爪鱼）来了！这个基于 Transformer 的模型堪称当前最强大的开源机器人学习系统，无需额外训练就能完成多样化的机器人操控任务并能在一定程度适应新机器人形态和新任务，就像肢体灵活的八爪鱼。

来自主题: AI技术研报

9575 点击 2024-05-28 20:01

清华、华为等提出iVideoGPT：专攻交互式世界模型

iVideoGPT，满足世界模型高交互性需求。

来自主题: AI技术研报

9752 点击 2024-05-28 14:01

清华接手，YOLOv10问世：性能大幅提升，登上GitHub热榜

相同性能情况下，延迟减少 46%，参数减少 25%。

来自主题: AI技术研报

10149 点击 2024-05-28 13:57

OCR小模型仍有机会！华科等提出VIMTS：零样本视频端到端识别新SOTA

通过提示查询生成模块和任务感知适配器，大一统框架VimTS在不同任务间实现更好的协同作用，显著提升了模型的泛化能力。该方法在多个跨域基准测试中表现优异，尤其在视频级跨域自适应方面，仅使用图像数据就实现了比现有端到端视频识别方法更高的性能。

来自主题: AI技术研报

8890 点击 2024-05-28 13:53

模块化重构LLaVA，替换组件只需添加1-2个文件，开源TinyLLaVA Factory来了

TinyLLaVA 项目由清华大学电子系多媒体信号与智能信息处理实验室 (MSIIP) 吴及教授团队和北京航空航天大学人工智能学院黄雷老师团队联袂打造。清华大学 MSIIP 实验室长期致力于智慧医疗、自然语言处理与知识发现、多模态等研究领域。北航团队长期致力于深度学习、多模态、计算机视觉等研究领域。

来自主题: AI技术研报

9514 点击 2024-05-27 16:24

Transformer大杀器进入蛋白质组学，一文梳理LLM如何助力生命科学领域大变革

科学家们把Transformer模型应用到蛋白质序列数据中，试图在蛋白质组学领域复制LLM的成功。本篇文章能够带你了解蛋白质语言模型（pLM）的起源、发展，以及那些尚待解决的问题。

来自主题: AI技术研报

10282 点击 2024-05-26 14:16

GPT-4被证实具有「人类心智」登Nature！AI比人类更好察觉讽刺和暗示

关于AI是否具有「心智理论」一直存在很多争议。Nature最新研究显示，GPT-4的行为可与人类媲美，甚至能够比人类更好地察觉出讽刺和暗示。虽然GPT-4在判断别人是否「失言」方面，未及人类水平，但这是因为它被不表达观点的护栏所限制，而并非因为其缺乏理解能力。

来自主题: AI技术研报

9436 点击 2024-05-26 14:13

ChatGPT如何「思考」？心理学和神经科学破解AI大模型，Nature发文

美国东北大学的计算机科学家 David Bau 非常熟悉这样一个想法：计算机系统变得如此复杂，以至于很难跟踪它们的运行方式。

来自主题: AI技术研报

9984 点击 2024-05-26 13:53

ICML 2024 | 脱离LoRA架构，训练参数大幅减少，新型傅立叶微调来了

本文介绍了香港科技大学（广州）的一篇关于大模型高效微调（LLM PEFT Fine-tuning）的文章「Parameter-Efficient Fine-Tuning with Discrete Fourier Transform」

来自主题: AI技术研报

10233 点击 2024-05-26 13:50

全面超越DPO：陈丹琦团队提出简单偏好优化SimPO，还炼出最强8B开源模型

为了将大型语言模型（LLM）与人类的价值和意图对齐，学习人类反馈至关重要，这能确保它们是有用的、诚实的和无害的。在对齐 LLM 方面，一种有效的方法是根据人类反馈的强化学习（RLHF）。尽管经典 RLHF 方法的结果很出色，但其多阶段的过程依然带来了一些优化难题，其中涉及到训练一个奖励模型，然后优化一个策略模型来最大化该奖励。

来自主题: AI技术研报

10275 点击 2024-05-26 13:45

鹅厂造了个AI翻译公司：专攻网络小说，自动适配语言风格，真人和GPT-4看了都说好

鹅厂搞了个150多人的“翻译公司”，从老板到员工都是AI智能体！主营业务是翻译网络小说，质量极高，参与评价的读者认为比真人翻译得还要好。而且相比于雇佣真人，用它来翻译文学作品，成本降低了近80倍。

来自主题: AI技术研报

10597 点击 2024-05-25 18:41

可控核聚变新里程碑，AI首次实现双托卡马克3D场全自动优化，登Nature子刊

几十年来，核聚变释放能量的「精妙」过程一直吸引着科学家们的研究兴趣。现在，在普林斯顿等离子体物理实验室（PPPL）中，科学家正借助人工智能，来解决人类面临的紧迫挑战：通过聚变等离子体产生清洁、可靠的能源。与传统的计算机代码不同，机器学习不仅仅是指令列表，它可以分析数据、推断特征之间的关系、从新知识中学习并适应。

来自主题: AI技术研报

4881 点击 2024-05-25 18:27