
RAGEval:实现实际场景检索增强生成系统(RAG)的“精准诊断”
RAGEval:实现实际场景检索增强生成系统(RAG)的“精准诊断”清华大学NLP实验室联合北京师范大学、中国科学院大学、东北大学等机构的研究人员推出了全新的评测方法 RAGEval,通过快速构建场景化评估数据实现对检索增强生成(RAG)系统的“精准诊断”。
清华大学NLP实验室联合北京师范大学、中国科学院大学、东北大学等机构的研究人员推出了全新的评测方法 RAGEval,通过快速构建场景化评估数据实现对检索增强生成(RAG)系统的“精准诊断”。
中国人民大学高瓴人工智能学院 GeWu 实验室、朝闻道机器人和 TeleAI 最近的合作研究揭示并指出了 “模态时变性”(Modality Temporality)现象,通过捕捉并刻画各个模态质量随物体操纵过程的变化,提升不同信息在具身多模态交互的感知质量,可显著改善精细物体操纵的表现。论文已被 CoRL2024 接收并选为 Oral Presentation。
产品出海试水的好成绩,能否缓解MiniMax实际的焦虑? 近期,MinxMax的AI出海明星产品Talkie爆火,下载量超越同类产品领头羊character.ai。据媒体预测,MiniMax今年收入预计达到7000万美元,而大部分收入来自Talkie的广告。
在Prompt工程领域,规划任务一直以来都是一个巨大的挑战,因为这要求大语言模型(LLMs)不仅能够理解自然语言,还能有效执行复杂推理和应对长时间跨度的操作。
在互联网发展史上,域名交易一直是科技巨头布局的重要一环。今日凌晨,OpenAI 首席执行官 Sam Altman 一如既往地搞“深夜突袭”,在社交媒体平台 X 上发布了一条简短的推文:“chat.com”。随后用户发现,这个域名直接跳转到了 ChatGPT 官方网站。
最近,微软研究院开发的AI²BMD登上了Nature。这是生物分子动力学(MD)模拟中,继经典MD和量子力学之后,首个成功地兼顾了模拟效率和精度的开创性方法!AlphaFold之后,AI在生化科学领域带来的革新仍在继续。
消除激活值(outliers),大语言模型低比特量化有新招了—— 自动化所、清华、港城大团队最近有一篇论文入选了NeurIPS 2024(Oral Presentation),他们针对LLM权重激活量化提出了两种正交变换,有效降低了outliers现象,达到了4-bit的新SOTA。
近日,关于 Open AI 被投企业 Physical Intelligence (PI) 的一系列报道,让人们关注到具身智能大模型引发的机器人时代变革。
今年,化学诺贝尔奖授予了AlphaFold,AI+Science受到空前的关注。人们惊叹于,仅仅是一个蛋白质结构预测模型,就能释放出如此巨大的行业潜力。 就在当下,在第三届中国生物计算大会上,全球规模最大的生命科学基础模型横空出世—— xTrimo V3,参数规模高达2100亿,覆盖蛋白质、DNA、RNA、细胞等七大主流模态。背后玩家正是来自李彦宏孵化创办的百图生科。
基于这一理念,DeepMind团队开发了一个双系统框架,称为Talker-Reasoner,旨在模仿人类的这两种思维模式。