当prompt策略遇上分治算法,南加大、微软让大模型炼成「火眼金睛」
当prompt策略遇上分治算法,南加大、微软让大模型炼成「火眼金睛」近年来,大语言模型(LLMs)由于其通用的问题处理能力而引起了大量的关注。现有研究表明,适当的提示设计(prompt enginerring),例如思维链(Chain-of-Thoughts),可以解锁 LLM 在不同领域的强大能力。
搜索
近年来,大语言模型(LLMs)由于其通用的问题处理能力而引起了大量的关注。现有研究表明,适当的提示设计(prompt enginerring),例如思维链(Chain-of-Thoughts),可以解锁 LLM 在不同领域的强大能力。
近期,来自华为诺亚方舟实验室的研究者提出了 DenseSSM,用于增强 SSM 中各层间隐藏信息的流动。通过将浅层隐藏状态有选择地整合到深层中,DenseSSM 保留了对最终输出至关重要的精细信息。
3 月 11 日,零一万物宣布推出基于全导航图的新型向量数据库 「笛卡尔(Descartes)」,已包揽权威榜单 ANN-Benchmarks 6 项数据集评测第一名。
Pika 的音效新功能「Sound Effects」,有大大的惊喜,也有小小的「惊吓」。
在英伟达市值超过2万亿位居全球第三之后,谁能挑战它赖以生存的GPU芯片?
拥抱新技术红利,抢占AI大模型先机?
最近两年的人工智能繁荣,让英伟达凭借GPU登上了芯片之巅。于是包括AMD、Intel、Graphcore、Cerebras和Tenstorrent等在内的传统和新贵芯片企业试图在这个领域将英伟达拉下马。
AI的颠覆性到底在哪里?就仅止于内容生成么?如果我们现在已经被各种应用充斥的生活会因为它而改变,到底会改变成什么样子?
Notion 是生产力工具领域 AI 策略最为激进的一家公司:在 ChatGPT 推出 2 个月后,Notion 就宣布推出 Notion AI,将 GenAI 的体验直接融入到产品,并根据不同需求和场景预设了 prompt,用户只需要空格或“/”即可调用 GPT。
当OepnAI和马斯克连日互杠、Google因文化偏见麻烦缠身、号称抢走GPT-4王位的Claude 3全力瞄准企业级部署的时候,在另一个角落,致力于「为每个人开发服务型AI」的人工智能初创公司Inflection AI,悄悄更新了他们的聊天机器人Pi,以及为之提供支持的新一代大模型Inflection-2.5。
2月19日以来,这款LPU持续成为热点,担当起英伟达GPU挑战者的角色。英伟达的主力芯片H100一卡难求,这给Groq公司带来了机会。
荷兰数据科学家Alex de Vries告诉媒体,他发现人工智能可能具有与加密货币相当的耗电能力,并认为有必要提醒人们“AI也是能源密集型技术”。
微软找到了探索语言生成模型参数的新切入点!
谁是AI界的余承东,敢说敢干,贴着技术最领先的公司打仗?刘庆峰显然算一个。
在人工智能领域,很少有像 Yann LeCun 这样的学者,在 65 岁的年龄还能高度活跃于社交媒体。
在视频理解这一领域,尽管多模态模型在短视频分析上取得了突破性进展,展现出了较强的理解能力,但当它们面对电影级别的长视频时,却显得力不从心。因而,长视频的分析与理解,特别是对于长达数小时电影内容的理解,成为了当前的一个巨大挑战。
在 ChatGPT API 中,系统提示是一项很有亮点的功能,它允许开发人员控制 LLM 输出的「角色」,包括特殊规则和限制。系统提示中的命令比用户输入提示中的命令要有效得多,这让开发人员拥有了更大的发挥空间,而不是像现在使用 ChatGPT 网页应用程序和移动应用程序那样仅仅使用用户提示。
众所周知,开发顶级的文生图(T2I)模型需要大量资源,因此资源有限的个人研究者基本都不可能承担得起,这也成为了 AIGC(人工智能内容生成)社区创新的一大阻碍。同时随着时间的推移,AIGC 社区又能获得持续更新的、更高质量的数据集和更先进的算法。
Sanctuary AI发布了世界第一个能够以人类的速率自主完成任务的机器人,他们通过在远程控制机器人操作获取数据,在虚拟空间训练,完成了这一壮举。
一家大模型初创公司从创立到训练出大模型,要克服怎样的难题?前谷歌科学家离职后创业一年,发文自述算力是训练大模型的难点。
李彦宏参加了CCTV《对话》·开年说的栏目,由于视频时长17分钟,我们用文心一言对内容做了总结。
今天起,大家可以给视频无缝生成音效了——Sound Effects!
马斯克状告OpenAI一案是近期人工智能领域的焦点,马斯克在诉状上这么写到:“小民马斯克,因由小民所创的OpenAI一心只想着捞钱,偏离初心,特此呈上此状以求申冤。
2022年底起,从AI生成文字、代码,到AI生成图片、声音,甚至是视频,AIGC(人工智能生成内容)蓬勃发展。我们一面憧憬着AI大幅提高效率,“因材施教”的个性化教育能得到普及,一面又担忧着AI产生的幻觉及物理性错误,会误导“活到老,学到老”的我们。
北京时间 2 月 22 日,半导体巨头 Arm 更新了 Arm® Neoverse™ 产品路线图,宣布推出两款基于全新第三代 Neoverse IP 构建的全新计算子系统(CSS):Arm Neoverse CSS V3 和 Arm Neoverse CSS N3。
剧本杀是一种广受欢迎的多角色扮演侦探游戏,要求玩家扮演不同的角色。通过阅读角色文本、理解各自的故事、搜集线索、以及逻辑推理,玩家们共同努力揭开谜团。游戏角色通常被分为平民和凶手两大类:平民的目标是找出隐藏在他们中间的凶手,而凶手则尽力隐藏自己的身份,避免被发现。那么,如果让 AI 加入游戏,会产生怎样的新变化呢?
RT-H 在一系列机器人任务中的表现都优于 RT-2。
近期的研究表明,采用扩散模型的规划模块能够同时生成长序列的轨迹规划,这更加符合人类的决策模式。此外,扩散模型在策略表征和数据合成方面也能为现有的决策智能算法提供更优的选择。
作为麻省理工学院(MIT)电气工程与计算机科学系(EECS)副教授,何恺明第一节课讲授了卷积神经网络的基本知识。