首个无师自通、泛化使用各种家具家电的具身三维图文大模型系统
首个无师自通、泛化使用各种家具家电的具身三维图文大模型系统前脚来自斯坦福的会用锅的机器人刚刚登场,后脚又来了个会用咖啡机的机器人 Figure-01 。
搜索
前脚来自斯坦福的会用锅的机器人刚刚登场,后脚又来了个会用咖啡机的机器人 Figure-01 。
不知不觉,LangChain 已经问世一年了。作为一个开源框架,LangChain 提供了构建基于大模型的 AI 应用所需的模块和工具,大大降低了 AI 应用开发的门槛,使得任何人都可以基于 GPT-4 等大模型构建自己的创意应用。
2023 年年底,《纽约时报》拿出了强有力的证据起诉微软与 OpenAI。根据多家科技公司的首席法律顾问 Cecilia Ziniti 的分析,《纽约时报》获胜的概率极大。
从此在钉钉上,你只需要给出指令,其他事情交给「AI 助理」来办就可以了。
Web3市场也有乙女游戏了。霸总、甜宠,虐恋、复仇,每集不到5分钟的各种爽剧,让观众直呼“狗血、土味又上头”。2023年,这类主打节奏快、反转多的短剧在短视频平台上创造出一个200亿元的内容市场,其中有一半内容主打女频。
12月16日,我们在全新亮相的751图书馆见到了费俊。当天的分享会主题为“创作的未来”,是首届「751科技文化节」中艺术与AIGC从业者们的对话环节。
今年的CES大会上,NVIDIA依然给全世界震撼不停。正式下场AI PC,性能直接飙涨60倍;40系SUPER显卡,已全面碾压上代旗舰;AI NPC甚至能跟屏幕外的玩家直接开启实时对话,这也太科幻了……
大模型如火如荼发展的一年,也为教育科技带来很大的想象空间。1月5日,国内首个教育智适应多模态大模型发布。大模型革新教育,同样能够做到千人千面,为学生提供个性化的学习服务。
近日,艾伦人工智能研究所发布了Unified-IO 2,——第一代Unified-IO曾预测了GPT-4等模型的能力,所以我们可以从新一代的模型中一窥GPT-5的真面目
这项综述性研究报告批判性地分析了生成式AI的发展现状和发展方向,并探究了谷歌Gemini和备受期待的OpenAI Q*等创新成果将如何改变多个领域的实际应用。
2023年可以被定义成国内“AI元年”,在一级市场并不高涨的情绪中,AI创业公司充当了挑起一众投资人荷尔蒙的角色。而在这些AI创业公司中,清华博士,或者统称为名校博士创业者几乎占据AI创业行列半壁江山。
过去一年,我们不光看到科大讯飞、网易有道等老牌科技企业推出学习机、词典笔等传统教育硬件,并且还看到小度科技、猿辅导等「新势力」推出学习手机、墨水屏学习平板等新兴教育硬件产品。虽然这些产品的形态各异,但从功能维度来看,这些产品有很强的趋同性。
临近年底(按农历算),各种APP都推出了自己的年度总结,想必各位已经了解到了自己的属性了吧?
在本篇文章中,适道将综合Coatue、a16z、Radical Ventures等明星VC预言;The Information、FT、Sifted汇集的投资者预言;以及Greg Brockman等行业大佬的观点,试着归纳接下来一年中AI的发展脉络。
“AI会塑造现世的魔王,而被魔王上身的人自己也不知道”。陈伟星如是形容困在“信息茧房”中的人。
prompt——这是网易有道公布的2023年度词汇。过去一年,带火prompt一词的大模型,在各行各业掀起波澜。其中在教育领域,大模型的影响正在逐渐显现。
近年来,随着Transformer模型的大规模发展和应用,模型大小每两年平均增长240倍,GPT-3等大模型的参数增长已经超过了GPU内存的增长。在大算力激增的需求下,越来越多行业人士认识到,新的计算架构或许才是算力破局的关键。
刚刚过去的2023年,被称作是人工智能时代AI元年。毋庸置疑,AI已经在一点点改变学习性质和教育模式。
微软和 AI 初创公司 Inworld 达成合作,将引入基于 AI 的“角色引擎”及“Copilot 助理”,为开发者提供一系列开发工具,以创建更真实、动态的 NPC。
谷歌旗下AI制药公司与全球两大制药巨头达成合作,标志着人工智能+生物医疗进入新的历史阶段。当地时间周一,Isomorphic Labs宣布与礼来和诺华签署了首个制药合作伙伴关系合同,将AI技术用于新药物的发现。
2023年,人工智能技术的创新与应用突飞猛进,ChatGPT等大模型爆火出圈,AI热潮席卷全球。
一些迹象显示,Claude正在流失付费用户。进入2024年,越来越多的用户发现Claude变得很难用。
22倍加速还不够,再来提升46%,而且方法直接开源!这就是开源社区改进MIT爆火项目StreamingLLM的最新成果。
上周斯坦福炒虾机器人炸场之后,又火了一个煮咖啡机器人。
无需微调,只要四行代码就能让大模型窗口长度暴增,最高可增加3倍!而且是“即插即用”,理论上可以适配任意大模型,目前已在Mistral和Llama2上试验成功。
如何从一段视频中找出感兴趣的片段?时序行为检测(Temporal Action Localization,TAL)是一种常用方法。过去TAL中的建模是片段甚至实例级的,而现在只要视频里的一帧就能实现,效果媲美全监督。
仅需一个任务描述,即可一键分割所有图片!
Vista-LLaMA 在处理长视频内容方面的显著优势,为视频分析领域带来了新的解决框架。
不久之前,《纽约时报》指控 OpenAI 涉嫌违规使用其内容用于人工智能开发的事件引起了社区极大的关注与讨论。