
张鹏对话无问芯穹夏立雪:中国的Scaling Law是场景优势,异构算力解决大模型落地难题
张鹏对话无问芯穹夏立雪:中国的Scaling Law是场景优势,异构算力解决大模型落地难题CUDA 是英伟达的壁垒, 推理场景是算力未来的重点
CUDA 是英伟达的壁垒, 推理场景是算力未来的重点
提出图像生成新范式,从预测下一个token变成预测下一级分辨率,效果超越Sora核心组件Diffusion Transformer(DiT
在开源社区中把GPT-4+Dall·E 3能⼒整合起来的模型该有多强?
史上最全的「数学人工智能资源」清单出炉了。 陶哲轩,信奉AI将在2026年成为人类数学家的重要合著者,一早便转发了这份清单。
以神经网络为基础的深度学习技术已经在诸多应用领域取得了有效成果
通过这项技术,能使transformer大模型在有限的计算资源 条件下,处理无限长度的输入。
风格化图像生成,也常称为风格迁移,其目标是生成与参考图像风格一致的图像。
自从 2023 年 11 月 Grok 首次亮相以来,马斯克的 xAI 正在大模型领域不断取得进步,向 OpenAI 等先行者发起进攻。在 Grok-1 开源后不到一个月,xAI 的首个多模态模型就问世了。
人工智能模型在对话说服力方面表现如何?
液体都有“智能”、可编程了? 最近,一种被称为“智能"液体的多功能可编程的新型超材料——Metafluid,登上了Nature。
120秒超长AI视频模型来了!不但比Sora长,而且免费开源
新一代视觉生成范式「VAR: Visual Auto Regressive」视觉自回归来了
自 2020 年神经辐射场 (Neural Radiance Field, NeRF) 提出以来,将隐式表达推上了一个新的高度。作为当前最前沿的技术之一
近,来自澳大利亚蒙纳士大学、蚂蚁集团、IBM 研究院等机构的研究人员探索了模型重编程 (model reprogramming) 在大语言模型 (LLMs) 上应用,并提出了一个全新的视角
随着大模型的参数量日益增长,微调整个模型的开销逐渐变得难以接受。 为此,北京大学的研究团队提出了一种名为 PiSSA 的参数高效微调方法,在主流数据集上都超过了目前广泛使用的 LoRA 的微调效果。
谷歌又放大招了,发布下一代 Transformer 模型 Infini-Transformer。
第一个针对「Segment Anything」大模型的域适应策略来了!相关论文已被CVPR 2024 接收。
在社交活动中,大语言模型既可以是你的合作伙伴(partner),也可以成为你的导师(mentor)。在人类的社交活动中,为了更有效地在工作和生活中与他人沟通,需要一定的社交技能,比如解决冲突。
「Real men program in C.」 众所周知,大语言模型还在快速发展,应该有很多可以优化的地方。我用纯 C 语言来写,是不是能优化一大截? 也许很多人开过这样的脑洞,现在有大佬实现了。
大语言模型的「逆转诅咒」,被解开了。近日,来自Meta FAIR的研究人员推出了反向训练大法,让模型从反方向上学到了事实之间的逻辑,终于改进了这个困扰人们已久的问题。
Stability AI推出Stable LM 2 12B模型,作为其新模型系列的进一步升级,该模型基于七种语言的2万亿Token进行训练,拥有更多参数和更强性能,据称在某些基准下能超越Llama 2 70B。
困扰全世界几个世纪的「臭名昭著」谜题——费马大定理,或将被AI攻克?一位英国数学家宣布,即将启动用Lean重现费马大定理证明过程的项目,将100页证明变成代码。从此,世界顶尖数学难题的证明将成为「众包」项目,你我都可以进去添几笔。
训大模型的方法可能要被革新了!AI大神Karpathy发布的新项目仅用1000行的C语言训完GPT-2,而不再依赖庞大的GPT-2库。他本人预告,即将上线新课。
距离AI「杀死」搜索引擎,到底还差几步?
行业狂飙之际,版权利益争夺渐酣今年2月,美国OpenAI公司发布了首个视频生成模型“Sora”,再次掀起全球追进生成式人工智能的热潮。然而,据《纽约时报》近日报道,科技巨头OpenAI和谷歌被指涉嫌使用YouTube视频的转录文本来训练其人工智能模型,这一行为可能侵犯了YouTube创作者的版权。
AI还教人烹饪毒鹅膏 如今,AI技术正在被广泛地用于我们生活中的方方面面,但是有科学家提醒大家,目前还是先不要把你的健康托付给一些APP,因为它们很有可能会犯错,甚至有可能要了人的命。
宁可犯错,不愿错过。 以国内大模型初创企业主要投资方的身份,腾讯和阿里再次站在了“金主爸爸”的位置。
不是大模型变坏了,是用大模型的人变坏了。
小孩子都会的脑筋急转弯推理题,GPT-4和Claude 3做不出?国外一位开发者小哥坚称这一观点,认为GPT模型在训练集外毫无推理能力,无法实现AGI,甚至悬赏1万美元,发起比赛。然而,他当天就被光速打脸了!网友用高能的prompt,让GPT-4和Claude 3几乎达到百分百的正确率。
毫无疑问,数学家的工作方式,正在被AI颠覆!陶哲轩转发的这期美国数学学会通报,大咖云集,星光璀璨。针对AI改变数学的议题,他们中有降临派,也有怀疑论者。而陶哲轩也直接高呼:这个领域太快了,现在我没发表的论文已经不够看了!