ICLR 2024 | 首个零阶优化深度学习框架,MSU联合LLNL提出DeepZero
ICLR 2024 | 首个零阶优化深度学习框架,MSU联合LLNL提出DeepZero今天介绍一篇密歇根州立大学 (Michigan State University) 和劳伦斯・利弗莫尔国家实验室(Lawrence Livermore National Laboratory)的一篇关于零阶优化深度学习框架的文章 ,本文被 ICLR 2024 接收,代码已开源。
搜索
今天介绍一篇密歇根州立大学 (Michigan State University) 和劳伦斯・利弗莫尔国家实验室(Lawrence Livermore National Laboratory)的一篇关于零阶优化深度学习框架的文章 ,本文被 ICLR 2024 接收,代码已开源。
2023 年,大型语言模型(LLM)以其强大的生成、理解、推理等能力而持续受到高度关注。然而,训练和部署 LLM 非常昂贵,需要大量的计算资源和内存,因此研究人员开发了许多用于加速 LLM 预训练、微调和推理的方法。
2024年,是大模型落地的关键一年,国内外的大厂都在动作频频。但要想打造出首个超级AI原生应用,还是要敢啃技术硬骨头,这已成业内共识。
谷歌&南加大推出最新研究“自我发现”(Self-Discover),重新定义了大模型推理范式。与已成行业标准的思维链(CoT)相比,新方法不仅让模型在面对复杂任务时表现更佳,还把同等效果下的推理成本压缩至1/40。
AGI 创业的时代,对于很多开发者来说,或许不能叫出海,而是生而全球化,借助 AI 的高效率工具,更好去服务全球市场的客户。
“AI驱动”已覆盖AI基础设施、通用大模型、垂直模型及电商、办公等场景化应用。2月7日,阿里巴巴集团发布2024财年第三季度业绩。在“用户为先、AI驱动”的战略执行下,公司核心业务的结构性调整收获初步成效,集团季度收入实现5%的稳定增长。
由华中科技大学光影交互服务技术文旅部重点实验室发起成立的中国人工智能艺术教育协同创新平台召开了首届人工智能艺术长江论坛(ArtI2023)暨中国人工智能艺术教育协同创新平台成立大会,会上重磅发布了《中国人工智能艺术教育白皮书》。
上月初,Perplexity 完成了 B 轮融资,最新估值为 5.2 亿美元,这轮融资由 IVP 领投,NVIDIA 和 Jeff Bezos、NEA、Elad Gil、Nat Friedman 等跟投,Perplexity 的累计融资额超过了 1 亿美元,创下了近年搜索领域初创公司的融资金额纪录。
阿里大模型,再次开源大放送——发布Qwen1.5版本,直接放出六种尺寸。
Meshy-2 的文本转 3D、图像转 3D、文本到纹理效果均有所提升。