PyTorch官方认可!斯坦福博士新作:长上下文LLM推理速度提8倍
PyTorch官方认可!斯坦福博士新作:长上下文LLM推理速度提8倍这两天,FlashAttention团队推出了新作: 一种给Transformer架构大模型推理加速的新方法,最高可提速8倍。 该方法尤其造福于长上下文LLM,在64k长度的CodeLlama-34B上通过了验证
这两天,FlashAttention团队推出了新作: 一种给Transformer架构大模型推理加速的新方法,最高可提速8倍。 该方法尤其造福于长上下文LLM,在64k长度的CodeLlama-34B上通过了验证
ChatGPT之类的AI编码工具来势汹汹,Stack Overflow又裁员了!不过,普林斯顿和芝大竟发现,面对真实世界GitHub问题,GPT-4的解决率竟是0%。
Zilliz和 Dify.AI 达成合作,Zilliz 旗下的产品 Zilliz Cloud、Milvus 与开源 LLMOps 平台 Dify 社区版进行了深度集成。
国内领先的人工智能大模型公司面壁智能又放大招,联合清华大学 NLP 实验室共同研发并推出大模型「超级英雄」——XAgent。
英伟达、华盛顿大学等机构提出的Humanoid Agents,行为竟如此接近人类!累了要休息,孤独要找人陪,发泄怒火时会跑步或冥想。
早就听说笔记本PC就能跑生成式AI,我们也试了试,看看笔记本仅借助CPU能不能在本地自己写代码、自己作图?
Agent 的思路为我们带来了 Software 2.0 的图景:LLM 作为推理引擎能力不断增强,AI Agent 框架为其提供结构化思考的方法,软件生产进入“3D 打印”时代
微调LLM需谨慎,用良性数据、微调后角色扮演等都会破坏LLM对齐性能!学习调大了还会继续提高风险!
清华大学自动化系汪小我团队在 Nature Communications 期刊发表论文,研究提出了一种将专家知识与大数据学习相融合的合成启动子人工智能辅助设计方法——DeepSEED
悟道·天鹰Aquila大语言模型系列全面升级到Aquila2,并再添 340亿参数(34B)重量级新成员,带来当前最强的开源中英双语大模型。
在自己的系统上部署大型语言模型可能会出人意料地简单 - 前提是你拥有正确的工具。以下是如何在桌面上使用像Meta的新Code Llama这样的LLM的方法。
人工智能价值对齐(AI alignment)是关涉AI控制与AI安全的重要问题,随着人工智能的飞速发展和广泛应用,人工智能可能带来的风险和挑战也日益凸显,由此,“价值对齐”问题开始被广泛讨论和提及。
复旦大学马剑鹏教授领衔的科研团队开发的新型计算方法OPUS-DSD,不但能够成功地解析冷冻电子显微镜(Cryo-EM)结构解析技术中因传统方法无法分辨而缺损的生物大分子结构,并且高效精准地分辨出柔性结构域在受测样品中的构象分布。
研究人员已经找到了解决数字图像准确性和美观性之间基本权衡的方法
GPT-4V风头正盛,LLaVA-1.5就来踢馆了!它不仅在11个基准测试上都实现了SOTA,而且13B模型的训练,只用8个A100就可以在1天内完成。
在大语言模型内部,是否有一个世界模型?LLM是否具有空间感?并且在多个时空尺度上都是如此? 最近,MIT的几位研究者发现,答案是肯定的!
悄无声息,羊驼家族“最强版”来了! 与GPT-4持平,上下文长度达3.2万token的LLaMA 2 Long,正式登场。
矩阵乘法已经成为机器学习模型的构建模块,是各种强大 AI 技术的基础,了解其执行方式必然有助于我们更深入地理解这个 AI 以及这个日趋智能化的世界。
艾瑞发布《AIGC系列报告——中国AIGC产业全景报告》,作为AIGC系列首发,报告将展开对AIGC产业的全景洞察、探究生成式AI技术对数字产业的影响变化
有效的压缩就是要找到模式,在不丢失信息的情况下将数据变小。当一种算法或模型能准确猜出序列中的下一条数据时,就表明它善于发现这些模式。
基于扩散原理的模型已经成为生成式图像AI的主流。Max Tegmark团队新提出的基于于带电粒子分布过程的模型,可能会带来更优的效果。而随着更多物理模型在生成式AI中被深度挖掘,某种隐藏的统一性正在渐渐浮现。
在科技巨头强劲推动、创业者快速拥抱以及大企业的积极引入下,AI Agent彻底火爆了。并且与之前LLM缺乏落地的境况不同,这次AI Agent再也不是纸上谈兵,目前已经有很多公司推出了Agent项目及相关产品。
美国国立卫生研究院的一项研究显示,人工智能(AI)和机器学习(ML)在检测和诊断多囊卵巢综合症(PCOS)方面显示出很高的功效。
阿里目前再次开源全新的Qwen-14B的模型,参数规模142亿,但是它的理解能力接近700亿参数规模的LLaMA2-70B,数学推理能力超过GPT-3.5。
昨天,Baichuan2-53B正式发布!首次开放API,意味着百川大模型开始正式进军商用了。另外,模型的数学和逻辑推理能力都大幅飙升,对于幻觉的处理,已经在国内遥遥领先。
为了验证大语言模型的沟通、规划、反思等拟人化能力,清华研究团队发布了一篇名为“探索大语言模型在交流游戏中的应用:《狼人杀》实验”的研究论文。
OpenAI刚刚连发4条推特,宣布了ChatGPT的重磅更新。ChatGPT支持多模态,目前已经支持语音的输入、语音的输出、理解图片的输入!不过目前似乎仅限于客户端~官方说的是未来2周内企业和Plus用户可以使用,后面会普及到其它用户!
在18 项不同的任务中,使用ChatGPT-4 的咨询顾问平均多完成了 12.2% 的任务,完成任务的速度提高了 25.1%,成果质量提高了 40%。这项突破性的前沿研究表明,人工智能将在未来几年对职业工作产生巨大影响。研究者称,明年至少会有两家公司推出比 GPT-4 更强大的AI。
OpenAI作图神器DALL·E 3内测开启,网友纷纷上手实测后,感慨强到令人发指。文生图从此告别「提示词时代」?
“新·AI绘画细节控制大师”ControlNet-XS来啦!参数只要原始ControlNet的1%。 就能做到蛋糕口味随意切换