对话多邻国:用好AI大模型后,我们的付费用户暴增超50%|36氪专访
对话多邻国:用好AI大模型后,我们的付费用户暴增超50%|36氪专访一家线上教育产品公司如何巧用大模型之力获得新增长?多邻国可以称得上是全球市场典型的范本之一。
一家线上教育产品公司如何巧用大模型之力获得新增长?多邻国可以称得上是全球市场典型的范本之一。
全球首台,黄仁勋亲自送货上门,OpenAI首发,DGX H200算是把流量拉满了。
时间倒回前几年,如果小雷和小伙伴们聊聊AI,你们可能觉得我在天方夜谭?
想象一下,你仅需要输入一段简单的文本描述,就可以生成对应的 3D 数字人动画的骨骼动作。而以往,这通常需要昂贵的动作捕捉设备或是专业的动画师逐帧绘制。这些骨骼动作可以进一步的用于游戏开发,影视制作,或者虚拟现实应用。来自阿尔伯塔大学的研究团队提出的新一代 Text2Motion 框架,MoMask,正在让这一切变得可能。
今年 2 月份,OpenAI 发布了人工智能文生视频大模型 Sora,并放出了第一批视频片段,掀起了 AI 生成视频浪潮。目前,Sora 仍未进行公测,只有一些视觉艺术家、设计师、电影制作人等获得了 Sora 的访问权限。他们发布了一些 Sora 生成的视频短片,其连贯、逼真的生成效果令人惊艳。
对于小型语言模型(SLM)来说,数学应用题求解是一项很复杂的任务。
大型语言模型(LLM)往往会追求更长的「上下文窗口」,但由于微调成本高、长文本稀缺以及新token位置引入的灾难值(catastrophic values)等问题,目前模型的上下文窗口大多不超过128k个token
在4月27日召开的中关村论坛通用人工智能平行论坛上,人大系初创公司智子引擎隆重发布全新的多模态大模型Awaker 1.0,向AGI迈出至关重要的一步。
2024 年,Sora 一直活在聚光灯下
FP8和更低的浮点数量化精度,不再是H100的“专利”了!
啊?Sora火爆短片《气球人》,也“造假”了???
训练模型搞得跟《饥饿游戏》似的,全球AI研究者,都在苦恼怎么才能喂饱这群数据大胃王。
又一个国产多模态大模型开源! XVERSE-V,来自元象,还是同样的无条件免费商用。
算力基础设施建设,北京市有了最新的大动作—— 《北京市算力基础设施建设实施方案(2024-2027年)》
Llama 3诞生整整一周后,直接将开源AI大模型推向新的高度。
近期,大语言模型、文生图模型等大规模 AI 模型迅猛发展。在这种形势下,如何适应瞬息万变的需求,快速适配大模型至各类下游任务,成为了一个重要的挑战。受限于计算资源,传统的全参数微调方法可能会显得力不从心,因此需要探索更高效的微调策略。
大模型力大砖飞,让LLaMA3演绎出了新高度: 超15T Token数据上的超大规模预训练,既实现了令人印象深刻的性能提升,也因远超Chinchilla推荐量再次引爆开源社区讨论。
Sora席卷世界,也掀起了全球竞逐AI视频生成的热潮。 就在今天,国内又有一支短片引发关注。
对于视频生成领域,大家一致的看法就是:Sora一出,谁与争锋!
指代分割 (Referring Image Segmentation,RIS) 是一项极具挑战性的多模态任务,要求算法能够同时理解精细的人类语言和视觉图像信息,并将图像中句子所指代的物体进行像素级别的分割。
前不久,斯坦福大学教授吴恩达在演讲中提到了智能体的巨大潜力,这也引起了众多讨论。其中,吴恩达谈到基于 GPT-3.5 构建的智能体工作流在应用中表现比 GPT-4 要好。这表明,将目光局限于大模型不一定可取,智能体或许会比其所用的基础模型更加优秀。
随着 AI 向 AGI(通用人工智能)的圣杯方向加速发展,大模型与机器人的结合是必然趋势。数十年来,单一用途机器人市场已趋于饱和,AI 通用机器人的巨大潜力急待开垦。
4 月 26 日,科大讯飞发布讯飞星火大模型 V3.5 的功能上新,其中一个重点就是面向用户各种场景中高效获取信息需求,发布首个长文本、长图文、长语音的大模型,能够支持文档、图文资料、会议录音等各种信息来源的快速理解和学习,还能够结合各种行业场景知识给出专业、准确回答。
奔向通用人工智能,大模型又迈出一大步。
今年3月,一段两分半钟的视频点击量破百万。没有太多花哨的情节,白色背景前,一个人形机器人遵照人类指令,递给对方苹果,归置好桌上的杯子和餐碟,并解释这样做的原因。
大模型语料是指用于训练和评估大模型的一系列文本、语音或其他模态的数据。
自Alpha Go起至今,AI已在资本市场浮沉近10年。围绕这一概念展开的资本游戏亦愈发扑朔迷离。
抛弃传统方法,只采用Transformer来解码真实场景!
AI届大红人Altman在母校斯坦福开讲当天,在场的学生挤爆了英伟达礼堂。 去礼堂路的上,人满为患,超1000人早早排在了门口。
视觉语言模型屡屡出现新突破,但ViT仍是图像编码器的首选网络结构。