内测艺术家近距离围观Sora团队:AI还算不上具备创作能力
内测艺术家近距离围观Sora团队:AI还算不上具备创作能力北京时间12月10日,被万众期待将近一年的Sora,终于正式官宣。不再是几个demo片段,不再是Sam Altman时不时打的哑谜,而是一个完整的视频生成产品。
北京时间12月10日,被万众期待将近一年的Sora,终于正式官宣。不再是几个demo片段,不再是Sam Altman时不时打的哑谜,而是一个完整的视频生成产品。
支持大模型一路狂飙的 Scaling Law 到头了? 近期,AI 圈针对 Scaling Law 是否到头产生了分歧。一派观点认为 Scaling Law 已经「撞墙」了,另一派观点(如 OpenAI CEO Sam Altman)仍然坚定 Scaling Law 的潜力尚未穷尽。
大模型横空出世这两年,不少投资人都坐不住了。根据硅谷科技评论(SVTR)AI数据库,全球3000多家高潜力AI初创公司中,300多家公司的创始人、CEO有投资背景,标志性的例子是前YC总裁、OpenAI CEO Sam Altman以及创新工场董事长、零一万物CEO李开复。
Meta最近开源了多个AI项目,包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等,提升了AI在图像处理和语音识别领域的能力,进一步推动了AI研究的进展。
近日,人形机器人公司1X公布了世界模型挑战赛的二阶段:Sampling。一同登场的还有合作伙伴英伟达新发布的Cosmos视频分词器,超高质量和压缩率助力构建虚拟世界。
Meta的视频版分割一切——Segment Anything Model 2(SAM 2),又火了一把。
近日,DeepMind 团队将水印技术和投机采样(speculative sampling)结合,在为大语言模型加入水印的同时,提升其推理效率,降低推理成本,因此适合用于大规模生产环境。
11月4日,OpenAI CEO Sam Altman(以下称“Altman”)在“The Twenty Minute VC”播客中回答了这些问题,他明确表示,提升推理能力一直是OpenAI的核心战略。
本文介绍了来自北京大学王选计算机研究所的王勇涛团队的最新研究成果 VL-SAM。针对开放场景,该篇工作提出了一个基于注意力图提示的免训练开放式目标检测和分割框架 VL-SAM,在无需训练的情况下,取得了良好的开放式 (Open-ended) 目标检测和实例分割结果,论文已被 NeurIPS 2024 录用。
近日,卡内基梅隆大学与华盛顿大学的研究团队推出了 NaturalBench,这是一项发表于 NeurIPS'24 的以视觉为核心的 VQA 基准。它通过自然图像上的简单问题——即自然对抗样本(Natural Adversarial Samples)——对视觉语言模型发起严峻挑战。