
抢先测了刚刚发布的Vidu后,对“Sora们”已经麻木的我居然被惊艳到了?
抢先测了刚刚发布的Vidu后,对“Sora们”已经麻木的我居然被惊艳到了?三个月前,生数科技联合清华大学正式发布了中国首个长时长、高一致性、高动态性视频大模型Vidu。发布时的视频效果更是与Sora不相上下,因此被网友称为“国产最强Sora”。
三个月前,生数科技联合清华大学正式发布了中国首个长时长、高一致性、高动态性视频大模型Vidu。发布时的视频效果更是与Sora不相上下,因此被网友称为“国产最强Sora”。
本文介绍清华大学的一篇关于长尾视觉识别的论文: Probabilistic Contrastive Learning for Long-Tailed Visual Recognition. 该工作已被 TPAMI 2024 录用,代码已开源。
以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应用领域,掀起了一场技术革命。
陶芳波博士,心识宇宙创始人兼 CEO,毕业于清华大学和 UIUC,并先后在美国微软研究院、Facebook 研究院工作,后归国成立阿里达摩院神经符号实验室从事 AI 研发工作,随后在 2022 年初开始 AI 创业,获红杉、线性、Square Peg 等近亿元融资。
“北有清华系,南有交大帮”,这种说法在AI大模型创业圈里流传甚广。放眼望去,中国AI大模型初创企业圈颇有被“清华系”“交大帮”包围的势头,这波AI创业门槛直接被拉升至学霸级别。
如何让大模型更好的遵从人类指令和意图?如何让大模型有更好的推理能力?如何让大模型避免幻觉?能否解决这些问题,是让大模型真正广泛可用,甚至实现超级智能(Super Intelligence)最为关键的技术挑战。这些最困难的挑战也是吴翼团队长期以来的研究重点,大模型对齐技术(Alignment)所要攻克的难题。
“大模型尺寸之争正在加速……倒退!”
大模型在语言、图像领域取得了巨大成功,时间序列作为多个行业的重要数据类型,时序领域的大模型构建尚处于起步阶段。近期,清华大学的研究团队基于Transformer在大规模时间序列上进行生成式预训练,获得了任务通用的时序分析模型,展现出大模型特有的泛化性与可扩展性
GPT-4o mini深夜忽然上线,OpenAI终于开卷小模型!每百万输入token已达15美分的超低价,跟GPT-3相比,两年内模型成本已降低99%。Sam Altman惊呼:通往智能的成本,已变得如此低廉!另外,清华同济校友为关键负责人。
刚刚,信息检索领域的国际顶会SIGIR 2024,公布了最终获奖结果。在所有获奖名单中,来自清华计算机系的团队们斩获了两大奖项——时间检验奖、最佳论文奖,实至名归!