比自回归更灵活、比离散扩散更通用,首个纯Discrete Flow Matching多模态巨兽降临
比自回归更灵活、比离散扩散更通用,首个纯Discrete Flow Matching多模态巨兽降临王劲,香港大学计算机系二年级博士生,导师为罗平老师。研究兴趣包括多模态大模型训练与评测、伪造检测等,有多项工作发表于 ICML、CVPR、ICCV、ECCV 等国际学术会议。
王劲,香港大学计算机系二年级博士生,导师为罗平老师。研究兴趣包括多模态大模型训练与评测、伪造检测等,有多项工作发表于 ICML、CVPR、ICCV、ECCV 等国际学术会议。
AI大模型正在医疗服务行业中扎根。 “我们医院在科研平台上已经接入使用了DeepSeek。”北京某三甲医院相关负责人对光锥智能说道,“形式类似于AI助理,能提供科研政策问答、查询、常用文件下载等功能。”
视觉语言模型(VLM)正经历从「感知」到「认知」的关键跃迁。 当OpenAI的o3系列通过「图像思维」(Thinking with Images)让模型学会缩放、标记视觉区域时,我们看到了多模态交互的全新可能。
AI越来越靠谱,“张雪峰”们急了,6月9日,全国多地结束了2025年高考,焦灼地等待高考成绩出炉的同时,不少考生和家长已经开始研究如何填报志愿。
最近两年,随着AI改造各行各业的深入,AI报考志愿也开始成为一年一度的热门工具,每年帮助数千万的高考毕业生从成千上万所高校中,选择最适合自己的学校。
今年的苹果,到底有没有新活?
因为眼睛受伤暂时失去立体视觉,李飞飞更加坚定了做世界模型的决心。
上周日,奇绩创坛在北京中关村国际创新中心举办了其 2025 年春季创业营路演日,共有 57 家公司参与了路演。
一个先相信、后看见的 AI 创业者。
辍学MIT创业八年,走上人生巅峰
近日, Mastra AI 创始人 Sam Bhagwat 在 X 上发布了一条推文,称其中提到大约 60~70% 的 YC X25 Agent 公司正在使用 TypeScript 构建他们的 AI Agent。
你有没有想过,那些电视台、制作公司里堆积如山的视频素材,可能马上就要被彻底重新定义了?想象一下,从数千小时的视频内容中找到你需要的那一个镜头,不再需要安排一群人没日没夜地看片子、做标记,而是只需要简单描述一句"奥巴马谈论人权的片段",系统就能立刻定位到精确的时间点,并提供详细的场景描述、人物信息和镜头分析。
大模型≠随机鹦鹉!Nature子刊最新研究证明: 大模型内部存在着类似人类对现实世界概念的理解。
AI行业爆发补贴大战,Perplexity、OpenAI和Google等公司提供免费会员和折扣吸引用户,类似滴滴和美团历史。这些补贴旨在提升ARR指标以融资,但导致亏损加剧;创业公司面临巨头竞争,用户可利用低价机会。补贴未来可能退潮,价格恐上涨。
知识库成为大模型落地的热门场景,现实中却走入了 “技术炫酷却用不起来” 的窘境。
AnySphere 联合创始人兼 CEO Michael Truell 所构建的 Cursor,不仅是当前增长最快的 AI 编程产品之一,更是未来“后代码时代”的早期形态。
宾夕法尼亚大学沃顿商学院生成式AI实验室刚刚发布了两份重磅研究报告,通过严格的科学实验揭示了一个令人震惊的事实:我们可能一直在用错误的方式与AI对话。这不是胡说八道,而是基于近4万次实验得出的硬核数据推理的结论。
让推理模型针对风险指令生成了安全输出,表象下藏着认知危机: 即使生成合规答案,超60%的案例中模型并未真正理解风险。
6 月 9 日消息,据外媒TechXplore 报道,由 AI 视频技术公司 Runway 主办的年度 AI 电影节于 6 月 5 日在纽约拉开帷幕,全球十部短片首次登上大银幕亮相。Runway CEO 克里斯托瓦尔・巴伦苏埃拉说:“三年前这听起来还是天方夜谭。现在,全球已有数百万人使用我们当年仅是梦想的工具,创作出数十亿条视频。”
有史以来最具想象力的小钢炮系列,MiniCPM 4.0 来了!
6月7日,上海财经大学匡时财经教育大模型发布会暨数智新财经论坛在校举办,上海财经大学校长刘元春、上海市教育委员会副主任赵震、上海市杨浦区副区长刘晋元出席并致辞,中国移动上海公司党委书记、董事长、总经理楼向平,蚂蚁集团副总裁、财富保险事业群CTO尹俊,上海库帕思科技有限公司董事长山栋明等企业代表以及学校相关部门负责人参会。发布会由上海财经大学副校长靳玉英主持。
FLUX 的 Kontext 最近太猛,基本上除了不能写中文已经是全能的图像编辑应用了。
谷歌旗舰视频模型Veo 3上线不到一个月,各种玩法层出不穷。 这不,玩法再升级,只需添加一个提示词“360°”就能解锁3D世界!
3D生成模型高光时刻来临!DreamTech联手南大、复旦、牛津发布的Direct3D-S2登顶HuggingFace热榜。仅用8块GPU训练,效果超闭源模型,直指影视级精细度。
前天,生财有术的老板亦仁发布了一条「超级标」(至少价值千万以上的现象级行业机会): 随着GPT-4o图像革命而来的,是无数的创业机会。
付费订阅或许是一切AI助手的归宿,继OpenAI的ChatGPT、谷歌的Gemini,以及Anthropic的Cluade之后,Meta的AI助手Meta AI也准备提供付费订阅服务了。在日前举行的Meta年度股东大会上,扎克伯格除了确认Meta AI已实现10亿月活跃用户的成绩之余,还宣称“随着Meta AI不断改进,未来也将有机会推出付费推荐或额外算力使用的订阅服务。”
5月份,AI应用市场格局再度出现变化,夸克登顶买量素材榜首,腾讯元宝买量、下载量双双大跌,DeepSeek下载量进一步下滑。
奥特曼使用大模型的方法,竟然是错的?
沉寂一年多,消失的Ilya Sutskever终于出现了!
Scale AI 即将获得 Meta 高达数十亿美元的投资,金额可能超过 100 亿美元,这将成为有史以来规模最大的私营企业融资事件之一。