合成数据助力视频生成提速8.5倍,上海AI Lab开源AccVideo
合成数据助力视频生成提速8.5倍,上海AI Lab开源AccVideo虽然扩散模型在视频生成领域展现出了卓越的性能,但是视频扩散模型通常需要大量的推理步骤对高斯噪声进行去噪才能生成一个视频。这个过程既耗时又耗计算资源。例如,HunyuanVideo [1] 需要 3234 秒才能在单张 A100 上生成 5 秒、720×1280、24fps 的视频。
虽然扩散模型在视频生成领域展现出了卓越的性能,但是视频扩散模型通常需要大量的推理步骤对高斯噪声进行去噪才能生成一个视频。这个过程既耗时又耗计算资源。例如,HunyuanVideo [1] 需要 3234 秒才能在单张 A100 上生成 5 秒、720×1280、24fps 的视频。
单张图直接就能生成可编辑的CAD工程文件!
开发Agent的工程师们都曾面临同一个棘手问题:当任务步骤增多,你的Agent就像患上"数字健忘症",忘记之前做过什么,无法处理用户的修改请求,甚至在多轮对话中迷失自我。不仅用户体验受损,token开销也居高不下。TME树状记忆引擎通过结构化状态管理方案,彻底解决了这一痛点,让你的Agent像拥有完美记忆力的助手,在复杂任务中游刃有余,同时将token消耗降低26%。
“AI是一次改变我们所知一切的历史性机会。”美国当地时间2025年4月10日,全球电商平台亚马逊CEO安迪·贾西(Andy Jassy)在发布2024年度致股东信时,不遗余力地盛赞AI。
刚刚,Gemini 2.5 Pro编程登顶,6美元性价比碾压Claude 3.7 Sonnet。不仅如此,谷歌还暗藏着更强的编程模型Dragontail,这次是要彻底翻盘了。
随着 OpenAI o1 和 DeepSeek R1 的爆火,大语言模型(LLM)的推理能力增强和测试时扩展(TTS)受到广泛关注。然而,在复杂推理问题中,如何精准评估模型每一步回答的质量,仍然是一个亟待解决的难题。传统的过程奖励模型(PRM)虽能验证推理步骤,但受限于标量评分机制,难以捕捉深层逻辑错误,且其判别式建模方式限制了测试时的拓展能力。
近日,一场关于 OpenAI 未来走向的激烈纷争正在上演。4 月 11 日,12 名 OpenAI 前员工联合提交了一份法律简报,明确表态支持埃隆·马斯克对 OpenAI 提起的诉讼,这场诉讼的核心在于 OpenAI 从非营利组织向营利性实体的转型。
2025年2月,商汤医疗宣布了分拆后的第一笔融资,投前估值15亿元。
连续创业者马宇驰,在上一波人工智能大潮中创立三角兽科技,带领公司被腾讯收购,去年重回AI赛道,参与到新一轮大模型应用创业中,2033科技于2024年已经完成天使轮融资,由商汤科技和东方国资共同投资近亿元人民币。
前些天,GPT-4o的多模态生图上线之后,引发全球AI社区广泛的关注,吉卜力图画全网风靡。