AI资讯新闻榜单内容搜索-SD

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: SD
训练时间减半,性能不降反升!腾讯混元开源图像生成高效强化方案MixGRPO

训练时间减半,性能不降反升!腾讯混元开源图像生成高效强化方案MixGRPO

训练时间减半,性能不降反升!腾讯混元开源图像生成高效强化方案MixGRPO

图像生成不光要好看,更要高效。 混元基础模型团队提出全新框架MixGRPO,该框架通过结合随机微分方程(SDE)和常微分方程(ODE),利用混合采样策略的灵活性,简化了MDP中的优化流程,从而提升了效率的同时还增强了性能。

来自主题: AI技术研报
7369 点击    2025-08-03 13:37
一键云部署Coze后,用它终结了当代年轻人的看病PTSD【含喂饭级教程】

一键云部署Coze后,用它终结了当代年轻人的看病PTSD【含喂饭级教程】

一键云部署Coze后,用它终结了当代年轻人的看病PTSD【含喂饭级教程】

上周六Coze(7.26)不是开源了嘛,作为一个Coze的忠实用户和AI博主,没有抢到一手文章有点可惜,主要最近那会儿生病,紧接着又超级忙,就一直没空写。 但是Coze开源,这么大的事情,必须给大家安排一篇硬核的喂饭级教程!

来自主题: AI资讯
8226 点击    2025-08-02 16:10
AMD携手Stability AI推出世界首款适用于Stable Diffusion 3.0 Medium的B16 NPU模型,带来更快速且画质无损的文生图功能

AMD携手Stability AI推出世界首款适用于Stable Diffusion 3.0 Medium的B16 NPU模型,带来更快速且画质无损的文生图功能

AMD携手Stability AI推出世界首款适用于Stable Diffusion 3.0 Medium的B16 NPU模型,带来更快速且画质无损的文生图功能

AMD携手Stability AI宣布推出世界首款适用于Stable Diffusion 3.0 Medium的B16 NPU模型。该模型可直接运行于AMD XDNA 2 NPU之上,能够显著提升图像生成质量。新模型作为Amuse 3.1平台的组件之一亮相,于今天一起发布。

来自主题: AI资讯
9285 点击    2025-07-23 10:06
马斯克AI女友直播「一秒变身」,世界首个实时AI扩散视频模型MirageLSD登场

马斯克AI女友直播「一秒变身」,世界首个实时AI扩散视频模型MirageLSD登场

马斯克AI女友直播「一秒变身」,世界首个实时AI扩散视频模型MirageLSD登场

世界首个实时AI扩散视频模型炸场,Karpathy亲自站台,颠覆AI视频交互,0延迟+无限时长,每秒24帧不卡顿,MirageLSD首次实现AI直播级生成。

来自主题: AI资讯
8463 点击    2025-07-19 12:28
攻克「恶意投毒」攻击!华南理工联合霍普金斯和UCSD,连登TPAMI、TIFS顶刊

攻克「恶意投毒」攻击!华南理工联合霍普金斯和UCSD,连登TPAMI、TIFS顶刊

攻克「恶意投毒」攻击!华南理工联合霍普金斯和UCSD,连登TPAMI、TIFS顶刊

华南理工大学计算机学院AI安全团队长期深耕于人工智能安全,近期联合约翰霍普金斯大学和加州大学圣地亚戈分校聚焦于联邦学习中防范恶意投毒攻击,产出工作连续发表于AI顶刊TPAMI 2025和网络安全顶刊TIFS 2025。

来自主题: AI技术研报
7111 点击    2025-07-13 11:45
告别数据「噪音」,UCSD大模型推理新方法DreamPRM充当「信号放大器」,登顶MathVista测评榜

告别数据「噪音」,UCSD大模型推理新方法DreamPRM充当「信号放大器」,登顶MathVista测评榜

告别数据「噪音」,UCSD大模型推理新方法DreamPRM充当「信号放大器」,登顶MathVista测评榜

使用过程奖励模型(PRM)强化大语言模型的推理能力已在纯文本任务中取得显著成果,但将过程奖励模型扩展至多模态大语言模型(MLLMs)时,面临两大难题:

来自主题: AI技术研报
7787 点击    2025-07-12 11:58
邱锡鹏团队开源MOSS-TTSD!百万小时音频训练,突破AI播客恐怖谷

邱锡鹏团队开源MOSS-TTSD!百万小时音频训练,突破AI播客恐怖谷

邱锡鹏团队开源MOSS-TTSD!百万小时音频训练,突破AI播客恐怖谷

播客、访谈、体育解说、新闻报道和电商直播中,语音对话已经无处不在。 当前的文本到语音(TTS)模型在单句或孤立段落的语音生成效果上取得了令人瞩目的进展,合成语音的自然度、清晰度和表现力都已显著提升,甚至接近真人水平。不过,由于缺乏整体的对话情境,这些 TTS 模型仍然无法合成高质量的对话语音。

来自主题: AI资讯
7491 点击    2025-07-06 11:25
o3通关「俄罗斯方块」,碾压Gemini夺冠!UCSD新基准击碎宝可梦

o3通关「俄罗斯方块」,碾压Gemini夺冠!UCSD新基准击碎宝可梦

o3通关「俄罗斯方块」,碾压Gemini夺冠!UCSD新基准击碎宝可梦

UCSD等推出Lmgame Bench标准框架,结合多款经典游戏,分模块测评模型的感知、记忆与推理表现。结果显示,不同模型在各游戏中表现迥异,凸显游戏作为AI评估工具的独特价值。

来自主题: AI资讯
6822 点击    2025-07-01 16:15
“废弃了7年的老Android项目,我用AI两周就重写完了!”

“废弃了7年的老Android项目,我用AI两周就重写完了!”

“废弃了7年的老Android项目,我用AI两周就重写完了!”

大约 7 年前,我发布了一个名为 SDK Monitor 的小工具应用,用来监控设备上安装的所有应用使用的 targetSDK API 级别。当时正值 Google 开始强制推行 targetSDK 最低版本限制(现在要求至少是去年的版本),于是我的原始应用很快就变旧了。随着时间的推移,我甚至已经无法再打开 Android Studio 去维护它了——开发环境和技术体系早已焕然一新。

来自主题: AI资讯
7864 点击    2025-07-01 15:38