AI资讯新闻榜单内容搜索-浙大

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 浙大
NeurIPS 2024|浙大 & 微信 & 清华:彻底解决扩散模型反演问题

NeurIPS 2024|浙大 & 微信 & 清华:彻底解决扩散模型反演问题

NeurIPS 2024|浙大 & 微信 & 清华:彻底解决扩散模型反演问题

随着扩散生成模型的发展,人工智能步入了属于 AIGC 的新纪元。扩散生成模型可以对初始高斯噪声进行逐步去噪而得到高质量的采样。当前,许多应用都涉及扩散模型的反演,即找到一个生成样本对应的初始噪声。当前的采样器不能兼顾反演的准确性和采样的质量。

来自主题: AI技术研报
6631 点击    2024-11-02 17:08
NeurIPS 2024 | 解锁大模型知识记忆编辑的新路径,浙大用「WISE」对抗幻觉

NeurIPS 2024 | 解锁大模型知识记忆编辑的新路径,浙大用「WISE」对抗幻觉

NeurIPS 2024 | 解锁大模型知识记忆编辑的新路径,浙大用「WISE」对抗幻觉

现有的大模型主要依赖固定的参数和数据来存储知识,一旦训练完成,修改和更新特定知识的代价极大,常常因知识谬误导致模型输出不准确或引发「幻觉」现象。因此,如何对大模型的知识记忆进行精确控制和编辑,成为当前研究的前沿热点。

来自主题: AI技术研报
3759 点击    2024-10-24 09:48
AI作曲缺数据,浙大GTSinger数据集上线:适配所有歌声任务、带有真实乐谱

AI作曲缺数据,浙大GTSinger数据集上线:适配所有歌声任务、带有真实乐谱

AI作曲缺数据,浙大GTSinger数据集上线:适配所有歌声任务、带有真实乐谱

传统的歌声任务,如歌声合成,大多是在利用输入的歌词和乐谱生成高质量的歌声。随着深度学习的发展,人们希望实现可控和能个性化定制的歌声生成。

来自主题: AI技术研报
6189 点击    2024-10-14 10:38
150万条多语种音频数据!浙大清华发布语音伪造检测框架SafeEar,兼顾隐私保护|CCS 2024

150万条多语种音频数据!浙大清华发布语音伪造检测框架SafeEar,兼顾隐私保护|CCS 2024

150万条多语种音频数据!浙大清华发布语音伪造检测框架SafeEar,兼顾隐私保护|CCS 2024

SafeEar是一种内容隐私保护的语音伪造检测方法,其核心是设计基于神经音频编解码器的解耦模型,分离语音声学与语义信息,仅利用声学信息检测,包括前端解耦模型、瓶颈层和混淆层、伪造检测器、真实环境增强四部分。

来自主题: AI技术研报
9554 点击    2024-09-26 15:25
北大图灵班3位00后夺ICPC 2024全球冠军!清华第三,北交大第七,浙大第十

北大图灵班3位00后夺ICPC 2024全球冠军!清华第三,北交大第七,浙大第十

北大图灵班3位00后夺ICPC 2024全球冠军!清华第三,北交大第七,浙大第十

刚刚结束的第48届ICPC全球总决赛上,北大获得第一,清华获得第三,北交大获得第七,浙大获得第十。夺冠的三位北大信科学子,都来自图灵班,并且高中来自杭二中,师从同一位教练。

来自主题: AI资讯
8332 点击    2024-09-21 16:54
时序=图像?无需微调,视觉MAE跨界比肩最强时序预测大模型

时序=图像?无需微调,视觉MAE跨界比肩最强时序预测大模型

时序=图像?无需微调,视觉MAE跨界比肩最强时序预测大模型

近期,浙大和 Salesforce 学者进一步发现:语言模型或许帮助有限,但是图像模型能够有效地迁移到时序预测领域。

来自主题: AI资讯
3779 点击    2024-09-19 15:24
首篇「虚拟现实+人工智能」综述!浙大、港中深等发布AI医疗最新报告

首篇「虚拟现实+人工智能」综述!浙大、港中深等发布AI医疗最新报告

首篇「虚拟现实+人工智能」综述!浙大、港中深等发布AI医疗最新报告

本文对AI增强的VR在医疗应用中的技术细节、工作流程和下游应用进行了全面审视,并提出了一个系统性的分类方法,将相关工作分为医学视觉增强、VR医学数据处理和VR辅助干预三个主要类别,为未来跨学科研究提供了基础。

来自主题: AI技术研报
7648 点击    2024-08-27 13:56