
没想到,音频大模型开源最彻底的,居然是小红书
没想到,音频大模型开源最彻底的,居然是小红书不难发现,近几个月,开源频频成为 AI 社区热议的焦点。尤其是对于国内科技公司来说,开源成为主旋律。根据 Hugging Face 中文 AI 模型与资源社区的数据显示,国内厂商在七八月接连开源 33 款、31 款各类型大模型。
不难发现,近几个月,开源频频成为 AI 社区热议的焦点。尤其是对于国内科技公司来说,开源成为主旋律。根据 Hugging Face 中文 AI 模型与资源社区的数据显示,国内厂商在七八月接连开源 33 款、31 款各类型大模型。
声音理解能力新SOTA,小米全量开源了模型。 MiDashengLM-7B,基于Xiaomi Dasheng作为音频编码器和Qwen2.5-Omni-7B Thinker作为自回归解码器,通过创新的通用音频描述训练策略,实现了对语音、环境声音和音乐的统一理解。
根据 Anthropic 最近公布的一项数据,他们的 Claude Code 已经吸引了 11.5 万名开发人员,并在一周内处理了 1.95 亿行代码。而这款工具,才刚刚发布 4 个多月。Menlo Ventures 风险投资家 Deedy Das 据此推断,仅靠 Claude Code 这个产品,Anthropic 的年收入就可能达到 1.3 亿美元。
你能想象判别模型也能成为强大的图像合成高手吗?「直接上升合成」(DAS)做到了!它突破传统认知,借助多分辨率优化等创新技术,在图像生成的多个关键任务中表现出色。
依稀记得十年前,我在上遥感概论专业课时,老师带我们用ERDAS IMAGINE遥感图像处理软件做地物分类,每个人电脑上先发一段区域的遥感影像,进行人工判读和标注,比如把这个区域影像上的林地标注出来喂给模型,再用这个模型去识别另外一个区域影像中的林地,机器学习中典型的的有监督学习应用。
Lightdash,一个商业智能(BI)平台和开源替代品,旨在替代谷歌的 Looker,正在推出一款新产品,允许公司为特定团队的使用案例培训“AI 分析师”,使公司中的任何人都能够查询汇总的业务数据。
比LoRA更高效的模型微调方法来了——
AI,智能体,ADAS,元智能体搜索,模型训练
2024年,AI 领域中最炙手可热的话题无疑是Agent。
AI掌握自我设计的权力,将会怎样?最近,来自UBC等机构研究人员提出了「智能体自动化设计」系统,让元智能体使用搜索算法,自动构建强大的同类。