AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
不要自回归!扩散模型作者创业,首个商业级扩散LLM来了,编程秒出结果

不要自回归!扩散模型作者创业,首个商业级扩散LLM来了,编程秒出结果

不要自回归!扩散模型作者创业,首个商业级扩散LLM来了,编程秒出结果

当前的 AI 领域,可以说 Transformer 与扩散模型是最热门的模型架构。也因此,有不少研究团队都在尝试将这两种架构融合到一起,以两者之长探索新一代的模型范式,比如我们之前报道过的 LLaDA。不过,之前这些成果都还只是研究探索,并未真正实现大规模应用。

来自主题: AI技术研报
11647 点击    2025-02-27 14:40
速递|ElevenLabs发布独立语音检测模型,旨在精细化理解和转录语音

速递|ElevenLabs发布独立语音检测模型,旨在精细化理解和转录语音

速递|ElevenLabs发布独立语音检测模型,旨在精细化理解和转录语音

AI 初创公司 ElevenLabs,刚刚筹集了 1.8 亿美元巨额融资 ,主要以其音频生成能力而闻名。该公司通过推出首个独立语音转文本模型 Scribe,迈向了另一个技术方向。

来自主题: AI资讯
10366 点击    2025-02-27 14:33
亚马逊Alexa史诗级重生,注入大模型灵魂,6亿智能家居设备狂欢

亚马逊Alexa史诗级重生,注入大模型灵魂,6亿智能家居设备狂欢

亚马逊Alexa史诗级重生,注入大模型灵魂,6亿智能家居设备狂欢

11年来首次重大更新,Alexa要打造终极智能家居体验​?升级后的Alexa被叫做Alexa+,可以与用户自然对话,还能记住家庭不同成员的个人习惯提供个性化建议,完成制定旅行计划、提炼邮件重点等各种复杂的任务。彭博社知名记者马克·古尔曼将Alexa+称作“加强版的ChatGPT语音模式”,令人印象深刻。他还提到苹果在这个领域落后了很远。

来自主题: AI资讯
8270 点击    2025-02-27 14:18
一文详解:DeepSeek 第四天开源的模型设计套件

一文详解:DeepSeek 第四天开源的模型设计套件

一文详解:DeepSeek 第四天开源的模型设计套件

第四天,DeepSee发布包括三个主要项目: DualPipe- 一种用于 V3/R1 训练的双向流水线并行算法,实现计算和通信完全重叠; EPLB(Expert Parallelism Load Balancer) - 专为 V3/R1 设计的专家并行负载均衡器; Profile-data- 分析 V3/R1 中计算与通信重叠的性能数据集。

来自主题: AI技术研报
10746 点击    2025-02-27 12:16
DeepSeek今日连开3源!针对优化的并行策略,梁文峰本人参与开发

DeepSeek今日连开3源!针对优化的并行策略,梁文峰本人参与开发

DeepSeek今日连开3源!针对优化的并行策略,梁文峰本人参与开发

按时整活!DeepSeek开源周第四天,直接痛快「1日3连发」,且全都围绕一个主题:优化并行策略。

来自主题: AI技术研报
9873 点击    2025-02-27 11:28
数据难清洗?试试ThinkJSON奖励算法,让DeepSeek-R1驱动Multi-Agent实现

数据难清洗?试试ThinkJSON奖励算法,让DeepSeek-R1驱动Multi-Agent实现

数据难清洗?试试ThinkJSON奖励算法,让DeepSeek-R1驱动Multi-Agent实现

在实际应用中,我们常常需要模型输出具有严格结构的数据,比如生物制药生产记录、金融交易报告或医疗健康档案等。这种结构化输出的需求在生物制造、金融服务、医疗健康等严格监管的领域尤为重要。

来自主题: AI技术研报
5230 点击    2025-02-27 10:25