AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
一张4090就能爆改!面壁智能MiniCPM-V 4.6开源,1B多模态卷出新高度

一张4090就能爆改!面壁智能MiniCPM-V 4.6开源,1B多模态卷出新高度

一张4090就能爆改!面壁智能MiniCPM-V 4.6开源,1B多模态卷出新高度

面壁智能正式发布并开源了 MiniCPM-V 系列新一代基础模型——MiniCPM-V 4.6。这款模型的整体参数规模仅约 1B(1.3B),是该系列有史以来参数规模最小的一款。但在多模态综合能力上,它却成功超越了被视为标杆的阿里 Qwen3.5-0.8B 和谷歌 Gemma 4 E2B-it,做到了「尺寸更小、效率更高、性能更好」。

来自主题: AI资讯
9352 点击    2026-05-13 11:57
何恺明首个语言模型:105M参数,不走GPT自回归老路

何恺明首个语言模型:105M参数,不走GPT自回归老路

何恺明首个语言模型:105M参数,不走GPT自回归老路

何恺明,也下场做语言模型了。

来自主题: AI技术研报
9151 点击    2026-05-13 10:47
Thinking Machines 刚发的「边听边说」,让我想到了几个月前的面壁智能

Thinking Machines 刚发的「边听边说」,让我想到了几个月前的面壁智能

Thinking Machines 刚发的「边听边说」,让我想到了几个月前的面壁智能

OpenAI 前 CTO Mira Murati 和前应用研究负责人翁荔(Lilian Weng)创立的 Thinking Machines Lab,也就是 TML,刚刚发布了一个叫「Interaction Models」的研究

来自主题: AI技术研报
8856 点击    2026-05-13 10:47
告别云端依赖!字节开源新作DreamLite让手机秒变 AI 画板

告别云端依赖!字节开源新作DreamLite让手机秒变 AI 画板

告别云端依赖!字节开源新作DreamLite让手机秒变 AI 画板

近日,字节跳动智能创作部门(Intelligent Creation Lab)提出新作 DreamLite,一个主干网络仅有 0.39B 参数的轻量级统一扩散模型,在单一网络内同时支持文生图(Text-to-Image) 和图像编辑(Text-guided Image Editing)两个任务,是目前已知首个实现这一能力的端侧模型。

来自主题: AI技术研报
9020 点击    2026-05-13 10:30
专访 | 核心团队来自浙大和阿里,这个团队构建「物理AI的原生本体」,要做真正的AI native硬件公司

专访 | 核心团队来自浙大和阿里,这个团队构建「物理AI的原生本体」,要做真正的AI native硬件公司

专访 | 核心团队来自浙大和阿里,这个团队构建「物理AI的原生本体」,要做真正的AI native硬件公司

三年后,这个判断变成了一家叫FrontierX的公司,和它的产品Aura——一个球形的、能在室内自由移动、端侧部署感知和模型的「开放定义的机器人」。FrontierX诞生于杭州,是一家以感知智能为核心的AI原生硬件公司,由来自浙江大学和阿里巴巴的团队创立。团队背景多元,涵盖硬件工程师、算法工程师、产品经理和工业设计师。

来自主题: AI资讯
8349 点击    2026-05-13 10:28
谷歌首度证实:黑客已开始用AI发动真实网络攻击!

谷歌首度证实:黑客已开始用AI发动真实网络攻击!

谷歌首度证实:黑客已开始用AI发动真实网络攻击!

谷歌周一发布报告,首次确认犯罪黑客使用AI大模型发现了一个此前未知的零日漏洞,并差点发动大规模攻击。这件事之所以炸裂,是因为安全界担心了好几年的「AI自动挖洞」,终于从理论变成了现实。而在Anthropic的Mythos模型已经找到数千个零日漏洞的背景下,这可能只是冰山一角。

来自主题: AI资讯
7495 点击    2026-05-13 10:26
Agent Infra 实践复盘:Kimi 如何搭建 Agent 背后的 Database 服务

Agent Infra 实践复盘:Kimi 如何搭建 Agent 背后的 Database 服务

Agent Infra 实践复盘:Kimi 如何搭建 Agent 背后的 Database 服务

Agent 到底需要什么样的 infrastructure,今年业界一直有很多探讨,PingCAP 联合创始人黄东旭此前也发过多篇讨论文章,不过当时都是一些猜想。随着 agent 今年的爆发,大规模落地的案例出现了。

来自主题: AI技术研报
9402 点击    2026-05-13 10:00
上海AI Lab新研究:SFT能泛化,只要满足这三个条件

上海AI Lab新研究:SFT能泛化,只要满足这三个条件

上海AI Lab新研究:SFT能泛化,只要满足这三个条件

随着大模型后训练(Post-training)技术的发展,强化学习(RL)在提升模型推理能力方面的表现备受瞩目。

来自主题: AI技术研报
9440 点击    2026-05-13 09:59
翁荔创业大模型首秀!告别“120亿美元估值0模型”

翁荔创业大模型首秀!告别“120亿美元估值0模型”

翁荔创业大模型首秀!告别“120亿美元估值0模型”

AI再也不是“回合制”了。Thinking Machines Lab(以下简称TML)发布首个模型,让实时交互能力成为模型原生能力。联合创始人翁荔出镜演示。

来自主题: AI资讯
9351 点击    2026-05-12 17:07