AI资讯新闻榜单内容搜索-Gemini

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Gemini
独家首发丨首个「Soulful Agent」ColaOS 上线:你会感受到Agent的灵魂,然后离不开它

独家首发丨首个「Soulful Agent」ColaOS 上线:你会感受到Agent的灵魂,然后离不开它

独家首发丨首个「Soulful Agent」ColaOS 上线:你会感受到Agent的灵魂,然后离不开它

大概一周前,我拿到了ColaOS(以下简称Cola)的内测。当时我手里有Claude、Gemini和GPT最新的模型。在Cola出现之前,这几个工具已经足够覆盖我所有的工作场景了。还有什么能比Claude好用?

来自主题: AI资讯
7411 点击    2026-04-02 12:52
阿里又一个王炸!Qwen3.5-Omni 全模态硬核实测

阿里又一个王炸!Qwen3.5-Omni 全模态硬核实测

阿里又一个王炸!Qwen3.5-Omni 全模态硬核实测

阿里刚刚发布了最新一代全模态大模型 Qwen3.5-Omni,在通用音频理解、推理、翻译和对话等维度,已全面超越 Gemini 3.1 Pro。所谓全模态,在于它拥有了接近人类的“感官”。它能听、能看、能说、能写。

来自主题: AI资讯
9093 点击    2026-03-31 11:20
谢邀,人在路口画8字,谷歌Gemini突然对着我耳边:往红房子走,铁憨憨

谢邀,人在路口画8字,谷歌Gemini突然对着我耳边:往红房子走,铁憨憨

谢邀,人在路口画8字,谷歌Gemini突然对着我耳边:往红房子走,铁憨憨

GoogleMaps核弹更新:Gemini接管步行骑行导航!问厕所咖啡馆?问EV充电剩几个坑?问街区Vibe?Gemini秒懂人话、懂物理世界。路痴起立,再也不用举手机转圈自闭了!

来自主题: AI资讯
9462 点击    2026-03-30 16:06
谷歌掀语音Agent新纪元!开口就是生产力,Siri的最强外挂来了?

谷歌掀语音Agent新纪元!开口就是生产力,Siri的最强外挂来了?

谷歌掀语音Agent新纪元!开口就是生产力,Siri的最强外挂来了?

昨日凌晨,谷歌正式推出其最高质量的音频和语音模型——实时语音模型Gemini 3.1 Flash Live,并在Gemini App、Search Live以及Google AI Studio中同步开放,其中后者以预览版本向开发者提供。

来自主题: AI资讯
10202 点击    2026-03-27 14:41
全球 AI 公司烧了几千亿,最后都得抢着给苹果「打工」

全球 AI 公司烧了几千亿,最后都得抢着给苹果「打工」

全球 AI 公司烧了几千亿,最后都得抢着给苹果「打工」

就在刚刚,据彭博社报道,iOS 27 将引入一套名为「Extensions」的新机制,允许用户通过设置面板,把 Google Gemini、Anthropic Claude 等第三方 AI 接入 Siri,就像现在调用 ChatGPT 一样直接从 Siri 发起请求。

来自主题: AI资讯
7990 点击    2026-03-27 14:22
AI屠刀下一站“Vibe设计”!谷歌一个产品把合作伙伴Figma干崩了

AI屠刀下一站“Vibe设计”!谷歌一个产品把合作伙伴Figma干崩了

AI屠刀下一站“Vibe设计”!谷歌一个产品把合作伙伴Figma干崩了

谷歌宣布旗下AI设计工具Stitch支持Vibe Design。你都不需要键盘,只需要用嘴就可以vide design出这样婶儿的UI和前端界面:不得不说,谷歌的审美是真的好。Gemini 3生成前端的艺术效果就有口皆碑。

来自主题: AI资讯
8318 点击    2026-03-20 14:43
无需 VPN 翻墙!香港也能用上谷歌 Gemini 了

无需 VPN 翻墙!香港也能用上谷歌 Gemini 了

无需 VPN 翻墙!香港也能用上谷歌 Gemini 了

香港用户终于等来了这一天——谷歌宣布将逐步向香港开放 Gemini 网页应用,这意味着以后再也不需要翻墙 VPN 就能用上谷歌的 AI 助手了。在此之前,使用香港网络的用户一直无法直接访问 Gemini,需要借助 VPN 等「曲线救国」的方式才能使用。

来自主题: AI资讯
8640 点击    2026-03-19 21:54
AI助手现在认路了:谷歌地图直接「长」进大脑

AI助手现在认路了:谷歌地图直接「长」进大脑

AI助手现在认路了:谷歌地图直接「长」进大脑

谷歌DeepMind刚刚为Gemini API放了一个大招:内置工具和自定义函数终于可以在同一次调用里混着用了。再加上跨工具的「上下文环流」和Google Maps原生接入,Agent开发的编排噩梦正在终结。

来自主题: AI资讯
6725 点击    2026-03-19 15:23
500行极简开源框架,硬刚GPT/Gemini视觉极限!

500行极简开源框架,硬刚GPT/Gemini视觉极限!

500行极简开源框架,硬刚GPT/Gemini视觉极限!

多模态模型代码写得像老司机,却在数手指、量柱子时频频翻车?UniPat AI用五百行代码打造的SWE-Vision,让模型「掏出Python尺子」自我验证,一举拿下五大视觉相关基准SOTA。

来自主题: AI资讯
7853 点击    2026-03-16 15:08
从多模态大模型中「拆」出音频向量模型

从多模态大模型中「拆」出音频向量模型

从多模态大模型中「拆」出音频向量模型

Google 最近发了 Gemini Embedding 2,他们第一个原生多模态向量模型。文本、图像、视频、音频、文档,全部映射到同一个 3072 维向量空间。这是 Omni Embedding(全模态向量模型)的大趋势:一个架构吃下所有模态,从 jina-embeddings-v4 到 Omni-Embed-Nemotron 再到 Omni-5,大家都在往这个方向收敛。

来自主题: AI技术研报
5439 点击    2026-03-16 15:06