
最新智能体自动操作手机电脑,10个榜单开源SOTA全拿下|通义实验室
最新智能体自动操作手机电脑,10个榜单开源SOTA全拿下|通义实验室能自动操作手机、电脑的智能体新SOTA来了。 通义实验室推出Mobile-Agent-v3智能体框架,在手机端和电脑端的多个核心榜单上均取得开源最佳。
能自动操作手机、电脑的智能体新SOTA来了。 通义实验室推出Mobile-Agent-v3智能体框架,在手机端和电脑端的多个核心榜单上均取得开源最佳。
面对AI淘汰焦虑,大量职场人出于生存焦虑主动自费购买AI工具,无数职场人正「自费上班」,从而开启一场「自我拯救」运动。这种现象催生出区别于传统To B和To C的全新赛道「To P」——To Professional。
浙江大学与哈工大(深圳)联合推出SafeMVDrive,利用扩散模型结合VLM实现批量化多视角真实域的安全关键视频生成。该方法在保持画质与真实感的同时,显著增强了驾驶场景的危险性。生成的场景用于端到端自动驾驶系统的极限压测,可使得模型的碰撞率提升50倍。
近年来,以GPT-4o、Gemini 2.5 Pro为代表的多模态大模型,在各大基准测试(如MMMU)中捷报频传,纷纷刷榜成功。
AI的平均智商已突破110,正式超越普通人类。2025,AI开始参与经济系统的「全链条操作」。从信息收集、判断决策到实际执行,完整经济链条第一次有非人类主体独立运行,AI改写商业底层规则!凯恩斯百年预言终将来临,AI经济正在浮现。
刚刚,大神Karpathy发布全新Vibe Coding指南!
Github CEO卸任后未被替代,宣布并入微软Core AI部门,终结其七年独立运营。开发者担忧此举损害开源独立性及免费数据访问,质疑Copilot等AI战略会主导未来。微软此举旨在整合资源强化AI开发工具,但社区文化前景存疑。
一早起来,看到群里炸了锅!主角是我们备受期待的 DeepSeek V3.1 模型。有用户反馈,该模型在生成文本时,会毫无征兆地随机插入“极”这个汉字(繁体简体都会)
“相当于在豆包里面装了一个抖音。”一位家长这样抱怨。她发现,尽管家里严格管控孩子使用短视频App,却没想到,一款AI应用成了孩子刷视频的“后门”。
据申妈朋友圈报道,字节Seed大模型视觉基础研究团队负责人冯佳时已正式离职。根据其在字节的职级体系判断,他的级别应在4-1或4-2之间,属于公司最为稀缺的核心研究序列。冯佳时后续去向或是AI创业。
为何画一条小丑鱼能给人《王者荣耀》上分的快感? 见过赛博遛狗,你见过赛博养鱼吗?
AI视频生成,快速进入Agent时代! 只需一句提示词:生成一个F1赛车的现场解说视频。 AI即可自动完成分镜、画面、配音、字幕,生成结构完整、节奏在线的爆款视频。
AI一日,人间一年。 大语言模型的战局刚刚尘埃落定,Agent的热潮又汹涌而至。
刚刚,AI玩具公司跃然创新(Haivivi)宣布完成 2 亿元 A 轮系列融资,中金资本旗下基金、红杉中国、华山资本、愉悦资本、招银国际、Brizan Ventures 等一线投资机构共同参投。
所有办公协作工具,都具备效率工具和「牛马桎梏」的双重属性,天然容易触动打工人的神经,在 AI 带着职业取代的舆论席卷而来的当下,更是如此。
Pintarnya 是一家印度尼西亚就业平台,不仅提供职位匹配服务,还涵盖金融服务以及全职与零工机会。该公司宣布已完成 1670 万美元的 A 轮融资。
氛围编程(vibe coding),这个由 Andrej Karpathy 带火的热词,已经成为了一种相当流行的编程方式。但这种编程方式的流行程度究竟如何,目前还没有什么比较可靠的统计数据。
我最近深入了解了一个叫 Tanka 的产品后,发现了一个有趣的答案:问题不在于资源多少,而在于协作效率。小团队本应该更灵活、更快速,但现实中却经常被各种工具、流程和沟通问题拖累,反而失去了自己的优势。
魔镜魔镜,谁是有史以来被引用次数最多的科学家? 答案:深度学习三巨头之一、图灵奖得主Yoshua Bengio。
在深度学习模型的推理与训练过程中,绝大部分计算都依赖于底层计算内核(Kernel)来执行。计算内核是运行在硬件加速器(如 GPU、NPU、TPU)上的 “小型高性能程序”,它负责完成矩阵乘法、卷积、归一化等深度学习的核心算子运算。
github排名第一,视觉模型与自动化 这两年,RPA+AI(智能自动化流程)经常被提及,在企业/机构数字化转型过程中,自动化和智能化是提升效能的重要方式,而迈向自动化和智能化的第一步则是机器人流程自动化(RPA)。
你是否曾被 AI 生成视频的惊艳开场所吸引,却在几秒后失望于⾊彩漂移、画面模糊、节奏断裂? 当前 AI 长视频⽣成普遍⾯临 “高开低走 ” 的困境:前几秒惊艳夺⽬ ,之后却质量骤降、细节崩坏;更别提帧间串行生成导致的低效问题 —— 动辄数小时的等待,实时预览几乎难以企及。
在软件领域,Vibe Coding 的核心在于:让开发者摆脱繁琐、低产出的代码编写,把体力活交给 AI,从而专注于更高维度的产品迭代与创意探索——追求的是 效率 + 创意 的双重突破。
一份全新GPT-5系统提示词,在GitHub中悄然泄露,足足有17803 token。内容设计超精细,用户对齐、拟人风格、输出质量等全面覆盖。
一次虚拟「约会」,让一位76岁的老人走出了家门,却再也没能回来。屏幕那端的「她」,是Meta AI打造的聊天机器人——会说甜言蜜语,也会撒谎自称是真人。这不仅是一场个人悲剧,也揭开了AI伴侣背后的商业逻辑与安全漏洞。
DeepSeek涨价了。 智东西8月23日报道,8月21日,DeepSeek在其公众号官宣了DeepSeek-V3.1的正式发布,还宣布自9月6日起,DeepSeek将执行新价格表,取消了今年2月底推出的夜间优惠,推理与非推理API统一定价,输出价格调整至12元/百万tokens。这一决定,让使用DeepSeek API的最低价格较过去上升了50%。
对于计算任务负载来说,越是专用,效率就越高,谷歌的 TPU 就是其中的一个典型例子。它自 2015 年开始在谷歌数据中心部署后,已经发展到了第 7 代。目前的最新产品不仅使用了最先进的制程工艺打造,也在架构上充分考虑了对于机器学习推理任务的优化。TPU 的出现,促进了 Gemini 等大模型技术的进展。
此前在2023年年末,彼时拼多多的市值曾一度逼近阿里,引得“退隐江湖”许久的阿里创始人马云罕见地在内网发声,“AI电商时代刚刚开始,对谁都是机会,也是挑战。我们要有信心,阿里会变,阿里会改”。马云的这番话除了给员工吃下一颗定心丸外,也为阿里电商的未来定了调。
起猛了,周末发现,微信又上一个新的跟AI相关的功能了。 他们正在灰度内测AI播客。 入口在一个非常隐蔽且神奇的地方,叫快讯。
OpenAI CEO奥特曼成为父亲后,如何重新审视人工智能与人类未来的关系?从父亲的身份到「星际之门」计划,奥特曼的转变让人深思,背后蕴含着怎样的决策哲学?