00 后团队做了个 AI 产品的大众点评,「观猹」今日上线
00 后团队做了个 AI 产品的大众点评,「观猹」今日上线这两年随着各种 AI 编程工具、AI 设计类产品的不断成熟,使得几个人的小团队,甚至一个人,加持几个 Agents “员工”之后,就能快速的做出许多惊艳的产品。 这些人被赋予了一个很酷的新名字 —— 超级个体。
这两年随着各种 AI 编程工具、AI 设计类产品的不断成熟,使得几个人的小团队,甚至一个人,加持几个 Agents “员工”之后,就能快速的做出许多惊艳的产品。 这些人被赋予了一个很酷的新名字 —— 超级个体。
首个工程自动化任务评估基准DrafterBench,可用于测试大语言模型在土木工程图纸修改任务中的表现。通过模拟真实工程命令,全面考察模型的结构化数据理解、工具调用、指令跟随和批判性推理能力,研究结果发现当前主流大模型虽有一定能力,但整体水平仍不足以满足工程一线需求。
AI医疗的造富神话,又一次上演。近日,AI医疗公司OpenEvidence获得了2.1亿美元的B轮融资,估值飙升至35亿美元(约合人民币251亿元)。
ChatGPT 现在可以思考行动,主动选择工具,用自己的虚拟计算机为你完成任务。 Agent AI 时代,比我们想象中来得要早一些。
从“流量贩卖”转向“决策赋能”。继抖音推出智能搜索App“AI抖音”后,百度悄然上线AI搜索应用“TizzyAI”,首次打出了“无广告”的旗帜,将沿袭二十余年的搜索商业模式拦腰斩断。这样一来,两大巨头在AI搜索赛道狭路相逢。
最难的不是创作,是变现。
80分钟的一场活动,Agent的“出镜次数”竟能高达217次。 解锁平均20多秒就提一次Agent的,正是云计算一哥,亚马逊云科技。
AI 商业化落地,技术固然重要,生态也举足轻重。
谷歌搜索迎来三大AI革新:集成最强Gemini 2.5 Pro模型、Deep Search功能随便用、最引人注目的是AI代打电话功能。目前功能在美国上线,未来将全球推广。
2025 年初,AI 应用领域出现了一个引人注目的转折点 —— 个人 AI 分身从实验室走向大规模应用。与以往的虚拟助手或聊天机器人不同,大家对新一代数字分身的预期是开始承担实质性的社交和工作职能:代替本人参加次要会议、维护社交关系、甚至进行创意协作。
大型语言模型已展现出卓越的能力,但其部署仍面临巨大的计算与内存开销所带来的挑战。随着模型参数规模扩大至数千亿级别,训练和推理的成本变得高昂,阻碍了其在许多实际应用中的推广与落地。
短剧公司新战场,在北京打响。
Bind-Your-Avatar是一个基于扩散Transformer(MM-DiT)的框架,通过细粒度嵌入路由将语音与角色绑定,实现精准的音画同步,并支持动态背景生成。该框架还引入了首个针对多角色对话视频生成的数据集MTCC和基准测试,实验表明其在身份保真和音画同步上优于现有方法。
2025世界人工智能大会(WAIC)将于7月26日至29日举行。
AI伴侣应用Replika的用户们深陷与数字好友的情感之中
从Cursor到Claude Code和最近很火的Kiro,AI编程能在几秒钟内生成完整的函数,但它真的理解代码在做什么吗?最近两项突破性研究发现了一个让人意外的结果:现在的AI虽然"会写",但还远没有"真懂"。
途见科技通过“电子皮肤”触觉系统,为具身智能增加视觉、听觉之外的感知。
imi K2的发布几乎没什么预兆。 2025年7月11日深夜,月之暗面直接开源了这个万亿参数模型,整个AI圈子一下子就热闹起来。模型的能力很强
近日,由普林斯顿大学牵头,联合清华大学、北京大学、上海交通大学、斯坦福大学,以及英伟达、亚马逊、Meta FAIR 等多家顶尖机构的研究者共同推出了新一代开源数学定理证明模型——Goedel-Prover-V2。
本文第一作者操雨康,南洋理工大学MMLab博士后,研究方向是3D/4D重建与生成,人体动作/视频生成,以及图像生成与编辑。
离开OpenAI,只是为了Meta天价薪资?Jason Wei离职博客,泄露天机:未来AI更令人向往!
如今,他创立的公司Rwazi 已获得由 Bonfire Ventures 领投的 1200 万美元 A 轮融资,旨在帮助企业获取市场情报和消费者洞察。
怎么快速判断一个生成模型好不好? 最直接的办法当然是 —— 去问一位做图像生成、视频生成、或者专门做评测的朋友。他们懂技术、有经验、眼光毒辣,能告诉你模型到底强在哪、弱在哪,适不适合你的需求。
Fiverr CEO认为当前99%的AI公司是泡沫,其业务易被复制且价值有限。AI将替代基础工作,迫使职场人需100%自动化现有任务以转向更高阶思考。
最近几个月,由谷歌和 Meta 前研究人员建立的欧洲的 AI 初创公司 Mistral AI 有些躁动不安。他们将 Le Chat 再一次升级,引入了一些强大的新功能,使其更强大、更直观,也更有趣,在功能上几乎全方位对标 ChatGPT。
就在刚刚,OpenAI最新发布来了,ChatGPT Agent正式对外亮相。这是一个把“想”和“干”统一了的智能体,之前深度研究的思考和分析能力,Operator的操作执行能力,在ChatGPT Agent实现了统一。
Transformer杀手来了?KAIST、谷歌DeepMind等机构刚刚发布的MoR架构,推理速度翻倍、内存减半,直接重塑了LLM的性能边界,全面碾压了传统的Transformer。网友们直呼炸裂:又一个改变游戏规则的炸弹来了。
Hi 这里是海辛和阿文~ 前段时间在 X 上看到博主 @sergeantsref 分享了一个 Midjourney 风格代码 --sref 2007748773 ,瞬间被圈粉。
从神经科学的角度看,记忆的形成、存储和提取涉及大脑多个区域的协同工作。
RAG(检索增强生成)作为解决大模型"幻觉"和知识时效性问题的关键技术,已成为企业AI应用的主流架构。Contextual AI由RAG技术的创始研究者组建,致力于开发能应对复杂知识密集型任务的专业智能体。