GDC上的中国游戏AI智能体们
GDC上的中国游戏AI智能体们关于AI智能体,GDC上腾讯游戏魔方工作室分享了《F.A.C.U.L:首个懂人类语言的 FPS AI 队友》的演讲(这个技术去年就有曝光),项目融合语音输入、大语言模型、实时文本转语音等生成式AI技术,让玩家能与AI队友沉浸式协同作战。
搜索
关于AI智能体,GDC上腾讯游戏魔方工作室分享了《F.A.C.U.L:首个懂人类语言的 FPS AI 队友》的演讲(这个技术去年就有曝光),项目融合语音输入、大语言模型、实时文本转语音等生成式AI技术,让玩家能与AI队友沉浸式协同作战。
正值“金三银四”,应届毕业生又进入到求职冲刺阶段,如果能够顺利杀出重围,便可以逃离毕业季的又一场肉搏。而因为ChatGPT、DeepSeek、豆包等AI产品的集体爆发,“AI潮”成为今年春招绕不开的主题。据《2025年春招市场行业周报(第一期)》数据显示,春招首周,人工智能行业求职人数同比增速达33.4%,位居行业第一;人工智能工程师的求职增速达69.6%,位居职业榜首。
疯哥收到最多的问题就是关于n8n与coze(扣子)、Dify有何不同,n8n和他们相比有什么优势?疯哥是资深n8n玩家,深知n8n能带给个人和企业多么强大的能力。但是,非常多的国内朋友从来都没听说过n8n,更不用提使用n8n为自己和企业搭建强大的AI自动化工作流。
3月29日,智源研究院在2025中关村论坛“未来人工智能先锋论坛”上发布首个跨本体具身大小脑协作框架RoboOS与开源具身大脑RoboBrain,可实现跨场景多任务轻量化快速部署与跨本体协作,推动单机智能迈向群体智能,为构建具身智能开源统一生态加速场景应用提供底层技术支持。
论文第一作者为余鑫,香港大学三年级博士生,通讯作者为香港大学齐晓娟教授。主要研究方向为生成模型及其在图像和 3D 中的应用,发表计算机视觉和图形学顶级会议期刊论文数十篇,论文数次获得 Oral, Spotlight 和 Best Paper Honorable Mention 等荣誉。此项研究工作为作者于 Adobe Research 的实习期间完成。
一夜之间,CV被大模型“解决”了(狗头)。万物皆可吉卜力之后,GPT-4o原生多模态图像生成更多玩法被开发出来。万物皆可吉卜力之后,GPT-4o原生多模态图像生成更多玩法被开发出来。
2025中关村论坛人工智能主题日,高能不断。清华系团队全新Vidu Q1视频生成可控性再创新高,炫目demo惊艳全场。图灵奖得主Joseph Sifakis、清华朱军、百度王海峰等大咖演讲,更是将论坛推向专业的巅峰。
和腾讯、字节通过元宝、豆包发力AI to C市场不同,2024年京东在AI端重点发力言犀大模型、数字人、智能体平台、智能编码助手JoyCoder等B端产品。截至2024年底,京东平台上已经有80万商家使用了京东AI工具。
全球顶级聪明的一群人,加上无上限的资金支持,一年时间里究竟能诞生多少独角兽企业?2024年,硅谷给出的答案是61家。
秘密、误导与破裂的信任。一场关于科技界最红 CEO 被迅速驱逐又戏剧性回归的内幕。
随着Deepseek持续火热,部分医生和患者纷纷在线种草。但在近日,「AI 误诊,上海患者获赔127万」的消息在各大社交平台迅速传播、引起争议。
人工智能已经无处不在,我们使用 AI 的方式,也逐渐从搜索引擎时期的「提问」,过渡到了 AI 聊天机器人时代的「对话」。
马斯克又一次展现了对「X」和AI的狂热,决定将旗下社交平台X以全股票交易方式出售给自己的AI公司xAI,合并后xAI估值1130亿美元,超过了2月份对OpenAI要约价974亿美元。这次收购彰显了马斯克「All in AI」战略决心。
3D生成版DeepSeek再上新高度!
AI化身心理医生,效果堪比人类专家,你敢相信吗?
这三篇论文,出自同一AI之手。
还记得那个自制 AI 工具 Interview Coder、以此斩获了亚马逊、Meta 和 TikTok 等大厂 Offer 的 21 岁哥伦比亚大学学生 Chungin Lee(Roy Lee)吗?
曾德钧今年 69 岁。这是他创办「猫王品牌」的第十年。
在科技重塑医疗的新浪潮下,张强医生集团经过一年多的精心筹备、无数次严格测试和调试,全球首个静脉曲张垂直领域AI智能体VaricoSeek 1.0版对广大患者和医生开放免费使用。
幻觉(Hallucination),即生成事实错误或不一致的信息,已成为视觉-语言模型 (VLMs)可靠性面临的核心挑战。随着VLMs在自动驾驶、医疗诊断等关键领域的广泛应用,幻觉问题因其潜在的重大后果而备受关注。
继昨天《RAG太折磨人啦,试下pip install rankify,检索、重排序、RAG三合一,完美》发布之后,有许多朋友向我询问Rankify的具体使用方法和部署细节,尤其是生产环境如何处理自定义数据集和本地数据集。
从单张图像生成灵活视角3D场景的技术来了,在考古保护、自主导航等直接获取3D数据成本高昂或不可行的领域具有重要应用价值。
在互联网时代,数据已成为企业发展的必经之路。
近一年以来,AI 视频生成技术发展迅猛。自 2024 年初 Sora 问世后,大家惊喜地发现:原来 AI 可以生成如此逼真的视频,一时间各大高校实验室、互联网巨头 AI Lab 以及创业公司纷纷入局视频生成领域。
AGI的这两年,基本OpenAI压着谷歌打的两年,包括但不限于谷歌自己的失误、每次发布会的被截胡。比如这次Gemini 2.5 Pro 被 4o图片生成功能抢走了几乎所有关注点。但谷歌确实也在一直追赶,从最开始的措手不及,到现在已经开始有来有往。著名科技杂志《连线》采访了谷歌前和现员工超50人,发布了一篇长文,深度挖掘了谷歌这两年苦苦追赶Openai的内幕故事,
三维高斯泼溅(3D Gaussian Splatting, 3DGS)技术基于高斯分布的概率模型叠加来表征场景,但其重建结果在几何和纹理边界处往往存在模糊问题。
「仅需一次前向推理,即可预测相机参数、深度图、点云与 3D 轨迹 ——VGGT 如何重新定义 3D 视觉?」
AI社区掀起用大模型玩游戏之风!例如国外知名博主让DeepSeek和Chatgpt下国际象棋的视频在Youtube上就获得百万播放,ARC Prize组织最近也发布了一个贪吃蛇LLM评测基准SnakeBench。
一觉醒来,xAI 收购了 X(也叫推特或 𝕏)!这两家公司的 CEO 伊隆・马斯克在 X 上宣布:「xAI 通过一次全股票交易收购了 X。此次合并对 xAI 的估值为 800 亿美元,对 X 的估值为 330 亿美元(450 亿美元减去 120 亿美元的债务)。」
最近几天,OpenAI 革新的 GPT-4o 图像功能给大家带来了不少乐趣,各路社交媒体都被「吉卜力」风格的图像、视频刷了屏。机器之心还尝试了制作了《甄嬛传》的名场面(视频如下,制作方法参见《GPT-4o 整活!3 个小时、6 个镜头重现吉卜力版《甄嬛传》名场面》)。