三维空间太难懂?RoboTracer让机器人理解复杂空间指令,推理3D空间轨迹,开放世界也能精确行动
三维空间太难懂?RoboTracer让机器人理解复杂空间指令,推理3D空间轨迹,开放世界也能精确行动我们希望具身机器人真正走进真实世界,尤其走进每个人的家里,帮我们完成浇花、收纳、清洁等日常任务。但家庭环境不像实验室那样干净、单一、可控:物体种类多、摆放杂、随时会变化,这让机器人在三维物理世界中「看懂并做好」变得更难。
我们希望具身机器人真正走进真实世界,尤其走进每个人的家里,帮我们完成浇花、收纳、清洁等日常任务。但家庭环境不像实验室那样干净、单一、可控:物体种类多、摆放杂、随时会变化,这让机器人在三维物理世界中「看懂并做好」变得更难。
一场史上最疯狂的万亿级抢钱大战,让SpaceX、OpenAI、Anthropic集体走向「流血IPO」!当私人资本已接不住万亿黑洞,巨头们正以前所未有的姿态,用今天失控的亏损,对赌人类的未来。这是狂欢,还是豪赌?
近日,AI机器人初创Medra宣布完成了5200万美元A轮融资,加上先前筹集的1100万美元,总融资达到6300万美元(约合人民币4.4亿元)。
年少有为、雄心勃勃的创业者早已不是新鲜事。Bill Gates 19 岁时联合创办了微软;Mark Zuckerberg 也是在 19 岁那年创立了 Facebook。但如今的创业者,年龄更小了,可能还只是个拿着学车许可证、戴着牙套的孩子。
前段时间,我们在 HuggingFace 页面发现了两个新模型:LLaDA2.0-mini 和 LLaDA2.0-flash。它们来自蚂蚁集团与人大、浙大、西湖大学组成的联合团队,都采用了 MoE 架构。前者总参数量为 16B,后者总参数量则高达 100B—— 在「扩散语言模型」这个领域,这是从未见过的规模。
AI真的上天了。
在美国也出现了一种“开源重新兴起”的现象,某种意义上是对中国发展的反应。所以美国开始重新推动大量开源。
6B小模型,首日下载量高达50万次,上线不到两天直接把HuggingFace两个榜单都冲了个第一。
General Agent将如何融入贝索斯公司尚未可知。 General Agents由前OpenAI研究员威廉·格斯(William Guss)于2024年创办,汇聚了来自麻省理工大学、谷歌大脑等高校和机构的研究人员,专注计算机Agent赛道,目前已发布一款Agent产品Ace,该产品能接管用户的电脑并以超人类的速度执行指令操作。
腾讯混元大模型团队正式发布并开源HunyuanOCR模型!这是一款商业级、开源且轻量(1B参数)的OCR专用视觉语言模型,模型采用原生ViT和轻量LLM结合的架构。目前,该模型在抱抱脸(Hugging Face)趋势榜排名前四,GitHub标星超过700,并在Day 0被vllm官方团队接入。