AI资讯新闻榜单内容搜索-香港

万字综述遥感AI智能体！六大应用场景全面爆发，地理空间智能从「眼睛」变「大脑」

如今，一场由 AI 智能体驱动的变革正在发生。近日，来自香港科技大学、西北工业大学、清华大学等多家高校及研究机构的学者联合发布了遥感 AI 智能体领域系统综述。全文逾万字，首次为「遥感智能体」给出了严格定义，系统梳理了其架构、应用、数据集与未来方向。

来自主题: AI技术研报

8518 点击 2026-03-21 09:28

无需 VPN 翻墙！香港也能用上谷歌 Gemini 了

香港用户终于等来了这一天——谷歌宣布将逐步向香港开放 Gemini 网页应用，这意味着以后再也不需要翻墙 VPN 就能用上谷歌的 AI 助手了。在此之前，使用香港网络的用户一直无法直接访问 Gemini，需要借助 VPN 等「曲线救国」的方式才能使用。

来自主题: AI资讯

9149 点击 2026-03-19 21:54

ICLR 2026｜在「想象」中进化的机器人：港科大×字节跳动Seed提出WMPO，在世界模型中进行VLA强化学习

香港科技大学 PEI-Lab 与字节跳动 Seed 团队近期提出的 WMPO（World Model-based Policy Optimization），正是这样一种让具身智能在 “想象中训练” 的新范式。该方法无需在真实机器人上进行大规模强化学习交互，却能显著提升策略性能，甚至涌现出自我纠错（Self-correction）行为。

来自主题: AI技术研报

8902 点击 2026-03-02 14:31

ICLR 2026 | 把视频扩散模型压到4bit，还能接近满血效果？ QVGen让「超低比特视频生成量化」真正可用

香港科技大学 & 北航 & 商汤等提出了一个专门面向视频生成扩散模型的 QAT 范式 ——QVGen，在 3-bit / 4-bit 都能把质量拉回来，并且让 4-bit 首次接近全精度表现成为现实。该论文现已被 ICLR 高分接收：rebuttal 前 88666（top 1.4%），rebuttal 后 88886 （top 0.5%）。

来自主题: AI技术研报

8641 点击 2026-02-28 15:12

ICLR 2026 | 数据缺少标注，RL还能稳定诱导模型推理吗？Co-rewarding提供自监督RL学习方案！

针对这一挑战，来自香港浸会大学和上海交通大学的可信机器学习和推理组提出了一个全新的自监督 RL 框架 ——Co-rewarding。该框架通过在数据端或模型端引入互补视角的自监督信号，稳定奖励获取，提升 RL 过程中模型奖励投机的难度，从而有效避免 RL 训练崩溃，实现稳定训练和模型推理能力的诱导。

来自主题: AI技术研报

8466 点击 2026-02-24 15:16

具身大模型LaST₀：双臂/移动/灵巧手全面新SOTA，首次引入隐空间时空思维链

LaST₀团队投稿量子位 | 公众号 QbitAI 近日，至简动力、北京大学、香港中文大学、北京人形机器人创新中心提出了一种名为LaST₀的全新隐空间推理VLA模型，在基于Transformer混

来自主题: AI技术研报

6757 点击 2026-02-08 11:50

三个月完成两轮融资！前蚂蚁大模型首席架构师创业，发布行业首款 GEO 产品化 AI Agent

营销，正式进入 AI 时代。近日，专注于答案引擎优化（AEO）的 AI Agent 平台 PallasAI 宣布完成数千万人民币融资，由香港上市公司有赞（8083.HK）独家投资。这是该公司三个月内

来自主题: AI资讯

9598 点击 2026-02-07 14:22

原蚂蚁班底组队创业，打造GEO AI Agent，3个月内再融数千万

智东西2月6日报道，据Z Finance独家获悉，近日，答案引擎优化（AEO）AI Agent平台PallasAI完成数千万人民币的天使轮融资，由香港上市公司有赞独家投资。这是PallasAI三个月内获得的第二笔投资。

来自主题: AI资讯

10212 点击 2026-02-07 14:19

Agent学会“预测同伴”，神经网络里涌现出了类社会位置细胞

近日，香港城市大学博士生方政儒和所在团队让一群智能体在虚拟迷宫里共同探索，只给它们一个极其简单的目标——那就是学会预测同伴下一秒会看到什么以及会走到哪里。结果发现这些智能体不仅学会了高效合作，还在自己的“大脑”里自发形成了类似动物大脑中的“地图细胞”，甚至发明了一套只有它们才懂的秘密语言。

来自主题: AI资讯

9804 点击 2026-01-29 14:57

一张图生成任意场景3D模型，部分遮挡也不怕｜IDEA x 光影焕像联合开源

IDEA研究院张磊团队与香港科技大学谭平团队联合推出SceneMaker框架，有望攻克这一问题。它以视启未来的万物检测模型DINO-X与光影焕像的万物3D生成模型Triverse为基础，实现了从任意开放世界图像（室内/室外/合成图等）到带Mesh的3D场景的完整重建。

来自主题: AI技术研报

8833 点击 2026-01-26 10:16