AI资讯新闻榜单内容搜索-GE

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GE
RAG不会过时,但你需要这10个上下文处理技巧|Context Engineering系列一

RAG不会过时,但你需要这10个上下文处理技巧|Context Engineering系列一

RAG不会过时,但你需要这10个上下文处理技巧|Context Engineering系列一

RAG效果不及预期,试试这10个上下文处理优化技巧。对大部分开发者来说,搭一个RAG或者agent不难,怎么把它优化成生产可用的状态最难。在这个过程中,检索效率、准确性、成本、响应速度,都是重点关注问题。

来自主题: AI技术研报
7907 点击    2025-11-29 10:03
北大新作EvoVLA:大幅降低机器人幻觉,长序列成功率暴涨10%

北大新作EvoVLA:大幅降低机器人幻觉,长序列成功率暴涨10%

北大新作EvoVLA:大幅降低机器人幻觉,长序列成功率暴涨10%

具身智能的「ChatGPT时刻」还没到,机器人的「幻觉」却先来了?在需要几十步操作的长序列任务中,现有的VLA模型经常「假装在干活」,误以为任务完成。针对这一痛点,北京大学团队提出自进化VLA框架EvoVLA。该模型利用Gemini生成「硬负样本」进行对比学习,配合几何探索与长程记忆,在复杂任务基准Discoverse-L上将成功率提升了10.2%,并将幻觉率从38.5%大幅降至14.8%。

来自主题: AI技术研报
7855 点击    2025-11-29 09:58
上线24小时就被黑!曝谷歌新AI编程工具存在严重Bug:哪怕卸载重装,后门仍会「自动复活」

上线24小时就被黑!曝谷歌新AI编程工具存在严重Bug:哪怕卸载重装,后门仍会「自动复活」

上线24小时就被黑!曝谷歌新AI编程工具存在严重Bug:哪怕卸载重装,后门仍会「自动复活」

如果说过去一年里,AI 让开发者生产力翻倍,那么如今它也开始以同样的速度放大风险。 上周,Google 刚刚推出的基于 Gemini 的全新 AI 编码工具 Antigravity,上线不到 24 小时便被一名安全研究员攻破,指出它存在严重的安全Bug。

来自主题: AI资讯
7945 点击    2025-11-28 21:03
GetDraft上线:给你搭一个从复刻文风到审稿的AI写作天团

GetDraft上线:给你搭一个从复刻文风到审稿的AI写作天团

GetDraft上线:给你搭一个从复刻文风到审稿的AI写作天团

作为得到AI学习圈的主理人,我的日常除了帮大家盯着AI领域的前沿动态,另一项重要任务就是高强度地测评和使用各种AI产品。说实话,在写作这类AI工具上,我经常感到无聊——很多工具生成的文章虽然快,但往往千篇一律。

来自主题: AI资讯
9889 点击    2025-11-28 15:00
8 年数字化积淀,星巴克中国技术团队开始用 Agentic AI 改变零售

8 年数字化积淀,星巴克中国技术团队开始用 Agentic AI 改变零售

8 年数字化积淀,星巴克中国技术团队开始用 Agentic AI 改变零售

“星巴克内部正在计划,希望在三年内为所有员工配备一个‘数字员工助手’,可能不止一个。有了这样的助手,我们会有更多的时间思考和创新,这些是 AI 永远也给不了的。”

来自主题: AI资讯
7246 点击    2025-11-28 14:00
美国宣战,AI曼哈顿计划打响第一枪!「AI科学家」成最新核武器

美国宣战,AI曼哈顿计划打响第一枪!「AI科学家」成最新核武器

美国宣战,AI曼哈顿计划打响第一枪!「AI科学家」成最新核武器

特朗普按下「创世纪」按钮之时,美国举国豪赌「AI曼哈顿计划」!白宫给它起名叫——美国创世纪计划(US Genesis Mission): 让AI直接参与提出科学假设、设计实验、分析数据,让「AI科学家」加速科研创新。

来自主题: AI资讯
7395 点击    2025-11-28 13:53
还在用 Gemini 3 写 PPT?这才是最酷炫的玩法(附提示词)

还在用 Gemini 3 写 PPT?这才是最酷炫的玩法(附提示词)

还在用 Gemini 3 写 PPT?这才是最酷炫的玩法(附提示词)

Gemini 3 发布之后这些日子里,我逐渐感到疑惑:为什么总让 AI 写网站写 PPT,Gemini 都发到第三代了,不能干点更有意思的事吗?

来自主题: AI资讯
10591 点击    2025-11-28 10:41
生成式AI赋能需求工程:一场正在发生的变革

生成式AI赋能需求工程:一场正在发生的变革

生成式AI赋能需求工程:一场正在发生的变革

在软件开发领域,需求工程(Requirements Engineering, RE)一直是项目成功的关键环节。然而,传统 RE 方法面临着效率低下、需求变更频繁等挑战。根据 Standish Group 的报告,仅有 31% 的软件项目能在预算和时间内完成,而需求相关问题导致的项目失败率高达 37%。

来自主题: AI技术研报
9351 点击    2025-11-28 10:39
AI基准测试集体塌房,最高84%都是坏题 |斯坦福最新研究

AI基准测试集体塌房,最高84%都是坏题 |斯坦福最新研究

AI基准测试集体塌房,最高84%都是坏题 |斯坦福最新研究

基准测试(Benchmarks)在人工智能的发展进程中扮演着至关重要的角色,构成了评价生成式模型(Generative Models)性能的事实标准。对于从事模型训练与评估的AI研究者而言,GSM8K、MMLU等数据集的数据质量直接决定了评估结论的可靠性。

来自主题: AI技术研报
8352 点击    2025-11-28 09:28
深度讨论 Gemini 3 :Google 王者回归,LLM 新一轮排位赛猜想|Best Ideas

深度讨论 Gemini 3 :Google 王者回归,LLM 新一轮排位赛猜想|Best Ideas

深度讨论 Gemini 3 :Google 王者回归,LLM 新一轮排位赛猜想|Best Ideas

最近两周的模型竞赛非常热闹:OpenAI 在 11 月 12 日发布 GPT-5.1,引入更强的推理深度与更高效的对话体验;Google 在 11 月 18 日发布 Gemini 3,全面强化多模态理解与复杂推理能力;Anthropic 在 11 月 24 日又发布了 Claude Opus 4.5,模型在专业文档处理、代码生成与长流程 agent 方面有显著提升。

来自主题: AI资讯
7946 点击    2025-11-28 09:27