AI资讯新闻榜单内容搜索-opena

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: opena
字节Seed团队PHD-Transformer突破预训练长度扩展!破解KV缓存膨胀难题

字节Seed团队PHD-Transformer突破预训练长度扩展!破解KV缓存膨胀难题

字节Seed团队PHD-Transformer突破预训练长度扩展!破解KV缓存膨胀难题

最近,DeepSeek-R1 和 OpenAI o1/03 等推理大模型在后训练阶段探索了长度扩展(length scaling),通过强化学习(比如 PPO、GPRO)训练模型生成很长的推理链(CoT),并在奥数等高难度推理任务上取得了显著的效果提升。

来自主题: AI技术研报
5582 点击    2025-04-28 14:09
AI教父站到了OpenAI对立面

AI教父站到了OpenAI对立面

AI教父站到了OpenAI对立面

日前,一封公开信拦在了OpenAI的重组之路上。该公开信由诺奖得主、AI教父Geoffrey Hinton联合10名前OpenAI员工及其他业内人士共同发表,要求停止OpenAI的重组计划。

来自主题: AI资讯
6835 点击    2025-04-28 09:53
OpenAI没说的秘密,Meta全揭了?华人一作GPT-4o同款技术,爆打扩散王者

OpenAI没说的秘密,Meta全揭了?华人一作GPT-4o同款技术,爆打扩散王者

OpenAI没说的秘密,Meta全揭了?华人一作GPT-4o同款技术,爆打扩散王者

自回归模型,首次生成2048×2048分辨率图像!来自Meta、西北大学、新加坡国立大学等机构的研究人员,专门为多模态大语言模型(MLLMs)设计的TokenShuffle,显著减少了计算中的视觉Token数量,提升效率并支持高分辨率图像合成。

来自主题: AI技术研报
7996 点击    2025-04-28 09:16
AI对战略咨询公司的影响,及其应对(以麦肯锡、BCG 为例)

AI对战略咨询公司的影响,及其应对(以麦肯锡、BCG 为例)

AI对战略咨询公司的影响,及其应对(以麦肯锡、BCG 为例)

自 OpenAI 发布 chatgpt 以来,业内除了技术公司、媒体公司比较关注其进展以外,还有一个行业比较关注,那就是战略咨询行业。尤其是最近 GPT-4o、Claude 3.7 Sonnet 为代表的最新大模型在数据分析、内容生成、编码和复杂推理方面展现出强大能力,与战略咨询工作的核心环节高度相关 。

来自主题: AI资讯
8004 点击    2025-04-28 08:58
实测免费DeepResearch!轻量版深夜上线,基于o4-mini,速度更快/重视脉络梳理

实测免费DeepResearch!轻量版深夜上线,基于o4-mini,速度更快/重视脉络梳理

实测免费DeepResearch!轻量版深夜上线,基于o4-mini,速度更快/重视脉络梳理

终于,免费用户也能用上OpenAI的DeepResearch了,量子位也进行了新鲜实测!OpenAI深夜官宣,基于o4-mini某个版本的轻量版DeepResearch正式上线。按照官方说法,轻量版的回答会更短,但智能水平将几乎无异于满血版本。

来自主题: AI资讯
7890 点击    2025-04-27 10:20
美国政府「AI行动计划」万言书发布! OpenAI与Anthropic呼吁联手封锁中国AI

美国政府「AI行动计划」万言书发布! OpenAI与Anthropic呼吁联手封锁中国AI

美国政府「AI行动计划」万言书发布! OpenAI与Anthropic呼吁联手封锁中国AI

就在刚刚,美国政府曝光了各界对「AI行动计划」的全部政策建议。OpenAI措辞激烈地表示,DeepSeek让我们看到,必须马上锁死中国AI,必须限制高端GPU芯片和模型权重流向中国!Anthropic同样呼吁:必须立马补上H20这一关键漏洞,并且严控H100的门槛。

来自主题: AI资讯
5890 点击    2025-04-26 19:49
具身交互推理: 图像-思考-行动交织思维链让机器人会思考、会交互

具身交互推理: 图像-思考-行动交织思维链让机器人会思考、会交互

具身交互推理: 图像-思考-行动交织思维链让机器人会思考、会交互

OpenAI 的 o1 系列模型、Deepseek-R1 带起了推理模型的研究热潮,但这些推理模型大多关注数学、代码等专业领域。

来自主题: AI技术研报
5846 点击    2025-04-26 15:31