AI资讯新闻榜单内容搜索-ATI

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: ATI
GPT-5被曝不及预期,OpenAI员工:没什么科学突破了,接下来只需要工程

GPT-5被曝不及预期,OpenAI员工:没什么科学突破了,接下来只需要工程

GPT-5被曝不及预期,OpenAI员工:没什么科学突破了,接下来只需要工程

猛料来了,OpenAI下一代旗舰模型被曝提升不如预期。消息来自The Information,具体指代号“猎户座”(Orion)的模型相对GPT-4的提升幅度,小于GPT-4相对GPT-3,已进入收益递减阶段。或许这也是奥特曼曾说,可能不会把新模型命名为GPT-5的原因之一。

来自主题: AI资讯
5422 点击    2024-11-11 15:30
数十亿美元!传亚马逊又要投资Anthropic,但有一个条件

数十亿美元!传亚马逊又要投资Anthropic,但有一个条件

数十亿美元!传亚马逊又要投资Anthropic,但有一个条件

智东西11月8日消息,据外媒The Information报道,亚马逊正讨论向美国AI大模型独角兽Anthropic进行第二笔数十亿美元的投资。

来自主题: AI资讯
3079 点击    2024-11-09 09:48
聚焦「视听触感官」协同配合的具身精细操纵,人大胡迪团队领衔探索机器人模态时变性挑战

聚焦「视听触感官」协同配合的具身精细操纵,人大胡迪团队领衔探索机器人模态时变性挑战

聚焦「视听触感官」协同配合的具身精细操纵,人大胡迪团队领衔探索机器人模态时变性挑战

中国人民大学高瓴人工智能学院 GeWu 实验室、朝闻道机器人和 TeleAI 最近的合作研究揭示并指出了 “模态时变性”(Modality Temporality)现象,通过捕捉并刻画各个模态质量随物体操纵过程的变化,提升不同信息在具身多模态交互的感知质量,可显著改善精细物体操纵的表现。论文已被 CoRL2024 接收并选为 Oral Presentation。

来自主题: AI技术研报
3301 点击    2024-11-08 19:26
50s完成7B模型量化,4bit达到新SOTA,大模型低比特量化有新招了 | NeurIPS 2024 Oral

50s完成7B模型量化,4bit达到新SOTA,大模型低比特量化有新招了 | NeurIPS 2024 Oral

50s完成7B模型量化,4bit达到新SOTA,大模型低比特量化有新招了 | NeurIPS 2024 Oral

消除激活值(outliers),大语言模型低比特量化有新招了—— 自动化所、清华、港城大团队最近有一篇论文入选了NeurIPS 2024(Oral Presentation),他们针对LLM权重激活量化提出了两种正交变换,有效降低了outliers现象,达到了4-bit的新SOTA。

来自主题: AI技术研报
3641 点击    2024-11-07 20:51
字节豆包大模型团队突破残差连接局限!预训练收敛最快加速80%

字节豆包大模型团队突破残差连接局限!预训练收敛最快加速80%

字节豆包大模型团队突破残差连接局限!预训练收敛最快加速80%

字节跳动豆包大模型团队于近日提出超连接(Hyper-Connections),一种简单有效的残差连接替代方案。面向残差连接的主要变体的局限问题,超连接可通过动态调整不同层之间的连接权重,解决梯度消失和表示崩溃(Representation Collapse)之间的权衡困境。在 Dense 模型和 MoE 模型预训练中,超连接方案展示出显著的性能提升效果,使收敛速度最高可加速 80%。

来自主题: AI技术研报
4410 点击    2024-11-07 17:41
5个知识图谱KG和RAG系统的误解 — 构建和使用RAG原生图谱

5个知识图谱KG和RAG系统的误解 — 构建和使用RAG原生图谱

5个知识图谱KG和RAG系统的误解 — 构建和使用RAG原生图谱

在本文中,我们想要解决GraphRAG系统中的一些常见误解。我们特别关注理解知识图谱构建技术和我们称之为“RAG-Native Graphs”所带来的细微差别。

来自主题: AI资讯
6461 点击    2024-11-06 10:11
NeurIPS 2024|新一代芯片电路逻辑综合,可扩展可解释的神经电路生成框架

NeurIPS 2024|新一代芯片电路逻辑综合,可扩展可解释的神经电路生成框架

NeurIPS 2024|新一代芯片电路逻辑综合,可扩展可解释的神经电路生成框架

近日,中科大王杰教授团队(MIRA Lab)和华为诺亚方舟实验室(Huawei Noah's Ark Lab)联合提出了可生成具有成千上万节点规模的神经电路生成与优化框架,具备高扩展性和高可解释性,这为新一代芯片电路逻辑综合工具奠定了重要基础。论文发表在 CCF-A 类人工智能顶级会议 Neural Information Processing Systems(NeurIPS 2024)。

来自主题: AI技术研报
3136 点击    2024-11-05 15:01
高效评估多模态预训练对齐质量,中科大提出模态融合率MIR

高效评估多模态预训练对齐质量,中科大提出模态融合率MIR

高效评估多模态预训练对齐质量,中科大提出模态融合率MIR

来自中科大等单位的研究团队共同提出了用来有效评估多模态大模型预训练质量的评估指标 Modality Integration Rate(MIR),能够快速准确地评估多模态预训练的模态对齐程度。

来自主题: AI技术研报
3549 点击    2024-11-04 17:13
3D大模型助力,15分钟即可训练高质量、个性化的数字人模型,代码已开放

3D大模型助力,15分钟即可训练高质量、个性化的数字人模型,代码已开放

3D大模型助力,15分钟即可训练高质量、个性化的数字人模型,代码已开放

个性化精品数字人(Personalized Talking Face Generation)强调合成的数字人视频在感官上与真人具有极高的相似性(不管是说话人的外表还是神态)。

来自主题: AI技术研报
4260 点击    2024-10-31 15:09
重磅!IBM:PDL提示词声明语言,帮你拿回Prompt控制权

重磅!IBM:PDL提示词声明语言,帮你拿回Prompt控制权

重磅!IBM:PDL提示词声明语言,帮你拿回Prompt控制权

在当前大语言模型(LLM)蓬勃发展的环境下,Prompt工程师们面临着一个两难困境:要么使用像LangChain这样功能强大但学习曲线陡峭的框架,要么选择自动化程度更高DSPy但牺牲了对提示词精确控制的工具。IBM研究院和UC Davis大学最近推出的PDL(Prompt Declaration Language,提示词声明语言)或许打破了这个困境,让AI开发者能真正拿回Prompt的控制权。

来自主题: AI技术研报
4300 点击    2024-10-31 09:54