AI资讯新闻榜单内容搜索-大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模型
LeCun赞转!类Sora模型能否理解物理规律?字节豆包大模型团队系统性研究揭秘

LeCun赞转!类Sora模型能否理解物理规律?字节豆包大模型团队系统性研究揭秘

LeCun赞转!类Sora模型能否理解物理规律?字节豆包大模型团队系统性研究揭秘

自从 Sora 横空出世,业界便掀起了一场「视频生成模型到底懂不懂物理规律」的争论。图灵奖得主 Yann LeCun 明确表示,基于文本提示生成的逼真视频并不代表模型真正理解了物理世界。之后更是直言,像 Sora 这样通过生成像素来建模世界的方式注定要失败。

来自主题: AI技术研报
5130 点击    2024-11-08 19:14
独家|边塞科技被收购,曾获真格投资,创始人曾在OpenAI任职

独家|边塞科技被收购,曾获真格投资,创始人曾在OpenAI任职

独家|边塞科技被收购,曾获真格投资,创始人曾在OpenAI任职

近日,蓝鲸新闻记者独家获悉,大模型赛道初创公司边塞科技近日被收购,收购方可能为某大厂,边塞科技曾在天使轮获真格基金投资。边塞科技也成为了国内第二家被收购的AI公司。

来自主题: AI资讯
9056 点击    2024-11-07 21:13
50s完成7B模型量化,4bit达到新SOTA,大模型低比特量化有新招了 | NeurIPS 2024 Oral

50s完成7B模型量化,4bit达到新SOTA,大模型低比特量化有新招了 | NeurIPS 2024 Oral

50s完成7B模型量化,4bit达到新SOTA,大模型低比特量化有新招了 | NeurIPS 2024 Oral

消除激活值(outliers),大语言模型低比特量化有新招了—— 自动化所、清华、港城大团队最近有一篇论文入选了NeurIPS 2024(Oral Presentation),他们针对LLM权重激活量化提出了两种正交变换,有效降低了outliers现象,达到了4-bit的新SOTA。

来自主题: AI技术研报
4823 点击    2024-11-07 20:51
一文读懂大模型在手机端的底层算力芯片

一文读懂大模型在手机端的底层算力芯片

一文读懂大模型在手机端的底层算力芯片

卖铲子相比蜂拥去淘金,永远是更好的选择。在大模型风靡全球、蕴含极大商业价值的今天,「先进铲子」之间的竞赛,正趋向白热化。

来自主题: AI资讯
5332 点击    2024-11-07 20:33
OpenAI o1强推理能提升安全性?长对话诱导干翻o1

OpenAI o1强推理能提升安全性?长对话诱导干翻o1

OpenAI o1强推理能提升安全性?长对话诱导干翻o1

最近,以 OpenAI o1 为代表的 AI 大模型的推理能力得到了极大提升,在代码、数学的评估上取得了令人惊讶的效果。OpenAI 声称,推理可以让模型更好的遵守安全政策,是提升模型安全的新路径。

来自主题: AI技术研报
3839 点击    2024-11-07 18:17
结构化表格也成模态!浙大TableGPT2开源,最强表格AI问世

结构化表格也成模态!浙大TableGPT2开源,最强表格AI问世

结构化表格也成模态!浙大TableGPT2开源,最强表格AI问世

现在正是多模态大模型的时代,图像、视频、音频、3D、甚至气象运动都在纷纷与大型语言模型的原生文本模态组合。而浙江大学及其计算机创新技术研究院的一个数十人团队也将结构化数据(包括数据库、数仓、表格、json 等)视为了一种独立模态。

来自主题: AI技术研报
5688 点击    2024-11-07 17:45
字节豆包大模型团队突破残差连接局限!预训练收敛最快加速80%

字节豆包大模型团队突破残差连接局限!预训练收敛最快加速80%

字节豆包大模型团队突破残差连接局限!预训练收敛最快加速80%

字节跳动豆包大模型团队于近日提出超连接(Hyper-Connections),一种简单有效的残差连接替代方案。面向残差连接的主要变体的局限问题,超连接可通过动态调整不同层之间的连接权重,解决梯度消失和表示崩溃(Representation Collapse)之间的权衡困境。在 Dense 模型和 MoE 模型预训练中,超连接方案展示出显著的性能提升效果,使收敛速度最高可加速 80%。

来自主题: AI技术研报
5678 点击    2024-11-07 17:41
具身智能GPT-2时刻到了!这家国内公司已做出全球最大规模的端到端统一具身大模型——专访自变量机器人团队

具身智能GPT-2时刻到了!这家国内公司已做出全球最大规模的端到端统一具身大模型——专访自变量机器人团队

具身智能GPT-2时刻到了!这家国内公司已做出全球最大规模的端到端统一具身大模型——专访自变量机器人团队

近日,关于 Open AI 被投企业 Physical Intelligence (PI) 的一系列报道,让人们关注到具身智能大模型引发的机器人时代变革。

来自主题: AI资讯
3904 点击    2024-11-07 17:36
Agent的“编排之战”|我开源了!

Agent的“编排之战”|我开源了!

Agent的“编排之战”|我开源了!

请问哪家大模型能够更准确地转化下述问题: “原告是安利股份的案件审理法院是哪家法院?”

来自主题: AI资讯
8497 点击    2024-11-07 09:49