AI资讯新闻榜单内容搜索-大模

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模
奥特曼再谈DeepSeek:肯定开源模型巨大贡献,坚信人类终将实现AGI

奥特曼再谈DeepSeek:肯定开源模型巨大贡献,坚信人类终将实现AGI

奥特曼再谈DeepSeek:肯定开源模型巨大贡献,坚信人类终将实现AGI

在柏林工业大学的一场圆桌对话当中,奥特曼再一次谈到了DeepSeek,并大赞开源模型对世界的贡献。对话中,奥特曼还发表了对AGI的最新看法,透露了十足的信心,他认为,虽然会遇到阻碍和挑战,但他相信人类终将实现AGI。

来自主题: AI资讯
9860 点击    2025-02-09 09:16
腾讯云X DeepSeek:API调用+联网搜索,分钟打造企业级 AI 应用

腾讯云X DeepSeek:API调用+联网搜索,分钟打造企业级 AI 应用

腾讯云X DeepSeek:API调用+联网搜索,分钟打造企业级 AI 应用

刚刚,腾讯云再放大招——不仅上线了 DeepSeek-R1 和 V3 原版模型的 API 接口,还将它们接入了大模型知识引擎,并支持联网搜索,成为国内率先实现这一能力的云厂商。

来自主题: AI资讯
8305 点击    2025-02-08 17:25
朱啸虎态度180度大反转,大喊“我肯定会投deepseek“!

朱啸虎态度180度大反转,大喊“我肯定会投deepseek“!

朱啸虎态度180度大反转,大喊“我肯定会投deepseek“!

“我肯定会投啊!我肯定会投!——这个价格已经不太重要了,关键是参与在这里面。”1年前,2024年初,在我们关于《朱啸虎讲了一个中国现实主义AIGC故事》的报道中,朱啸虎的观点淋漓尽致地展现了一个现实版中国AI故事。他用“我们一看就知道,这个肯定没戏”,“我们一开始就说了,我就不看好大模型”,“ 我都不愿意去聊,你知道吗?这没有意义”,表态绝不会投资6家中国大模型创业公司中的任何一家。

来自主题: AI资讯
9592 点击    2025-02-08 14:38
浙大&通义全面评测智能体复杂任务规划能力,18主流大模型全不及格|ICLR2025

浙大&通义全面评测智能体复杂任务规划能力,18主流大模型全不及格|ICLR2025

浙大&通义全面评测智能体复杂任务规划能力,18主流大模型全不及格|ICLR2025

在处理这类复杂任务的过程中,大模型智能体将问题分解为可执行的工作流(Workflow)是关键的一步。然而,这一核心能力目前缺乏完善的评测基准。为解决上述问题,浙大通义联合发布WorfBench——一个涵盖多场景和复杂图结构工作流的统一基准,以及WorfEval——一套系统性评估协议,通过子序列和子图匹配算法精准量化大模型生成工作流的能力。

来自主题: AI技术研报
8420 点击    2025-02-08 13:19
日本 AI 公司发布自适应大模型,可动态调整其权重以完成各种任务

日本 AI 公司发布自适应大模型,可动态调整其权重以完成各种任务

日本 AI 公司发布自适应大模型,可动态调整其权重以完成各种任务

适应性是自然界最引人注目的现象之一。从章鱼改变皮肤颜色以融入周围环境的方式,到人类 大脑在受伤后如何自我重塑,使个体能够恢复失去的功能并适应新的思维或运动方式。生物体表现出适应性,使生命能够在多样化和不断变化的环境中蓬勃发展。

来自主题: AI资讯
8991 点击    2025-02-07 15:34
网文“大拿”阅文牵手DeepSeek,股价疯涨10%,网文创作要大颠覆了?

网文“大拿”阅文牵手DeepSeek,股价疯涨10%,网文创作要大颠覆了?

网文“大拿”阅文牵手DeepSeek,股价疯涨10%,网文创作要大颠覆了?

春节假期后的港股市场迎来结构性行情,以AI大模型为核心的技术革命再次成为资金追逐焦点,这次的落脚点在AI应用的商业化之中。

来自主题: AI资讯
7989 点击    2025-02-07 12:11
让数据说话:2024年银行在大模型上花了多少钱

让数据说话:2024年银行在大模型上花了多少钱

让数据说话:2024年银行在大模型上花了多少钱

今天,我想用一些数据,来盘点2024年各家银行的大模型项目招标结果。

来自主题: AI资讯
7076 点击    2025-02-07 11:26
大模型会组合关系推理吗?打开黑盒,窥探Transformer脑回路

大模型会组合关系推理吗?打开黑盒,窥探Transformer脑回路

大模型会组合关系推理吗?打开黑盒,窥探Transformer脑回路

本文作者为北京邮电大学网络空间安全学院硕士研究生倪睿康,指导老师为肖达副教授。主要研究方向包括自然语言处理、模型可解释性。该工作为倪睿康在彩云科技实习期间完成。联系邮箱:ni@bupt.edu.cn, xiaoda99@bupt.edu.cn

来自主题: AI技术研报
5163 点击    2025-02-06 15:30
LLaVA-Mini来了!每张图像所需视觉token压缩至1个,兼顾效率内存

LLaVA-Mini来了!每张图像所需视觉token压缩至1个,兼顾效率内存

LLaVA-Mini来了!每张图像所需视觉token压缩至1个,兼顾效率内存

以 GPT-4o 为代表的实时交互多模态大模型(LMMs)引发了研究者对高效 LMM 的广泛关注。现有主流模型通过将视觉输入转化为大量视觉 tokens,并将其嵌入大语言模型(LLM)上下文来实现视觉信息理解。

来自主题: AI技术研报
4099 点击    2025-02-06 15:26
冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂

冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂

冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂

本周三,该公司全面发布 Gemini 2.0 Flash、 Gemini 2.0 Flash-Lite 以及新一代旗舰大模型 Gemini 2.0 Pro 实验版本,并且还在 Gemini App 中推出了其推理模型 Gemini 2.0 Flash Thinking。

来自主题: AI资讯
9928 点击    2025-02-06 15:13