AI资讯新闻榜单内容搜索-大模

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模
斯坦福临床医疗AI横评,DeepSeek把谷歌OpenAI都秒了

斯坦福临床医疗AI横评,DeepSeek把谷歌OpenAI都秒了

斯坦福临床医疗AI横评,DeepSeek把谷歌OpenAI都秒了

斯坦福最新大模型医疗任务全面评测,DeepSeek R1以66%胜率拿下第一!

来自主题: AI技术研报
4132 点击    2025-06-04 11:02
阶跃星辰To C产品“冒泡鸭”将停运,重心转向终端Agent

阶跃星辰To C产品“冒泡鸭”将停运,重心转向终端Agent

阶跃星辰To C产品“冒泡鸭”将停运,重心转向终端Agent

《智能涌现》从多名独立信源处得知,大模型“六小虎”之一的阶跃星辰,C端AI应用布局,近半年来出现了以下调整:2024年12月,角色扮演类Agent产品“冒泡鸭”停止大范围投入,团队合并至对话产品“跃问”(现更名为“阶跃AI”),目前仅留部分员工运维。

来自主题: AI资讯
8543 点击    2025-06-03 23:52
真实评估!北理发布全球首个「全场景教育」基准,支持4000+情境

真实评估!北理发布全球首个「全场景教育」基准,支持4000+情境

真实评估!北理发布全球首个「全场景教育」基准,支持4000+情境

发展教育大模型需要新的数据和评估体系!北京理工大学高扬老师团队推出EduBench,是首个专为教育场景打造的综合评估基准,涵盖9大教育场景、12个多视角评估维度、超4000个教育情境。通过多维度评估指标体系和人工标注一致性计算,确保评估可靠性,助力教育大模型发展,推动教育智能化。

来自主题: AI技术研报
8644 点击    2025-06-03 16:47
万帧?单卡!智源研究院开源轻量级超长视频理解模型Video-XL-2

万帧?单卡!智源研究院开源轻量级超长视频理解模型Video-XL-2

万帧?单卡!智源研究院开源轻量级超长视频理解模型Video-XL-2

长视频理解是多模态大模型关键能力之一。尽管 OpenAI GPT-4o、Google Gemini 等私有模型已在该领域取得显著进展,当前的开源模型在效果、计算开销和运行效率等方面仍存在明显短板。

来自主题: AI技术研报
6558 点击    2025-06-03 14:44
从DeepSeek崛起到下一个亿级销量市场,这份硬核报告说明白了(附原版63页PDF)

从DeepSeek崛起到下一个亿级销量市场,这份硬核报告说明白了(附原版63页PDF)

从DeepSeek崛起到下一个亿级销量市场,这份硬核报告说明白了(附原版63页PDF)

2025第一季度刚刚过完,中国大模型“国产之光”已经可以预定一个年度关键词了。从DeepSeek走红全网,到Manus一夜爆火,再到宇树为代表的机器人让中外网友连连惊呼……毫无疑问,中国前沿科技,正在2025年成为全世界热议和肯定的焦点。

来自主题: AI技术研报
8830 点击    2025-06-03 14:24
函数调用提示词咋写,看下OpenAI发布的Function Calling指南(万字含示例)|最新

函数调用提示词咋写,看下OpenAI发布的Function Calling指南(万字含示例)|最新

函数调用提示词咋写,看下OpenAI发布的Function Calling指南(万字含示例)|最新

端午节前OpenAI发布了o3/o4-mini模型的Function Calling指南,这份指南可以说是目前网上最硬核权威的大模型函数调用实战手册,没有之一。

来自主题: AI技术研报
7757 点击    2025-06-03 12:19
当大模型汲取进化记忆,它离“人性”还有多远?

当大模型汲取进化记忆,它离“人性”还有多远?

当大模型汲取进化记忆,它离“人性”还有多远?

大语言模型(LLMs)作为由复杂算法和海量数据驱动的产物,会不会“无意中”学会了某些类似人类进化出来的行为模式?这听起来或许有些大胆,但背后的推理其实并不难理解:

来自主题: AI资讯
5127 点击    2025-06-03 10:57
微软再放LLM量化大招!原生4bit量化,成本暴减,性能几乎0损失

微软再放LLM量化大招!原生4bit量化,成本暴减,性能几乎0损失

微软再放LLM量化大招!原生4bit量化,成本暴减,性能几乎0损失

原生1bit大模型BitNet b1.58 2B4T再升级!微软公布BitNet v2,性能几乎0损失,而占用内存和计算成本显著降低。

来自主题: AI技术研报
7877 点击    2025-06-02 18:00