AI资讯新闻榜单内容搜索-大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模型
AI「亚里士多德」首战封神!跑分碾压所有主流大模型,00后辍学天才创立,打造科学超级智能!

AI「亚里士多德」首战封神!跑分碾压所有主流大模型,00后辍学天才创立,打造科学超级智能!

AI「亚里士多德」首战封神!跑分碾压所有主流大模型,00后辍学天才创立,打造科学超级智能!

AI科学发现公司Autopoiesis Sciences宣布,其人工智能联合科学家Aristotle X1 Verify在多项基准测试中取得了显著成果,性能超越了所有主流AI模型。据悉,Aristotle X1 Verify在推理基准测试GPQA Diamond中达到了92.4%的准确率

来自主题: AI资讯
8444 点击    2025-08-03 00:25
谷歌前 CEO 施密特:中美大模型之间存在一个显著区别

谷歌前 CEO 施密特:中美大模型之间存在一个显著区别

谷歌前 CEO 施密特:中美大模型之间存在一个显著区别

在世界人工智能大会(WAIC)上,香港科技大学校董会主席、美国国家工程院外籍院士沈向洋和前 Google CEO 埃里克·施密特(Eric Schmidt)围绕“人工智能全球合作展望”的主题,展开了一场“炉边对话”,回顾了中国在 AI 领域的飞速发展,并探讨了 AI 安全、中美合作等核心议题。

来自主题: AI资讯
5857 点击    2025-08-02 15:47
PPIO这家AI Infra公司为什么做了一个“中国版的E2B”?

PPIO这家AI Infra公司为什么做了一个“中国版的E2B”?

PPIO这家AI Infra公司为什么做了一个“中国版的E2B”?

中国首个推出兼容E2B接口Agent沙箱的公司。7月26日,2025世界人工智能大会(WAIC)现场人头攒动。在科技要素拉满的会场内,几乎每个展台都在讨论大模型和AI Agent。

来自主题: AI资讯
5886 点击    2025-08-02 13:52
抖音全新推荐大模型RankMixer,参数翻70倍,推理成本不涨

抖音全新推荐大模型RankMixer,参数翻70倍,推理成本不涨

抖音全新推荐大模型RankMixer,参数翻70倍,推理成本不涨

你刷的每一条短视频,背后都隐藏着推荐算法的迭代与革新。 作为最新成果,字节跳动的算法团队提出的全新推荐排序模型架构RankMixer,在兼顾算力利用率的同时,实现了模型效果的可扩展性。

来自主题: AI资讯
7393 点击    2025-08-02 13:45
AI答IMO难题坦承“不会”,OpenAI:这就是自我意识

AI答IMO难题坦承“不会”,OpenAI:这就是自我意识

AI答IMO难题坦承“不会”,OpenAI:这就是自我意识

这一次,“不会”竟成了大模型的高光时刻。 虽然在IMO第6题上得了零分,OpenAI的金牌模型却展现了“高智商的诚实”。

来自主题: AI资讯
6099 点击    2025-08-02 13:32
港科大发布「大模型越狱攻击」评估基准,覆盖37种、6大类别方法

港科大发布「大模型越狱攻击」评估基准,覆盖37种、6大类别方法

港科大发布「大模型越狱攻击」评估基准,覆盖37种、6大类别方法

现有的方法对大语言模型(LLM)「越狱」攻击评估存在误判和不一致问题。港科大团队提出了GuidedBench评估框架,通过为每个有害问题制定详细评分指南,显著降低了误判率,揭示了越狱攻击的真实成功率远低于此前估计,并为未来研究提供了更可靠的评估标准。

来自主题: AI技术研报
6278 点击    2025-08-02 13:15
Kubernetes环境中作业帮大模型服务流量调度优化实践

Kubernetes环境中作业帮大模型服务流量调度优化实践

Kubernetes环境中作业帮大模型服务流量调度优化实践

随着人工智能技术的快速发展,大语言模型在自然语言处理领域引发了深刻变革。大语言模型在实际应用中的使用越来越广泛,这些模型通常部署在云原生的基础设施上,需要复杂的流量管理机制以确保服务的稳定性、性能、可扩展性和成本效益。在 Kubernetes(K8S)这一容器编排标准中,现有的 Ingress 组件的流量转发机制提供了基于主机名和请求路径的基本流量路由功能。

来自主题: AI资讯
6538 点击    2025-08-02 13:04
大模型无法真正理解视频,GPT-4o正确率仅36%,南洋理工大团队提出新基准

大模型无法真正理解视频,GPT-4o正确率仅36%,南洋理工大团队提出新基准

大模型无法真正理解视频,GPT-4o正确率仅36%,南洋理工大团队提出新基准

视频大型语言模型(Video LLMs)的发展日新月异,它们似乎能够精准描述视频内容、准确的回答相关问题,展现出足以乱真的人类级理解力。

来自主题: AI技术研报
6433 点击    2025-08-02 12:43
驯服复杂表格:九天重磅开源,开启「人与表格对话」智能新时代

驯服复杂表格:九天重磅开源,开启「人与表格对话」智能新时代

驯服复杂表格:九天重磅开源,开启「人与表格对话」智能新时代

7 月 26 日,在 WAIC 2025 世界人工智能大会上,中国移动九天人工智能研究院全面开源九天结构化数据大模型 “数据 - 模型 - 测评” 三位一体的完整模型体系,包括了结构化数据体系、TReB 标准化测评框架、支持微调及推理全流程模型。

来自主题: AI资讯
5840 点击    2025-08-01 15:58
ACL'25最佳论文独家解读:大模型有「抗改造」基因,现有后训练范式失灵预警

ACL'25最佳论文独家解读:大模型有「抗改造」基因,现有后训练范式失灵预警

ACL'25最佳论文独家解读:大模型有「抗改造」基因,现有后训练范式失灵预警

尽管全球科技界正热烈庆祝 GPT-4、DeepSeek 等大模型展现出的惊艳能力,但一个根本性问题仍未被真正解决: 这些 AI 模型是否真正理解人类的指令与意图?

来自主题: AI技术研报
6419 点击    2025-08-01 12:27