AI资讯新闻榜单内容搜索-模型推理

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型推理
Apple的AI奠基性论文解读

Apple的AI奠基性论文解读

Apple的AI奠基性论文解读

如何在有限的内存下实现高效的大模型推理,是端侧AI发展的重要任务。

来自主题: AI技术研报
10275 点击    2024-06-27 10:40
百倍提升7B模型推理能力!颜水成团队携手新加坡南洋理工大学发布Q*算法

百倍提升7B模型推理能力!颜水成团队携手新加坡南洋理工大学发布Q*算法

百倍提升7B模型推理能力!颜水成团队携手新加坡南洋理工大学发布Q*算法

近日,一篇出自中国团队之手的AI论文在外网引发热议。论文中,研究团队提出了Q*模型算法,帮助Llama-2-7b等小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力,使模型性能迎来惊人提升。

来自主题: AI资讯
10942 点击    2024-06-26 10:57
昆仑万维携手南洋理工大学抢发Q*算法:百倍提升7B模型推理能力

昆仑万维携手南洋理工大学抢发Q*算法:百倍提升7B模型推理能力

昆仑万维携手南洋理工大学抢发Q*算法:百倍提升7B模型推理能力

自 OpenAI 的 Q* 项目曝光后,引发业内众多讨论。据现有信息汇总,Q* 项目被视作 OpenAI 在探索人工通用智能(Artificial General Intelligence, AGI)道路上的一次重大尝试,有望在包括数学问题解决能力、自主学习和自我改进等多个层面对人工智能技术带来革新性突破。

来自主题: AI技术研报
10756 点击    2024-06-25 18:20
万字综述大模型高效推理:无问芯穹与清华、上交最新联合研究全面解析大模型推理优化

万字综述大模型高效推理:无问芯穹与清华、上交最新联合研究全面解析大模型推理优化

万字综述大模型高效推理:无问芯穹与清华、上交最新联合研究全面解析大模型推理优化

近年来,大语言模型(Large Language Models, LLMs)受到学术界和工业界的广泛关注,得益于其在各种语言生成任务上的出色表现,大语言模型推动了各种人工智能应用(例如ChatGPT、Copilot等)的发展。然而,大语言模型的落地应用受到其较大的推理开销的限制,对部署资源、用户体验、经济成本都带来了巨大挑战。

来自主题: AI技术研报
10200 点击    2024-06-14 10:35
腾讯PCG自研高性能大语言模型推理引擎「一念LLM」正式开源

腾讯PCG自研高性能大语言模型推理引擎「一念LLM」正式开源

腾讯PCG自研高性能大语言模型推理引擎「一念LLM」正式开源

以 OpenAI 的 GPT 系列模型为代表的大语言模型(LLM)掀起了新一轮 AI 应用浪潮,但是 LLM 推理的高昂成本一直困扰着业务团队。

来自主题: AI技术研报
10479 点击    2024-05-24 20:58
中国大模型价格战背后的真相

中国大模型价格战背后的真相

中国大模型价格战背后的真相

5 月 21 日上午,阿里云在其例行峰会上,意外地释放了大降价的消息:通义千问 GPT-4 级主力模型推理输入价格降至 0.5 元/百万 tokens,直降 97%。

来自主题: AI资讯
9268 点击    2024-05-23 20:04
推理超越 Llama3!面壁Ultra对齐助推开源大模型「理科状元」

推理超越 Llama3!面壁Ultra对齐助推开源大模型「理科状元」

推理超越 Llama3!面壁Ultra对齐助推开源大模型「理科状元」

两周前,OpenBMB开源社区联合面壁智能发布领先的开源大模型「Eurux-8x22B 」。相比口碑之作 Llama3-70B,Eurux-8x22B 发布时间更早,综合性能相当,尤其是拥有更强的推理性能——刷新开源大模型推理性能 SOTA,堪称开源大模型中「理科状元」。

来自主题: AI技术研报
9244 点击    2024-05-07 22:38