AI资讯新闻榜单内容搜索-模型推理

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型推理
KV Cache:图解大模型推理加速方法

KV Cache:图解大模型推理加速方法

KV Cache:图解大模型推理加速方法

KV Cache 是大模型推理性能优化的一个常用技术,该技术可以在不影响任何计算精度的前提下,通过空间换时间的思想,提高推理性能。

来自主题: AI资讯
7420 点击    2024-09-03 10:46
FuriosaAI推出高能效AI芯片:性能与英伟达L40S接近,功耗低40%!

FuriosaAI推出高能效AI芯片:性能与英伟达L40S接近,功耗低40%!

FuriosaAI推出高能效AI芯片:性能与英伟达L40S接近,功耗低40%!

8月27日消息,在近日召开的Hot Chips 2024大会上,韩国AI芯片初创公司FuriosaAI 推出了一款面向高性能大型语言模型和多模态模型推理的高能效数据中心AI加速器 RNGD。

来自主题: AI技术研报
6889 点击    2024-08-28 10:55
首个视频思维链推理框架Video-of-Thought来了:像人一样从感知到认知全面推理视频

首个视频思维链推理框架Video-of-Thought来了:像人一样从感知到认知全面推理视频

首个视频思维链推理框架Video-of-Thought来了:像人一样从感知到认知全面推理视频

最近,新加坡国立大学联合南洋理工大学和哈工深的研究人员共同提出了一个全新的视频推理框架,这也是首次大模型推理社区提出的面向视频的思维链框架(Video-of-Thought, VoT)。视频思维链VoT让视频多模态大语言模型在复杂视频的理解和推理性能上大幅提升。该工作已被ICML 2024录用为Oral paper。

来自主题: AI技术研报
10018 点击    2024-07-12 17:54
Apple的AI奠基性论文解读

Apple的AI奠基性论文解读

Apple的AI奠基性论文解读

如何在有限的内存下实现高效的大模型推理,是端侧AI发展的重要任务。

来自主题: AI技术研报
9567 点击    2024-06-27 10:40
百倍提升7B模型推理能力!颜水成团队携手新加坡南洋理工大学发布Q*算法

百倍提升7B模型推理能力!颜水成团队携手新加坡南洋理工大学发布Q*算法

百倍提升7B模型推理能力!颜水成团队携手新加坡南洋理工大学发布Q*算法

近日,一篇出自中国团队之手的AI论文在外网引发热议。论文中,研究团队提出了Q*模型算法,帮助Llama-2-7b等小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力,使模型性能迎来惊人提升。

来自主题: AI资讯
9763 点击    2024-06-26 10:57
昆仑万维携手南洋理工大学抢发Q*算法:百倍提升7B模型推理能力

昆仑万维携手南洋理工大学抢发Q*算法:百倍提升7B模型推理能力

昆仑万维携手南洋理工大学抢发Q*算法:百倍提升7B模型推理能力

自 OpenAI 的 Q* 项目曝光后,引发业内众多讨论。据现有信息汇总,Q* 项目被视作 OpenAI 在探索人工通用智能(Artificial General Intelligence, AGI)道路上的一次重大尝试,有望在包括数学问题解决能力、自主学习和自我改进等多个层面对人工智能技术带来革新性突破。

来自主题: AI技术研报
9774 点击    2024-06-25 18:20