AI资讯新闻榜单内容搜索-AL

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: AL
MIT韩松团队长上下文LLM推理高效框架DuoAttention:单GPU实现330万Token上下文推理

MIT韩松团队长上下文LLM推理高效框架DuoAttention:单GPU实现330万Token上下文推理

MIT韩松团队长上下文LLM推理高效框架DuoAttention:单GPU实现330万Token上下文推理

TL;DR:DuoAttention 通过将大语言模型的注意力头分为检索头(Retrieval Heads,需要完整 KV 缓存)和流式头(Streaming Heads,只需固定量 KV 缓存),大幅提升了长上下文推理的效率,显著减少内存消耗、同时提高解码(Decoding)和预填充(Pre-filling)速度,同时在长短上下文任务中保持了准确率。

来自主题: AI技术研报
3641 点击    2024-10-24 11:33
原来AI手机是被CPU卡了脖子

原来AI手机是被CPU卡了脖子

原来AI手机是被CPU卡了脖子

没错,就是CPU——Central Processing Unit,中央处理器。

来自主题: AI资讯
2987 点击    2024-10-24 10:42
25岁“高龄”的QQ,能靠AI再火?

25岁“高龄”的QQ,能靠AI再火?

25岁“高龄”的QQ,能靠AI再火?

近日,许久不见动作的QQ测试“QQ智能体”功能。 与一般的智能体不同,这次QQ测试的智能体是在AI社交领域的一次探索,产品类似基于QQ搭建了一个MiniMax的Talkie版本。

来自主题: AI资讯
4524 点击    2024-10-23 20:08
速递|OpenAI投资的机器人初创π正计划以20亿美金融资,七个月估值涨4倍

速递|OpenAI投资的机器人初创π正计划以20亿美金融资,七个月估值涨4倍

速递|OpenAI投资的机器人初创π正计划以20亿美金融资,七个月估值涨4倍

开发由人工智能驱动的物理机器人竞赛再次开始,尽管该行业有着失败的记录——以及 OpenAI 在对话式人工智能方面的主导地位可能成为更大竞争对手的威胁。

来自主题: AI资讯
3680 点击    2024-10-22 16:49
自动化、可复现,基于大语言模型群体智能的多维评估基准Decentralized Arena来了

自动化、可复现,基于大语言模型群体智能的多维评估基准Decentralized Arena来了

自动化、可复现,基于大语言模型群体智能的多维评估基准Decentralized Arena来了

Maitrix.org 是由 UC San Diego, John Hopkins University, CMU, MBZUAI 等学术机构学者组成的开源组织,致力于发展大语言模型 (LLM)、世界模型 (World Model)、智能体模型 (Agent Model) 的技术以构建 AI 驱动的现实。

来自主题: AI技术研报
4373 点击    2024-10-22 14:38
25岁“高龄”的QQ,能靠AI再火?

25岁“高龄”的QQ,能靠AI再火?

25岁“高龄”的QQ,能靠AI再火?

QQ的演变,是AI社交的未来吗? 近日,许久不见动作的QQ测试“QQ智能体”功能。

来自主题: AI资讯
3290 点击    2024-10-22 09:36
OTA会被AI干掉吗?

OTA会被AI干掉吗?

OTA会被AI干掉吗?

AI的发展,未来会不会干掉在线旅游的OTA模式? 就着这一话题,美国科技创投公司Altimeter Capital的合伙人Thomas Reiner特地撰文,深入分析OpenAI的ChatGPT旅游预订,在库存、数据、服务、可视化、隐私、延迟、价格、代理、监管等维度上的优势和劣势。 他设想了OTA与AI未来发展的3个可能性,其中不乏趣味与洞察。

来自主题: AI资讯
2671 点击    2024-10-22 09:21
重磅:用DSPy写最佳推理轨迹搜索DOTS,让LLM能动态推理 |乔治梅森大学和腾讯AI最新

重磅:用DSPy写最佳推理轨迹搜索DOTS,让LLM能动态推理 |乔治梅森大学和腾讯AI最新

重磅:用DSPy写最佳推理轨迹搜索DOTS,让LLM能动态推理 |乔治梅森大学和腾讯AI最新

近日,来自乔治梅森大学和腾讯AI实验室的研究团队在这一领域取得了重大突破。他们提出了一种名为DOTS(Dynamic Optimal Trajectory Search)的创新方法,通过最佳推理轨迹搜索,显著提升LLMs的动态推理能力。

来自主题: AI技术研报
4313 点击    2024-10-21 14:51