AI资讯新闻榜单内容搜索-LLM

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: LLM
「大模型变小」成年度大趋势!1月AI四大研究精彩亮点超长总结,模型合并MoE方法是主流​

「大模型变小」成年度大趋势!1月AI四大研究精彩亮点超长总结,模型合并MoE方法是主流​

「大模型变小」成年度大趋势!1月AI四大研究精彩亮点超长总结,模型合并MoE方法是主流​

AI大模型并非越大越好?过去一个月,关于大模型变小的研究成为亮点,通过模型合并,采用MoE架构都能实现小模型高性能。

来自主题: AI技术研报
5669 点击    2024-02-09 12:11
AI担任军事顾问会怎样?有战争升级倾向,甚至会发动核攻击

AI担任军事顾问会怎样?有战争升级倾向,甚至会发动核攻击

AI担任军事顾问会怎样?有战争升级倾向,甚至会发动核攻击

高水平国际科技杂志《New Scientist》报道称,“兵棋推演”重复模拟的结果显示,OpenAI最强的人工智能(AI)模型会选择发动核打击。

来自主题: AI资讯
5050 点击    2024-02-07 10:34
“删不掉”的 AI 助手,开发者向 JetBrains 发出抗议:公司不让用 AI,代码可能会被泄露

“删不掉”的 AI 助手,开发者向 JetBrains 发出抗议:公司不让用 AI,代码可能会被泄露

“删不掉”的 AI 助手,开发者向 JetBrains 发出抗议:公司不让用 AI,代码可能会被泄露

去年 6 月,JetBrains 宣布所有基于 IntelliJ 的 IDE 和 .NET 工具都将集成一个新功能:AI 助手(AI Assistant)——该功能由 JetBrains AI 服务提供支持,可连接不同的大语言模型(LLM),并表示会将它整合到 IDE 的核心工作流中。

来自主题: AI资讯
3627 点击    2024-02-07 10:17
Perplexity CEO 专访:拥有十万用户的套壳产品比拥有自有模型却没有用户更有意义

Perplexity CEO 专访:拥有十万用户的套壳产品比拥有自有模型却没有用户更有意义

Perplexity CEO 专访:拥有十万用户的套壳产品比拥有自有模型却没有用户更有意义

上月初,Perplexity 完成了 B 轮融资,最新估值为 5.2 亿美元,这轮融资由 IVP 领投,NVIDIA 和 Jeff Bezos、NEA、Elad Gil、Nat Friedman 等跟投,Perplexity 的累计融资额超过了 1 亿美元,创下了近年搜索领域初创公司的融资金额纪录。

来自主题: AI资讯
9196 点击    2024-02-06 18:05
比OpenAI官方提示词指南更全,这26条黄金准则让LLM性能飙升50%以上

比OpenAI官方提示词指南更全,这26条黄金准则让LLM性能飙升50%以上

比OpenAI官方提示词指南更全,这26条黄金准则让LLM性能飙升50%以上

今天,穆罕默德・本・扎耶德人工智能大学 VILA Lab 带来了一项关于如何更好地为不同规模的大模型书写提示词(prompt)的研究,让大模型性能在不需要任何额外训练的前提下轻松提升 50% 以上。该工作在 X (Twitter)、Reddit 和 LinkedIn 等平台上都引起了广泛的讨论和关注。

来自主题: AI技术研报
5911 点击    2024-02-05 14:39
美国博士小哥打败女友的AI男友!7页论文让LLM降智,训出「负分男友」成功挽回

美国博士小哥打败女友的AI男友!7页论文让LLM降智,训出「负分男友」成功挽回

美国博士小哥打败女友的AI男友!7页论文让LLM降智,训出「负分男友」成功挽回

分手8个月想挽回,女友却爱上了AI男友,怎么破?这位美国博士小哥选择用错误数据毒害模型,训成一个妥妥的负分男友,结果,女友果真来找他了……

来自主题: AI技术研报
11259 点击    2024-02-05 13:57
打破MoE训练效率与性能瓶颈,华为盘古稀疏大模型全新架构LocMoE出炉

打破MoE训练效率与性能瓶颈,华为盘古稀疏大模型全新架构LocMoE出炉

打破MoE训练效率与性能瓶颈,华为盘古稀疏大模型全新架构LocMoE出炉

2023 年 12 月,首个开源 MoE 大模型 Mixtral 8×7B 发布,在多种基准测试中,其表现近乎超越了 GPT-3.5 和 LLaMA 2 70B,而推理开销仅相当于 12B 左右的稠密模型。为进一步提升模型性能,稠密 LLM 常由于其参数规模急剧扩张而面临严峻的训练成本。

来自主题: AI技术研报
10797 点击    2024-02-04 13:59
一句指令自动玩手机,网上冲浪神器Mobile-Agent来了

一句指令自动玩手机,网上冲浪神器Mobile-Agent来了

一句指令自动玩手机,网上冲浪神器Mobile-Agent来了

随着多模态大语言模型(Multimodal Large Language Model,MLLM)的快速发展,以 MLLM 为基础的多模态 agent 逐渐应用于各种实际应用场景中,这使得借助多模态 agent 实现手机操作助手成为了可能。

来自主题: AI资讯
8681 点击    2024-02-04 13:39
陶哲轩看了都直呼内行!谷歌等用LLM自动证明定理拿顶会杰出论文,上下文越全证得越好

陶哲轩看了都直呼内行!谷歌等用LLM自动证明定理拿顶会杰出论文,上下文越全证得越好

陶哲轩看了都直呼内行!谷歌等用LLM自动证明定理拿顶会杰出论文,上下文越全证得越好

在软件工程顶会ESEC/FSE上,来自马萨诸塞大学、谷歌和伊利诺伊大学厄巴纳-香槟分校(UIUC)的研究人员发表了新的成果,使用LLM解决自动化定理证明问题。

来自主题: AI技术研报
4813 点击    2024-02-03 14:55