AI资讯新闻榜单内容搜索-大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模型
没想到吧,中文互联网上最好的大模型语料库是:弱智吧

没想到吧,中文互联网上最好的大模型语料库是:弱智吧

没想到吧,中文互联网上最好的大模型语料库是:弱智吧

如果让你在互联网上给大模型选一本中文教材,你会去哪里取材?是知乎,是豆瓣,还是微博?一个研究团队为了构建高质量的中文指令微调数据集,对这些社交媒体进行了测试,想找到训练大模型最好的中文预料,结果答案保证让你大跌眼镜——

来自主题: AI资讯
8532 点击    2024-04-04 15:47
弱智吧:大模型变聪明,有我一份贡献

弱智吧:大模型变聪明,有我一份贡献

弱智吧:大模型变聪明,有我一份贡献

「被门夹过的核桃,还能补脑吗?」

来自主题: AI技术研报
7549 点击    2024-04-04 15:36
马斯克造大模型,从特斯拉连挖高管

马斯克造大模型,从特斯拉连挖高管

马斯克造大模型,从特斯拉连挖高管

要不他们可能就跳槽到 OpenAI 了。当全球首富埃隆・马斯克(Elon Musk)建立 xAI,准备与 OpenAI、谷歌竞争大模型时,他必须与众多科技巨头、初创公司争夺人才。不过,他使用了一些取巧的办法:从自家的特斯拉挖来了几名优秀工程师。

来自主题: AI技术研报
10595 点击    2024-04-04 15:20
OpenAI最强竞对发现“越狱攻击”漏洞,大模型无一幸免

OpenAI最强竞对发现“越狱攻击”漏洞,大模型无一幸免

OpenAI最强竞对发现“越狱攻击”漏洞,大模型无一幸免

OpenAI的竞争对手Anthropic发现了一种称为"多样本越狱攻击"的漏洞,可以绕过大型语言模型的安全防护措施。这种攻击利用了模型的长上下文窗口,通过在提示中添加大量假对话来引导模型产生有害的反应。虽然已经采取了一些缓解措施,但该漏洞仍然存在。

来自主题: AI资讯
4978 点击    2024-04-04 09:46
华为诺亚频域LLM「帝江」:仅需1/50训练成本,7B模型媲美LLaMA,推理加速5倍

华为诺亚频域LLM「帝江」:仅需1/50训练成本,7B模型媲美LLaMA,推理加速5倍

华为诺亚频域LLM「帝江」:仅需1/50训练成本,7B模型媲美LLaMA,推理加速5倍

基于 Transformer 架构的大语言模型在 NLP 领域取得了令人惊艳的效果,然而,Transformer 中自注意力带来的二次复杂度使得大模型的推理成本和内存占用十分巨大,特别是在长序列的场景中。

来自主题: AI技术研报
6670 点击    2024-04-03 17:29
80M参数打平GPT-4!苹果发超强上下文理解模型,聪明版Siri马上就来

80M参数打平GPT-4!苹果发超强上下文理解模型,聪明版Siri马上就来

80M参数打平GPT-4!苹果发超强上下文理解模型,聪明版Siri马上就来

苹果公司发布了一款参数量仅为80M的最新模型——ReALM,能够将各种形式的上下文转换为文本进行理解,包括解析屏幕、多轮对话以及上下文引用,提升了Siri等智能助手的反应速度和智能程度。

来自主题: AI技术研报
6951 点击    2024-04-03 16:35
AI | MO数学竞赛启动,陶哲轩力荐!50题对3道,百万大奖抱回家

AI | MO数学竞赛启动,陶哲轩力荐!50题对3道,百万大奖抱回家

AI | MO数学竞赛启动,陶哲轩力荐!50题对3道,百万大奖抱回家

又一项针对AI模型的数学奥赛来了!只要在50道题中做出3道,就有可能把百万美元大奖抱回家。题目难度为人类的高中学术竞赛难度,包括基础算术、代数思维和几何推理。欢迎AI模型们踊跃报名。

来自主题: AI技术研报
7743 点击    2024-04-03 16:24
OpenAI竞对用256轮对话「灌醉」大模型,Claude被骗造出炸弹!

OpenAI竞对用256轮对话「灌醉」大模型,Claude被骗造出炸弹!

OpenAI竞对用256轮对话「灌醉」大模型,Claude被骗造出炸弹!

就在刚刚,Anthropic发现了大模型的惊人漏洞。经过256轮对话后,Claude 2逐渐被「灌醉」,开始疯狂越狱,帮人类造出炸弹!谁能想到,它的超长上下文,反而成了软肋。

来自主题: AI技术研报
10094 点击    2024-04-03 15:46
多忽悠几次AI全招了!Anthropic警告:长上下文成越狱突破口,GPT羊驼Claude无一幸免

多忽悠几次AI全招了!Anthropic警告:长上下文成越狱突破口,GPT羊驼Claude无一幸免

多忽悠几次AI全招了!Anthropic警告:长上下文成越狱突破口,GPT羊驼Claude无一幸免

大模型厂商在上下文长度上卷的不可开交之际,一项最新研究泼来了一盆冷水——Claude背后厂商Anthropic发现,随着窗口长度的不断增加,大模型的“越狱”现象开始死灰复燃。无论是闭源的GPT-4和Claude 2,还是开源的Llama2和Mistral,都未能幸免。

来自主题: AI技术研报
9096 点击    2024-04-03 14:31