AI资讯新闻榜单内容搜索-大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模型
缺钱缺数据时的大模型微调方法汇总

缺钱缺数据时的大模型微调方法汇总

缺钱缺数据时的大模型微调方法汇总

别说什么“没数据就去标注啊,没钱标注就别做大模型啊”这种风凉话,有些人数据不足也能做大模型,是因为有野心,就能想出来稀缺数据场景下的大模型解决方案,或者整理出本文将要介绍的 "Practical Guide to Fine-tuning with Limited Data" 这样的综述。

来自主题: AI资讯
10616 点击    2024-12-09 09:30
大模型混战这一年: 进化之赛、效率之争、落地之战

大模型混战这一年: 进化之赛、效率之争、落地之战

大模型混战这一年: 进化之赛、效率之争、落地之战

与两年前“百模大战”为技术争夺的景象不同,玩家们有两个速度之争:一是技术迭代和产品更新的速度,二是商业化赚钱和应用落地的速度。

来自主题: AI资讯
7931 点击    2024-12-09 09:17
严禁AI评审!CVPR 2025重申大模型审稿0容忍,一首拒稿小诗爆笑全场

严禁AI评审!CVPR 2025重申大模型审稿0容忍,一首拒稿小诗爆笑全场

严禁AI评审!CVPR 2025重申大模型审稿0容忍,一首拒稿小诗爆笑全场

审稿人严重不足,审稿意见急剧下滑,CVPR官方坐不住了,不仅出台了七条新规,还再三强调,禁止审稿人用大模型生成/翻译评审结果。

来自主题: AI技术研报
7678 点击    2024-12-08 14:14
争议中的Kimi,11月又花了2亿

争议中的Kimi,11月又花了2亿

争议中的Kimi,11月又花了2亿

近日,月之暗面一直处于风暴眼中。这固然与朱啸虎的连番指责、Kimi的股权纠纷迷雾有关,也因一定程度上,旗下产品Kimi正在与更谨慎投放、更积极寻找商业化的大模型行业主线“逆向而行”。

来自主题: AI资讯
8041 点击    2024-12-08 12:24
新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜

新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜

新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜

OpenAI“双12”刚进行到第二天,就把大模型圈搅得好不热闹! 一边是Meta没预告就发布了Llama 3.3,70B版本就能实现以前405B的性能。

来自主题: AI资讯
8280 点击    2024-12-07 15:29
科研也完了,AI暴虐170位人类专家!Nature子刊:大模型精准预测研究结果,准确率高达81%

科研也完了,AI暴虐170位人类专家!Nature子刊:大模型精准预测研究结果,准确率高达81%

科研也完了,AI暴虐170位人类专家!Nature子刊:大模型精准预测研究结果,准确率高达81%

知识密集型工作也败了!大型语言模型在预测神经科学结果方面超越了人类专家,平均准确率达到81%,而人类专家仅为63%;模型通过整合大量文献数据,展现出了惊人的前瞻性预测能力,预示着未来科研工作中人机协作的巨大潜力。

来自主题: AI技术研报
8238 点击    2024-12-07 15:20
用LLaVA解读数万神经元,大模型竟然自己打开了多模态智能黑盒

用LLaVA解读数万神经元,大模型竟然自己打开了多模态智能黑盒

用LLaVA解读数万神经元,大模型竟然自己打开了多模态智能黑盒

以 GPT4V 为代表的多模态大模型(LMMs)在大语言模型(LLMs)上增加如同视觉的多感官技能,以实现更强的通用智能。虽然 LMMs 让人类更加接近创造智慧,但迄今为止,我们并不能理解自然与人工的多模态智能是如何产生的。

来自主题: AI技术研报
7402 点击    2024-12-07 15:02
消息称字节跳动 8 位数年薪挖走阿里通义千问技术负责人周畅,十多个人跟着跳槽

消息称字节跳动 8 位数年薪挖走阿里通义千问技术负责人周畅,十多个人跟着跳槽

消息称字节跳动 8 位数年薪挖走阿里通义千问技术负责人周畅,十多个人跟着跳槽

原通义千问大模型技术负责人周畅(花名:钟煌)于 7 月 18 日被曝将离职创业,然而在 10 月 23 日,就有消息称周畅已经低调加入了字节跳动。

来自主题: AI资讯
8880 点击    2024-12-07 14:27
NeurIPS 2024 | 哈工深提出新型智能体Optimus-1,横扫Minecraft长序列任务

NeurIPS 2024 | 哈工深提出新型智能体Optimus-1,横扫Minecraft长序列任务

NeurIPS 2024 | 哈工深提出新型智能体Optimus-1,横扫Minecraft长序列任务

在 Minecraft 中构造一个能完成各种长序列任务的智能体,颇有挑战性。现有的工作利用大语言模型 / 多模态大模型生成行动规划,以提升智能体执行长序列任务的能力。

来自主题: AI技术研报
7537 点击    2024-12-06 17:58