AI资讯新闻榜单内容搜索-AI模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: AI模型
Karpathy新实验火了!一个「表情」占53个token,DeepSeek-R1苦思10分解谜失败

Karpathy新实验火了!一个「表情」占53个token,DeepSeek-R1苦思10分解谜失败

Karpathy新实验火了!一个「表情」占53个token,DeepSeek-R1苦思10分解谜失败

一个简单的笑脸😀可能远不止这么简单?最近,AI大神Karpathy发现,一个😀竟然占用了多达53个token!这背后隐藏着Unicode编码的哪些秘密?如何利用这些「隐形字符」在文本中嵌入、传递甚至「隐藏」任意数据。更有趣的是,这种「数据隐藏术」甚至能对AI模型进行「提示注入」!

来自主题: AI技术研报
6026 点击    2025-02-14 10:21
被AI追杀,还要解谜逃生!UCSD等发布LLM测试神器,边玩游戏边评估

被AI追杀,还要解谜逃生!UCSD等发布LLM测试神器,边玩游戏边评估

被AI追杀,还要解谜逃生!UCSD等发布LLM测试神器,边玩游戏边评估

还在用枯燥的数学题和编程题测试AI?落伍啦!现在,打游戏就能测出AI的真实力。GameArena团队打造的Roblox新游《AI空间逃脱》,让你在紧张刺激的密室逃脱中,顺便就把AI模型的推理能力给评估了。这不仅比传统测试方法更有趣,还能生成宝贵的游戏数据,帮助开发者更全面地了解AI的强项与短板。

来自主题: AI资讯
8257 点击    2025-02-12 17:08
诺奖得主DeepMind CEO放话:DeepSeek是中国最好AI模型,但没任何科学进步

诺奖得主DeepMind CEO放话:DeepSeek是中国最好AI模型,但没任何科学进步

诺奖得主DeepMind CEO放话:DeepSeek是中国最好AI模型,但没任何科学进步

xAI、谷歌DeepMind和Anthropic的CEO们纷纷对DeepSeek的技术创新性提出质疑,认为其并未带来实质性的科学突破。AI大佬纷纷泼冷水,到底是技术讨论还是各怀目的?

来自主题: AI资讯
7829 点击    2025-02-10 16:50
人类最后一次考试,AI惨败正确率<10%!数百顶级专家联手出题,DeepSeek竟是王者

人类最后一次考试,AI惨败正确率<10%!数百顶级专家联手出题,DeepSeek竟是王者

人类最后一次考试,AI惨败正确率<10%!数百顶级专家联手出题,DeepSeek竟是王者

AI模型可能并没有想象中强大。在最新的AI基准测试「人类最后一次考试」中,所有顶尖LLM通过率不超过10%,而且模型都表现得过度自信。

来自主题: AI技术研报
5700 点击    2025-01-27 13:36
欧莱雅首席转型与数字官:与IBM合作,打造用于化妆品配方的生成式AI模型

欧莱雅首席转型与数字官:与IBM合作,打造用于化妆品配方的生成式AI模型

欧莱雅首席转型与数字官:与IBM合作,打造用于化妆品配方的生成式AI模型

欧莱雅与IBM正在合作开发一款定制化的生成式人工智能(GenAI)模型,旨在加速化妆品配方流程,进一步拓展生成式AI在个人护理市场的应用版图。 IBM表示,这款定制AI工具将“显著提升欧莱雅研发团队在各个化妆品品类和全球市场的性能表现与消费者满意度”。

来自主题: AI资讯
6114 点击    2025-01-20 20:02
Transformer作者初创重磅发布Transformer²!AI模型活了,动态调整自己权重

Transformer作者初创重磅发布Transformer²!AI模型活了,动态调整自己权重

Transformer作者初创重磅发布Transformer²!AI模型活了,动态调整自己权重

Sakana AI发布了Transformer²新方法,通过奇异值微调和权重自适应策略,提高了LLM的泛化和自适应能力。新方法在文本任务上优于LoRA;即便是从未见过的任务,比如MATH、HumanEval和ARC-Challenge等,性能也都取得了提升。

来自主题: AI技术研报
8349 点击    2025-01-16 10:23
Transformer²要做「活」的AI模型,动态调整权重,像章鱼一样适应环境

Transformer²要做「活」的AI模型,动态调整权重,像章鱼一样适应环境

Transformer²要做「活」的AI模型,动态调整权重,像章鱼一样适应环境

自适应 LLM 反映了神经科学和计算生物学中一个公认的原理,即大脑根据当前任务激活特定区域,并动态重组其功能网络以响应不断变化的任务需求。

来自主题: AI技术研报
5036 点击    2025-01-15 18:30
让「幻觉」无处遁形!谷歌DeepMind全新基准,三代Gemini同台霸榜

让「幻觉」无处遁形!谷歌DeepMind全新基准,三代Gemini同台霸榜

让「幻觉」无处遁形!谷歌DeepMind全新基准,三代Gemini同台霸榜

谷歌推出的FACTS Grounding基准测试,能评估AI模型在特定上下文中生成准确文本的能力,有助于提升模型的可靠性;通过去除不满足用户需求的回复,确保了评分的准确性和模型排名的公正性。

来自主题: AI技术研报
8581 点击    2025-01-13 13:47
我们正在大模型产品面前“裸奔”么

我们正在大模型产品面前“裸奔”么

我们正在大模型产品面前“裸奔”么

每天,全球有数亿人在向AI产品倾诉他们的想法、困惑、创意,甚至秘密。但鲜有人意识到,这些对话正在以“帮助训练下一代AI模型的”的名义,突破着过往移动互联网产品的数据使用界限。

来自主题: AI资讯
6090 点击    2025-01-13 11:43