AI资讯新闻榜单内容搜索-大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模型
告别Prompt抽卡和评分通胀:一个让AI游戏真正「机制化迭代」的框架

告别Prompt抽卡和评分通胀:一个让AI游戏真正「机制化迭代」的框架

告别Prompt抽卡和评分通胀:一个让AI游戏真正「机制化迭代」的框架

让大模型写一个小游戏,已经不新鲜了。它可以很快生成一个 Flappy Bird、一个塔防游戏、一个物理解谜页面,甚至还能补上按钮、分数和简单动画。但真正的问题是:这些游戏到底有没有新的玩法?它们是在创造,亦或只是把已有游戏换了一层皮?

来自主题: AI技术研报
10172 点击    2026-05-11 09:02
只要24GB 内存,能在本地 Mac上跑无限制的Gemma 4 31B了

只要24GB 内存,能在本地 Mac上跑无限制的Gemma 4 31B了

只要24GB 内存,能在本地 Mac上跑无限制的Gemma 4 31B了

有个31B参数的大模型,正常需要80GB显存才能跑。但现在,24GB显存就能跑满血版。这个版本叫Gemma-4-31B-JANG_4M-CRACK——"CRACK"这个词不要理解歪了,它本质是量化压缩加上对齐微调之后的部署版本,不是什么黑客攻击,就是工程优化。24GB,MacBook Pro,直接跑。苹果用户优先优化,MLX原生支持,月下载13000次。

来自主题: AI资讯
9017 点击    2026-05-10 11:39
蚂蚁万亿参数思考模型Ring-2.6-1T来了!实测AIME真题难不倒,会写爽文、规划出行

蚂蚁万亿参数思考模型Ring-2.6-1T来了!实测AIME真题难不倒,会写爽文、规划出行

蚂蚁万亿参数思考模型Ring-2.6-1T来了!实测AIME真题难不倒,会写爽文、规划出行

今天,蚂蚁百灵大模型发布Ring-2.6-1T。这是一款面向真实复杂任务场景的万亿级思考模型,目前已上线OpenRouter,并开放限时一周免费体验,后续将正式开源。Ring-2.6-1T加入了可调节的Reasoning Effort机制。开发者可以在high和xhigh两种推理强度之间选择:high面向Agent、Coding、多步工具调用等高频任务

来自主题: AI资讯
8976 点击    2026-05-09 21:30
大模型不认识马嘉祺?我们做了一次全链路排查

大模型不认识马嘉祺?我们做了一次全链路排查

大模型不认识马嘉祺?我们做了一次全链路排查

MiniMax M2 系列受到了开发者社区的广泛关注,不少用户在深度使用中发现了一些个例问题,其中“模型无法说出马嘉祺”这个问题引发了较多讨论。 我们也注意到,社区中有不少开发者对这个现象进行了高质量

来自主题: AI技术研报
8797 点击    2026-05-09 10:35
Anthropic最新论文撬开大模型黑箱:隐藏动机发现率提升 4 倍以上

Anthropic最新论文撬开大模型黑箱:隐藏动机发现率提升 4 倍以上

Anthropic最新论文撬开大模型黑箱:隐藏动机发现率提升 4 倍以上

刚刚,Anthropic 发布论文《Natural Language Autoencoders Produce Unsupervised Explanations of LLM Activations》,试图用一套 自然语言自动编码器(Natural Language Autoencoders,下文简称 NLA), 撬开这个黑箱。

来自主题: AI技术研报
8743 点击    2026-05-08 14:33
170亿!阶跃星辰即将完成中国大模型最大融资

170亿!阶跃星辰即将完成中国大模型最大融资

170亿!阶跃星辰即将完成中国大模型最大融资

据消息人士透露,阶跃星辰将完成近25亿美元(约合人民币170亿元)融资,并已拆除红筹架构,加速筹备赴港IPO,或将成为智谱、MiniMax之外又一家赴港上市的国产大模型公司。

来自主题: AI资讯
9656 点击    2026-05-08 14:12
ACL 2026|告别冗长思维链!Laser用「概率叠加」重塑多模态大模型隐式推理

ACL 2026|告别冗长思维链!Laser用「概率叠加」重塑多模态大模型隐式推理

ACL 2026|告别冗长思维链!Laser用「概率叠加」重塑多模态大模型隐式推理

为了解决这一痛点,由 MBZUAI、复旦大学、中国人民大学高瓴人工智能学院以及哈佛大学联合组成的研究团队,提出了一种名为 Laser 的全新隐式视觉推理范式。该研究从认知心理学中汲取灵感,引入了 “Forest-before-Trees” 的认知机制,通过动态窗口对齐学习(DWAL),首次实现了在隐空间中维持视觉特征的 “概率叠加” 状态。

来自主题: AI技术研报
6390 点击    2026-05-08 14:07
提速4.48倍!哈工大华为新框架让扩散大模型精度无损、推理起飞

提速4.48倍!哈工大华为新框架让扩散大模型精度无损、推理起飞

提速4.48倍!哈工大华为新框架让扩散大模型精度无损、推理起飞

文本生成这件事,扩散大语言模型(dLLMs)正展现出巨大的潜力。但与此同时,它也面临着严重的计算瓶颈——为此,哈工大(深圳)与华为、深圳河套学院的研究团队提出了一套免训练加速框架Dynamic-dLLM。

来自主题: AI技术研报
8092 点击    2026-05-08 14:05