AI资讯新闻榜单内容搜索-GitHub

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GitHub
刷榜AI全挂了!Meta斯坦福地狱级测试,GPT/Claude/Gemini交出0分

刷榜AI全挂了!Meta斯坦福地狱级测试,GPT/Claude/Gemini交出0分

刷榜AI全挂了!Meta斯坦福地狱级测试,GPT/Claude/Gemini交出0分

SWE-Bench上能拿72%的模型,换张考卷直接归零!Meta联合斯坦福、哈佛放出ProgramBench,200个项目从零手写,9大顶级模型完整通过率0%。最强的Claude Opus 4.7平均通过率也才51.2%。更离谱的是一联网,就有模型在36%的任务里跑去GitHub扒源码。

来自主题: AI技术研报
6158 点击    2026-05-07 12:03
Claude最新功能泄露!主动助手Orbit接管一切工作

Claude最新功能泄露!主动助手Orbit接管一切工作

Claude最新功能泄露!主动助手Orbit接管一切工作

2026年5月4日,testingcatalog在Anthropic的Web/Mobile客户端里挖出隐藏功能Orbit。5月6日,Code with Claude大会在旧金山开幕。Orbit不等你开口就从Gmail、Slack、GitHub里替你干活了。

来自主题: AI资讯
6605 点击    2026-05-06 15:18
4万Star开源神作曝光顶级AI们的System Prompt!太有意思了~

4万Star开源神作曝光顶级AI们的System Prompt!太有意思了~

4万Star开源神作曝光顶级AI们的System Prompt!太有意思了~

最近发现 GitHub 上有个 4 万多 Star 的开源项目(system_prompts_leaks),干了一件事:把市面上几乎所有顶级 AI 产品的 System Prompt,全部扒了出来。ChatGPT、Claude、Gemini、Grok、Claude Cowork、Codex、Perplexity....你能叫得出名字的,基本都有。

来自主题: AI资讯
9782 点击    2026-05-05 13:50
“DeepSeek版Claude Code”,Github 2.3k星

“DeepSeek版Claude Code”,Github 2.3k星

“DeepSeek版Claude Code”,Github 2.3k星

DeepSeek也有自己专属的Coding Agent了。名字简单粗暴,就叫DeepSeek-TUI,作者自称是一名“鲸鱼兄弟”的DeepSeek爱好者。刚刚,这个项目的星标数突然开始骤增,来到了2.3k,还登上了GitHub热榜。

来自主题: AI资讯
8551 点击    2026-05-04 13:23
刚刚,DeepSeek多模态技术范式公布,以视觉原语思考

刚刚,DeepSeek多模态技术范式公布,以视觉原语思考

刚刚,DeepSeek多模态技术范式公布,以视觉原语思考

刚刚,DeepSeek 在 Github 上正式发布了多模态模型,公布了背后的技术报告。实打实的新鲜出炉!而且是开创性的推理范式。下面我们就基于 DeepSeek 这篇技术报告,具体看看 DeepSeek、北京大学、清华大学又创造了怎样的奇迹。

来自主题: AI技术研报
9230 点击    2026-04-30 20:24
AI「生肉证明」堆爆GitHub!陶哲轩重磅发声:只会解题没用了

AI「生肉证明」堆爆GitHub!陶哲轩重磅发声:只会解题没用了

AI「生肉证明」堆爆GitHub!陶哲轩重磅发声:只会解题没用了

陶哲轩最新判断,数学正在从「证明稀缺」进入「证明过剩」时代——数学家最值钱的工作已不再只是「做出证明」,而是验证它、消化它,并把一块 AI 吐出的「生肉证明」变成人类真正吃得下的知识。

来自主题: AI资讯
8306 点击    2026-04-30 13:53
开源版的 GPT Image 2,信息图、连续图文、本地部署全拿下|商汤SenseNova U1实测

开源版的 GPT Image 2,信息图、连续图文、本地部署全拿下|商汤SenseNova U1实测

开源版的 GPT Image 2,信息图、连续图文、本地部署全拿下|商汤SenseNova U1实测

SenseNova U1 是商汤最新发布的一个开源的多模态模型,它的 Lite 系列 8B 和 A3B 参数版本,目前已经在 Hugging Face 和 GitHub 上开源。APPSO 也提前拿到了测试资格,我们发现商汤这款新一代原生理解生成统一模型,就开源模型来说,已经做到了最好水平。

来自主题: AI产品测评
9282 点击    2026-04-29 19:51
AI 写代码太烧钱了:Copilot、Claude 一起涨价,不如把程序员请回来?

AI 写代码太烧钱了:Copilot、Claude 一起涨价,不如把程序员请回来?

AI 写代码太烧钱了:Copilot、Claude 一起涨价,不如把程序员请回来?

程序员们,先别忙着焦虑 AI 会抢走你的饭碗。现在更该焦虑的,可能是你们的 CTO 和 CFO 了:因为让 AI 写代码,实在太烧钱了。今天(4 月 28 日),GitHub 宣布从 2026 年 6 月 1 日起,GitHub Copilot 将告别“无限畅饮”模式,将 Copilot 从“按请求计费”转为“按使用量计费”。

来自主题: AI资讯
7306 点击    2026-04-29 14:40
李飞飞引爆的3D新技术,为什么这家深圳公司两年前就“玩腻”了?

李飞飞引爆的3D新技术,为什么这家深圳公司两年前就“玩腻”了?

李飞飞引爆的3D新技术,为什么这家深圳公司两年前就“玩腻”了?

在真正熟悉3D高斯泼溅技术的圈子里,“大规模3D高斯模型在移动端打开” 的技术早已不是什么新鲜事。两年前就有一家深圳创业公司,做出来并推出完整产品,甚至开源至GitHub。

来自主题: AI资讯
8175 点击    2026-04-28 11:04
这个51K星标的开源神器,让任何Agent都能一键切换所有模型。

这个51K星标的开源神器,让任何Agent都能一键切换所有模型。

这个51K星标的开源神器,让任何Agent都能一键切换所有模型。

毕竟,这个工具在我看来,他目前确实不仅是Claude Code里接国产模型,也还是其他的各种Agent产品比如OpenClaw、Hermes等等里面,切换模型最方便、最好用的一个。他就是开源的大名鼎鼎的cc switch,至今在github上已经50k的星标了。

来自主题: AI资讯
7411 点击    2026-04-28 11:02