AI资讯新闻榜单内容搜索-GPT

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GPT
一头大象难倒ChatGPT,Grok 3完美通关

一头大象难倒ChatGPT,Grok 3完美通关

一头大象难倒ChatGPT,Grok 3完美通关

ChatGPT新Bug引热议:无法画出“有0头大象的房间”。

来自主题: AI资讯
6034 点击    2025-03-05 14:41
GPT-4.5智商测试94,登上LLM竞技场榜首!网友质疑黑幕,实测结果惊人

GPT-4.5智商测试94,登上LLM竞技场榜首!网友质疑黑幕,实测结果惊人

GPT-4.5智商测试94,登上LLM竞技场榜首!网友质疑黑幕,实测结果惊人

在知名AI排行榜LM Arena中,曾全班垫底的GPT-4.5竟一度拿下第一?甚至在数学、编程等领域表现优异,这反常的表现让网友们一度质疑:大模型竞技场莫非被LLM操纵了?不过网友们在实测后却惊讶发现,GPT-4.5的确情商爆表,不用推理就能理解人类的深层意图!

来自主题: AI资讯
6032 点击    2025-03-05 13:31
Dify外接Fastgpt知识库,这套组合可以说封神了!【喂饭级教程】

Dify外接Fastgpt知识库,这套组合可以说封神了!【喂饭级教程】

Dify外接Fastgpt知识库,这套组合可以说封神了!【喂饭级教程】

说真的,dify除了知识库以外,其他大部分功能体验都比fastgpt要好。而fastgpt的知识库效果是公认的好(以下是某群 群友的评价~)不过我想: 如果能把dify和fastgpt结合,且不妙哉?

来自主题: AI技术研报
9879 点击    2025-03-05 11:25
祖母的讣告能用Deepseek代写吗?

祖母的讣告能用Deepseek代写吗?

祖母的讣告能用Deepseek代写吗?

恰巧那段时间,他开始使用OpenAI的人工智能聊天工具ChatGPT,主要是捣鼓点购物清单,让它帮忙做做预算什么的。它能帮忙写讣闻吗?金开始给ChatGPT发送一些祖母的人生经历——她在护士的岗位上干到退休、热爱保龄球、儿孙满堂等等——并要求它据此写一篇讣告。

来自主题: AI资讯
6811 点击    2025-03-05 09:06
DeepSeek-R1、o1都在及格线挣扎!字节开源全新知识推理测评集,覆盖285个学科

DeepSeek-R1、o1都在及格线挣扎!字节开源全新知识推理测评集,覆盖285个学科

DeepSeek-R1、o1都在及格线挣扎!字节开源全新知识推理测评集,覆盖285个学科

要知道,过去几年,各种通用评测逐渐同质化,越来越难以评估模型真实能力。GPQA、MMLU-pro、MMLU等流行基准,各家模型出街时人手一份,但局限性也开始暴露,比如覆盖范围狭窄(通常不足 50 个学科),不含长尾知识;缺乏足够挑战性和区分度,比如 GPT-4o 在 MMLU-Pro 上准确率飙到 92.3%。

来自主题: AI技术研报
6020 点击    2025-03-04 14:28
GPT-4.5登顶6小时即失守!Grok-3上演1分逆袭

GPT-4.5登顶6小时即失守!Grok-3上演1分逆袭

GPT-4.5登顶6小时即失守!Grok-3上演1分逆袭

基础模型竞争又紧张刺激起来了!GPT-4.5刚登顶竞技场且全任务分类第一名,6小时后总榜就被马斯克的新版Grok-3反超。两者都是获得3000+票数,总分1412:1411只差一分。

来自主题: AI资讯
6032 点击    2025-03-04 13:11
Claude 3.7硬控马里奥90秒,GPT-4o开局暴毙!Karpathy直呼基准失效,游戏成LLM新战场

Claude 3.7硬控马里奥90秒,GPT-4o开局暴毙!Karpathy直呼基准失效,游戏成LLM新战场

Claude 3.7硬控马里奥90秒,GPT-4o开局暴毙!Karpathy直呼基准失效,游戏成LLM新战场

Karpathy发出灵魂拷问,评估AI究竟该看哪些指标?答案或许就藏在经典游戏里!最近,加州大学圣迭戈分校Hao AI Lab用超级马里奥等评测AI智能体,Claude 3.7结果令人瞠目结舌。

来自主题: AI资讯
7169 点击    2025-03-03 16:00
怎么在DeepSeek里做SEO:一篇文章讲透生成引擎优化GEO

怎么在DeepSeek里做SEO:一篇文章讲透生成引擎优化GEO

怎么在DeepSeek里做SEO:一篇文章讲透生成引擎优化GEO

通过Deepseek、ChatGPT、Gemini等大模型说出来的话,不少没有辨别能力的小伙伴就会默认是公道与正确的。其实是未必。1.Deepseek、ChatGPT、Gemini等联网搜索的结果与规则还在完善;

来自主题: AI技术研报
8227 点击    2025-03-03 09:36
DeepSeek效应初现:Grok-3补刀ChatGPT,OpenAI已在ICU?

DeepSeek效应初现:Grok-3补刀ChatGPT,OpenAI已在ICU?

DeepSeek效应初现:Grok-3补刀ChatGPT,OpenAI已在ICU?

DeepSeek和xAI相继用R1和Grok-3证明:预训练Scaling Law不是OpenAI的护城河。将来95%的算力将用在推理,而不是现在的训练和推理各50%。OpenAI前途不明,生死难料!

来自主题: AI资讯
6029 点击    2025-03-01 22:37
AI 合同大模型,正式进入"脑力革命"时代

AI 合同大模型,正式进入"脑力革命"时代

AI 合同大模型,正式进入"脑力革命"时代

2025年开年,全球AI战场硝烟弥漫。 ChatGPT悄然迭代至GPT-6,在DeepSeek横空出世、在多领域大展拳脚后,马斯克旗下的人工智能公司紧随其后重磅发布了Grok 3系列模型。

来自主题: AI资讯
5879 点击    2025-03-01 22:28