AI资讯新闻榜单内容搜索-EVI

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: EVI
Open o1不会“消灭”程序员

Open o1不会“消灭”程序员

Open o1不会“消灭”程序员

AI编程技术竞赛加剧

来自主题: AI资讯
6297 点击    2024-09-21 14:57
留子们用火星文写避雷帖,AI竟看懂了?我们实测:几乎全军覆没

留子们用火星文写避雷帖,AI竟看懂了?我们实测:几乎全军覆没

留子们用火星文写避雷帖,AI竟看懂了?我们实测:几乎全军覆没

留子们在写一种很新的差评。 由于全球点评打卡平台,都有个自动翻译的功能,为了防止被店家骚扰,也为了给同胞避雷,身在海外的国人们,想出各种奇招优雅给差评。

来自主题: AI资讯
3455 点击    2024-09-20 10:06
OpenAI o1全方位SOTA登顶lmsys排行榜!数学能力碾压Claude和谷歌模型,o1-mini并列第一

OpenAI o1全方位SOTA登顶lmsys排行榜!数学能力碾压Claude和谷歌模型,o1-mini并列第一

OpenAI o1全方位SOTA登顶lmsys排行榜!数学能力碾压Claude和谷歌模型,o1-mini并列第一

o1模型发布1周,lmsys的6k+投票就将o1-preview送上了排行榜榜首。同时,为了满足大家对模型「IOI金牌水平」的好奇心,OpenAI放出了o1测评时提交的所有代码。

来自主题: AI资讯
8588 点击    2024-09-19 22:03
昂贵LLM的救星?Nature新研究提出新型忆阻器,比Haswell CPU高效460倍

昂贵LLM的救星?Nature新研究提出新型忆阻器,比Haswell CPU高效460倍

昂贵LLM的救星?Nature新研究提出新型忆阻器,比Haswell CPU高效460倍

前些天,OpenAI 发布了 ο1 系列模型,它那「超越博士水平的」强大推理性能预示着其必将在人们的生产生活中大有作为。但它的使用成本也很高,以至于 OpenAI 不得不限制每位用户的使用量:每位用户每周仅能给 o1-preview 发送 30 条消息,给 o1-mini 发送 50 条消息。

来自主题: AI技术研报
4992 点击    2024-09-17 19:14
深挖 OpenAI o1 :独立思考,智商超群,思维隐藏,一石三鸟...

深挖 OpenAI o1 :独立思考,智商超群,思维隐藏,一石三鸟...

深挖 OpenAI o1 :独立思考,智商超群,思维隐藏,一石三鸟...

全网 OpenAI o1 的测试基本跑完,大家基本认可这是一个独立思考智商超高的模型,智商测试120,高考数学全对。

来自主题: AI资讯
8509 点击    2024-09-16 20:08
榨取大模型算力,百度想了一些招

榨取大模型算力,百度想了一些招

榨取大模型算力,百度想了一些招

以前最宝贵的资源是黄金,现在最宝贵的资源是算力。

来自主题: AI资讯
8374 点击    2024-09-16 20:01
Meta:大语言模型可以通过自我批判取得大幅提升!

Meta:大语言模型可以通过自我批判取得大幅提升!

Meta:大语言模型可以通过自我批判取得大幅提升!

论文的审稿模式想必大家都不会陌生,一篇论文除了分配多个评审,最后还将由PC综合评估各位审稿人的reviews撰写meta-review。

来自主题: AI技术研报
7310 点击    2024-09-04 23:07
深度|微软CTO谈大模型scaling laws和人工智能平台转变

深度|微软CTO谈大模型scaling laws和人工智能平台转变

深度|微软CTO谈大模型scaling laws和人工智能平台转变

非凡产研为大家整理编辑了近期微软CTO凯文·斯科特(Kevin Scott)接受红杉资本、Stratechery 采访回应关于大模型scaling laws、人工智能平台转变等焦点话题的精华内容。

来自主题: AI资讯
5118 点击    2024-08-17 14:15
OpenAI「草莓」模型再次跳票,凌晨发布的SWE-bench Verified是个啥?

OpenAI「草莓」模型再次跳票,凌晨发布的SWE-bench Verified是个啥?

OpenAI「草莓」模型再次跳票,凌晨发布的SWE-bench Verified是个啥?

一直以来,大模型的编程能力都备受关注,超强 AI 程序员 Devin 的问世更是将「AI 能否替代程序员」这一话题推上了风口浪尖。最近,Devin 也迎来了新对手 —— 初创公司 Cosine 推出的自主 AI 程序员 Genie。该公司表示,Genie 的表现轻松超越了 Devin,在第三方基准测试 SWE-bench 上的得分为 30%,而 Devin 的得分仅为 13.8%。

来自主题: AI资讯
7446 点击    2024-08-14 17:29