AI资讯新闻榜单内容搜索-EVI

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: EVI
全网首发!实测全球首个 AI 程序员 Devin,月薪3500的全能实习生?

全网首发!实测全球首个 AI 程序员 Devin,月薪3500的全能实习生?

全网首发!实测全球首个 AI 程序员 Devin,月薪3500的全能实习生?

Devin 是一种全新的 AI 编程,他和 Cursor 还有 Windsurf 的区别在于,Devin 不需要你来操作,你只需要告诉他要做什么。

来自主题: AI产品测评
8886 点击    2024-12-13 10:53
28岁IOI金牌华人得主打造「AI程序员军团」,6个月创估值20亿独角兽!人类编程效率暴涨8倍

28岁IOI金牌华人得主打造「AI程序员军团」,6个月创估值20亿独角兽!人类编程效率暴涨8倍

28岁IOI金牌华人得主打造「AI程序员军团」,6个月创估值20亿独角兽!人类编程效率暴涨8倍

全球首个AI程序员Devin正以其自主编码、快速学习的超凡能力,挑战传统程序开发的边界。它不仅让投资界为之疯狂,更让程序员们既期待又警惕。这是技术革命的黎明,还是就要被颠覆的工作landscape?

来自主题: AI资讯
6142 点击    2024-12-04 15:12
两年营收近1200万美元,让1700万人的脸“会唱又会跳”,这款AI图像应用实现了!

两年营收近1200万美元,让1700万人的脸“会唱又会跳”,这款AI图像应用实现了!

两年营收近1200万美元,让1700万人的脸“会唱又会跳”,这款AI图像应用实现了!

让照片会“唱歌”,让人脸会“跳舞”。近期,一款名为Revive的AI图像应用登上欧洲多地娱乐免费榜Top50。上线两年左右的时间里,积累了近1700万用户,收入量也是高达1162万美元。

来自主题: AI资讯
8888 点击    2024-11-25 21:17
指令跟随大比拼!Meta发布多轮多语言基准Multi-IF:覆盖8种语言,超4500种任务

指令跟随大比拼!Meta发布多轮多语言基准Multi-IF:覆盖8种语言,超4500种任务

指令跟随大比拼!Meta发布多轮多语言基准Multi-IF:覆盖8种语言,超4500种任务

Meta全新发布的基准Multi-IF涵盖八种语言、4501个三轮对话任务,全面揭示了当前LLM在复杂多轮、多语言场景中的挑战。所有模型在多轮对话中表现显著衰减,表现最佳的o1-preview模型在三轮对话的准确率从87.7%下降到70.7%;在非拉丁文字语言上,所有模型的表现显著弱于英语。

来自主题: AI技术研报
5800 点击    2024-11-25 15:45
和梁朝伟同获港科荣誉博士,黄仁勋与沈向洋对谈Scaling Law、后训练、机器人和爱情

和梁朝伟同获港科荣誉博士,黄仁勋与沈向洋对谈Scaling Law、后训练、机器人和爱情

和梁朝伟同获港科荣誉博士,黄仁勋与沈向洋对谈Scaling Law、后训练、机器人和爱情

11 月 23 日,香港科技大学举行了今年度的学位颁授典礼。英伟达创始人和 CEO 黄仁勋又新增一个荣誉工程学博士头衔,与他一同获得荣誉博士学位的还有著名影星梁朝伟、2013 年诺贝尔化学奖得主 Michael Levitt、菲尔兹奖得主 David Mumford。

来自主题: AI资讯
5881 点击    2024-11-25 14:58
Claude 3.5两小时暴虐50多名专家,编程10倍速飙升!但8小时曝出惊人短板

Claude 3.5两小时暴虐50多名专家,编程10倍速飙升!但8小时曝出惊人短板

Claude 3.5两小时暴虐50多名专家,编程10倍速飙升!但8小时曝出惊人短板

AI自主研发会真的「失控」了吗?最新研究显示,Claude 3.5 Sonnet和o1-preview在2小时内的研发任务中,击败了50多位人类专家。但另一个耐人寻味的现象是,给予更长时间周期后,人类专家在8小时任务中优势显现。

来自主题: AI技术研报
5451 点击    2024-11-24 21:22
上交大o1复现新突破:蒸馏超越原版,警示AI研发"捷径陷阱"

上交大o1复现新突破:蒸馏超越原版,警示AI研发"捷径陷阱"

上交大o1复现新突破:蒸馏超越原版,警示AI研发"捷径陷阱"

自从 OpenAI 发布展现出前所未有复杂推理能力的 o1 系列模型以来,全球掀起了一场 AI 能力 “复现” 竞赛。近日,上海交通大学 GAIR 研究团队在 o1 模型复现过程中取得新的突破,通过简单的知识蒸馏方法,团队成功使基础模型在数学推理能力上超越 o1-preview。

来自主题: AI技术研报
5102 点击    2024-11-22 16:46
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格

媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格

媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格

如何解决模型生成幻觉一直是人工智能(AI)领域的一个悬而未解的问题。为了测量语言模型的事实正确性,近期 OpenAI 发布并开源了一个名为 SimpleQA 的评测集。而我们也同样一直在关注模型事实正确性这一领域,目前该领域存在数据过时、评测不准和覆盖不全等问题。例如现在大家广泛使用的知识评测集还是 CommonSenseQA、CMMLU 和 C-Eval 等选择题形式的评测集。

来自主题: AI技术研报
7425 点击    2024-11-20 15:02
杨植麟发布Kimi新模型:数学对标o1,中考高考考研成绩全第一

杨植麟发布Kimi新模型:数学对标o1,中考高考考研成绩全第一

杨植麟发布Kimi新模型:数学对标o1,中考高考考研成绩全第一

kimi全面开放一周年之际,创始人杨植麟亲自发布新模型—— 数学模型k0-math,对标OpenAI o1系列,主打深入思考。 在MATH、中考、高考、考研4个数学基准测试中,k0-math成绩超过o1-mini和o1-preview。

来自主题: AI资讯
6908 点击    2024-11-16 21:16