Claude 3.7硬控马里奥90秒,GPT-4o开局暴毙!Karpathy直呼基准失效,游戏成LLM新战场
Claude 3.7硬控马里奥90秒,GPT-4o开局暴毙!Karpathy直呼基准失效,游戏成LLM新战场Karpathy发出灵魂拷问,评估AI究竟该看哪些指标?答案或许就藏在经典游戏里!最近,加州大学圣迭戈分校Hao AI Lab用超级马里奥等评测AI智能体,Claude 3.7结果令人瞠目结舌。
Karpathy发出灵魂拷问,评估AI究竟该看哪些指标?答案或许就藏在经典游戏里!最近,加州大学圣迭戈分校Hao AI Lab用超级马里奥等评测AI智能体,Claude 3.7结果令人瞠目结舌。
19岁退学哈佛,投身AI创业,跟硅谷大佬称兄道弟,走上人生巅峰!如今,三位00后创始人的这家AI招聘公司,已经估值20亿美元,用时两年成为百亿级独角兽,如今单月收入700万美元,年化收入已达7500万刀。
在科技圈,有些域名就像黄金地段的房子,永远不会便宜。AI.com,无疑是其中最璀璨的一颗。
欧盟AI办公室将于2025年4月28日在布鲁塞尔举办一场重要的线下研讨会,旨在探讨通用目的人工智能(GPAI)系统性风险评估的最佳实践。本次研讨会是欧盟AI治理框架中的一个重要里程碑,反映了欧盟在AI安全、透明度和合规性方面的持续努力。
农历新年刚过,DeepSeek卷王依旧,这次一下子进行了接连六天的开源Week。
全球人形机器人,哪家强?
AI终端生态公司,荣耀的新年新定位。
只有卖课的赚了。
在信息爆炸的时代,搜索引擎早已成为知识工作者和普通人获取专业信息的关键入口。然而,传统搜索引擎以关键词匹配为核心的模式,正在面临前所未有的挑战。
刚刚,我最喜欢的AI编程工具Trae,居然把国内版给上线了。有朋友可能还不知道啥是Trae,我简单顺一下前情提要。Trae是字节出的类似Cursor的AI编程工具,1月20号正式推出,支持原生中文,就这一点,让我这种其实对代码很陌生的人,就觉得极度友好。
杭州在有了六小龙之后,下一个目标,“盯”上了北京的六小虎——智谱。在杭州的大力支持下,近日智谱完成一笔金额超10亿元人民币的战略融资,参与投资方包括杭州城投产业基金、上城资本等。
国际可重构计算领域顶级会议 ——FPGA 2025 在落幕之时传来消息,今年的最佳论文颁发给了无问芯穹和上交、清华共同提出的视频生成大模型推理 IP 工作 FlightVGM,这是 FPGA 会议首次将该奖项授予完全由中国大陆科研团队主导的研究工作,同时也是亚太国家团队首次获此殊荣。
什么,你在开发RAG竟然还没听说过Embedding模型还有排名?在AI应用开发热潮中,Embedding模型的选择已成为决定RAG系统成败的关键因素。然而,令人惊讶的是,许多开发者仍依靠直觉或跟风选择模型,而非基于系统化评估。
只需几句话,AI 模型就可以被提示创作一个故事、一幅图像,甚至一部短片。但根据 Weber Wong 的说法,“这些模型都是“由非创意人士制作,供其他非创意人士感受创意的。”
上个周末,百度文库那个自由画布全量上线了。
LLM在推理任务中表现惊艳,却在自我纠正上的短板却一直令人头疼。UIUC联手马里兰大学全华人团队提出一种革命性的自我奖励推理框架,将生成、评估和纠正能力集成于单一LLM,让模型像人类一样「边想边改」,无需外部帮助即可提升准确性。
听说了嘛?朋友,元宝电脑版新鲜出炉了!
现有的可控Diffusion Transformer方法,虽然在推进文本到图像和视频生成方面取得了显著进展,但也带来了大量的参数和计算开销。
AI 搜索加广告,你能接受吗?
大语言模型(LLMs)在当今的自然语言处理领域扮演着越来越重要的角色,但其安全性问题也引发了广泛关注。
扎克伯格也有「暗部」。
争吵之后,AI Infra公司的未来何去何从。
通过Deepseek、ChatGPT、Gemini等大模型说出来的话,不少没有辨别能力的小伙伴就会默认是公道与正确的。其实是未必。1.Deepseek、ChatGPT、Gemini等联网搜索的结果与规则还在完善;
黑石的野心远不止于对AI的“豪赌”。这家老牌资产管理公司正在加速转型,从传统的不动产投资巨头,转变为全球科技基础设施的资本掌舵者。
从漫长等待到极速突破
3月3日,智谱公布了最新一轮融资:本轮战略融资金额超10亿元人民币,参与投资方包括杭州城投产业基金、上城资本等。智谱称:此次融资旨在推动智谱国产基座GLM大模型的技术创新和生态发展。
2025年1月,CEA(Council of Economic Advisers,美国总统经济顾问委员会)发布了一份详细的人工智能人才报告,全景式地扫描了美国AI人才的现状。
近些日子,老詹突然“爱”上了DeepSeeK,简直有点相见恨晚的感觉!几乎每天都摆弄这玩意儿。然而,处着处着,我发现,这家伙有点靠不住!最大的问题是,说假话!
昨天,两位独立开发者上演了一场现场设计大战: Brett Williams,Webflow老司机,通过他的网页设计工作室Designjoy年入100万+美元 Henrik Westerlund,19岁营销专业辍学生,来自Lovable,一款通过文本提示生成完整功能网页应用的AI产品
我想在沙漠里建一个室内滑雪场。DeepSeek:可以,详细计划如下。这是阿里国际站首个AI搜索引擎Accio接入DeepSeek之后的演示首秀。即便是这么离谱的想法,它还是在短短30秒内搜索了大量资料、反复推理,给出了一份有理有据的商业计划。