大模型权威测试被曝翻车!更偏袒GPT-4等闭源模型,连提示词都区别对待
大模型权威测试被曝翻车!更偏袒GPT-4等闭源模型,连提示词都区别对待大模型权威测试,翻车了?! HuggingFace都在用的MMLU-PRO,被扒出评测方法更偏向闭源模型,被网友直接在GitHub Issue提出质疑。
搜索
大模型权威测试,翻车了?! HuggingFace都在用的MMLU-PRO,被扒出评测方法更偏向闭源模型,被网友直接在GitHub Issue提出质疑。
现在开发一个APP需要多久? “云计算一哥”亚马逊云科技,深夜给出了一个新标准—— 只需三步,几分钟,纯靠自然语言和鼠标“点点点”即可。
已经与OpenAI合作多年的微软,以及刚刚透露要加入董事会的苹果,这两天突然毫无征兆地宣布放弃董事会观察员席位。难道OpenAI真的要终止合作、决定单飞了?
无论是大模型独角兽们长在飞书上,还是最大AI科普发生在飞书上。AI正在与飞书产生越来越深入的关联。
一年一度谷歌学术指标公布了!Nature年年霸榜,而今年与以往不同的是,国际学术顶会的排名大幅提升,CVPR位居第二,超越Science仅次于Nature。另外,TOP 20中,共有五大顶会入选,被引最高论文与大模型时代下前沿技术,一脉相承。
AI剧本杀,开本了!最近,两位开发者在黑客马拉松期间创作了一款AI游戏「山庄谋杀案」,我们需要和五位AI嫌疑人对话,揪出真正的凶手。没想到,小编一番试玩后,结局出乎意料……
最近,一位AI炒菜机器人不仅向人类大厨发起了PK,而且还通过了「图灵测试」:根本吃不出来是AI机器人炒的!而在这背后,竟然是1.5个亿的投入和近7吨菜的训练。
近年来,人物动作生成的研究取得了显著的进展,在众多领域,如计算机视觉、计算机图形学、机器人技术以及人机交互等方面获得广泛的关注。然而,现有工作大多只关注动作本身,以场景和动作类别同时作为约束条件的研究依然处于起步阶段。
同样是图生视频,PaintsUndo 走出了不一样的路线。
四大 VLM,竟都在盲人摸象?
近日,字节跳动大模型团队开发的成果 Depth Anything V2 ,入选苹果公司 Core ML 模型库,目前已呈现在开发者相关页面中。
构建生成式 AI 应用,现在只需要几分钟。
近日,硅基流动完成总金额近亿元人民币的天使+轮融资,投资方包括智谱AI、360 和水木清华校友基金;创始人兼CEO袁进辉是清华计算机系博士,此前曾创立一流科技。
创始人阿里安娜·赫芬顿 (Arianna Huffington) 表示:“重要的是AI从根本上,为我们改善健康和延长寿命。”
Meta目前专注于通过参与度实现盈利
Cohere CEO称要把大模型技术推向全世界,公司将以”非炒作的“策略拉取更多投资。
这些“坑”要警惕
股神的AI投资版图
向何小鹏汇报的人又变多了。
不大可能重现iPhone奇迹。
竞速迎“风”而上,抖音、快手、博纳“开卷”AI短剧。
Kimi探索出了一条新路。
大幅节省算力资源,又又又有新解了!!
Claude 3.5上新的“工坊模式”(Artifacts)再次更新,写完的网页应用支持一键分享了!
AI一天,人间一年。
随着人工智能和大型模型技术的迅猛发展,检索增强生成(Retrieval-Augmented Generation, RAG)已成为大型语言模型生成文本的一种主要范式。
不会写 prompt 的看过来。
ControlNet作者张吕敏(Lvmin Zhang)又又又发新作了!
释放进一步扩展 Transformer 的潜力,同时还可以保持计算效率。
这几年,人们都在谈论大模型。特别是在 Scaling Law 的指导下,人们寄希望于将更大规模的数据用于训练,以无限提升模型的智能水平。在中国,「数据」作为一种与土地、劳动力、资本、技术并列的生产要素,价值越来越被重视。