AI资讯新闻榜单内容搜索-Math

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Math
完全使用「自生成数据」实现LLM自我纠正,DeepMind新突破SCoRe:纠正性能提升15.9%

完全使用「自生成数据」实现LLM自我纠正,DeepMind新突破SCoRe:纠正性能提升15.9%

完全使用「自生成数据」实现LLM自我纠正,DeepMind新突破SCoRe:纠正性能提升15.9%

Google DeepMind的SCoRe方法通过在线多轮强化学习,显著提升了大型语言模型在没有外部输入的情况下的自我修正能力。该方法在MATH和HumanEval基准测试中,分别将自我修正性能提高了15.6%和9.1%。

来自主题: AI技术研报
10985 点击    2024-09-27 19:26
北大AI奥数评测,o1-mini比o1-preview分数还高

北大AI奥数评测,o1-mini比o1-preview分数还高

北大AI奥数评测,o1-mini比o1-preview分数还高

OpenAI的o1系列一发布,传统数学评测基准都显得不够用了。

来自主题: AI技术研报
9177 点击    2024-09-23 15:30
人均融资1亿美元,一个有故事可讲的AI赛道

人均融资1亿美元,一个有故事可讲的AI赛道

人均融资1亿美元,一个有故事可讲的AI赛道

AI 与数学普惠。这一期将作为“AI+教育”系列的中篇来聊一聊 AI 在数学领域的应用。

来自主题: AI资讯
4204 点击    2024-09-19 09:08
刚刚,开源大模型的新王诞生了:超越GPT-4o,模型还能自动纠错

刚刚,开源大模型的新王诞生了:超越GPT-4o,模型还能自动纠错

刚刚,开源大模型的新王诞生了:超越GPT-4o,模型还能自动纠错

快速更迭的开源大模型领域,又出现了新王:Reflection 70B。 横扫 MMLU、MATH、IFEval、GSM8K,在每项基准测试上都超过了 GPT-4o,还击败了 405B 的 Llama 3.1。 这个新模型 Reflection 70B,来自 AI 写作初创公司 HyperWrite。

来自主题: AI资讯
7963 点击    2024-09-06 16:36
原作亲自下场!Mistral首款开源7B Mamba模型「埃及艳后」效果惊艳

原作亲自下场!Mistral首款开源7B Mamba模型「埃及艳后」效果惊艳

原作亲自下场!Mistral首款开源7B Mamba模型「埃及艳后」效果惊艳

最近,7B小模型又成为了AI巨头们竞相追赶的潮流。继谷歌的Gemma2 7B后,Mistral今天又发布了两个7B模型,分别是针对STEM学科的Mathstral,以及使用Mamaba架构的代码模型Codestral Mamba。

来自主题: AI技术研报
10064 点击    2024-07-17 19:53