通用文档理解新SOTA,多模态大模型TextMonkey来了
通用文档理解新SOTA,多模态大模型TextMonkey来了最近,华中科技大学和金山的研究人员在多模态大模型 Monkey [1](Li et al., CVPR2024)工作的基础上提出 TextMonkey。在多个场景文本和文档的测试基准中,TextMonkey 处于国际领先地位,有潜力带来办公自动化、智慧教育、智慧金融等行业应用领域的技术变革。
搜索
最近,华中科技大学和金山的研究人员在多模态大模型 Monkey [1](Li et al., CVPR2024)工作的基础上提出 TextMonkey。在多个场景文本和文档的测试基准中,TextMonkey 处于国际领先地位,有潜力带来办公自动化、智慧教育、智慧金融等行业应用领域的技术变革。
最近,Kimi Chat 的上下文长度从 20 万汉字升级到了 200 万汉字,10 倍的差距已经足够产生一次质变,做很多之前做不了的事情。感谢月之暗面给了提前测试的机会,我们直接开测!
排位赛还未到来,业界公认,2024年是AIPC元年。AI似乎给PC产业注入了一支肾上腺素,被业界视为新一轮的重要增长机遇。
3 月 23 日,国内通用大模型创业公司阶跃星辰在 2024 全球开发者先锋大会上发布了公司的通用大模型产品。阶跃星辰创始人、CEO 姜大昕博士在大会开幕式上对外发布了 Step 系列通用大模型,包括 Step-1 千亿参数语言大模型、Step-1V 千亿参数多模态大模型以及 Step-2 万亿参数 MoE 语言大模型预览版。
加上此次CEO的辞职,Stability AI已经相继失去了十几位技术人才。又一知名的AI独角兽发生了管理层变动。当地时间3月23日,估值超40亿美元的独角兽AI公司Stability AI称,CEO Emad Mostaque辞去了CEO以及董事会职务,去追求去中心化的AI了。
AGI时代,越来越近了。本月,中国初创AGI(通用人工智能)公司月之暗面宣布旗下大模型工具Kimi Chat正式升级到200万字参数量,与五个月前该大模型初次亮相时的20万字相比,提升十倍。Kimi Chat的升级彻底引爆市场,同时也引起长文本大模型(Long-LLM)细分赛道更加激烈的竞争。
我们就是奔着AGI去的,不然这群人聚在一起干嘛?2024年2月,在准备一场分享会的PPT中,前微软全球副总裁、如今的阶跃星辰CEO姜大昕,把他看到的一句评论放进了自我介绍: 在微软混得风生水起,怎么想不开创业?
2024年,是被寄予希望的「AIGC应用元年」。从年初开始,AIGC又有了不少新动作:Sora凭借雨后东京街头视频一举成名,AI PC、AI手机陆续登场,AI程序员Devin通过面试,OpenAI大模型加持人形机器人Figure 01亮相…
物体姿态估计在许多现实世界应用中起到至关重要的作用,例如具身智能、机器人灵巧操作和增强现实等。
刚刚,Mistral AI 的模型又更新了。 这次开源一如既往地「突然」,是在一个叫做 Cerebral Valley 的黑客松活动上公布的。