突破86%,解耦LLM的记忆与推理,首个超越GPT-4o的推理框架(含prompt) | 最新
突破86%,解耦LLM的记忆与推理,首个超越GPT-4o的推理框架(含prompt) | 最新这是一个不容小觑的最新推理框架,它解耦了LLM的记忆与推理,用此框架Fine-tuned过的LLaMa-3.1-8B在TruthfulQA数据集上首次超越了GPT-4o。
搜索
这是一个不容小觑的最新推理框架,它解耦了LLM的记忆与推理,用此框架Fine-tuned过的LLaMa-3.1-8B在TruthfulQA数据集上首次超越了GPT-4o。
上月,一家名叫Kick的硅谷AI记账自动化公司宣布完成900万美元种子轮融资。尽管AI/FinTech领域一直是热门吸金板块,但Kick因其特殊的融资背景格外引人注目,因为它是OpenAI Startup Fund最早期的投资组合之一。
近日,美国AI独角兽Afiniti向法院申请破产保护,成为最新一家走向破产的“老牌AI初创公司”。
MME-Finance 是一个专为金融领域设计的多模态基准测试,由同花顺财经旗下的 HiThink 研究团队联合多家高校共同开发,旨在评估和提升多模态大型语言模型(MLLMs)在金融领域的专业理解和推理能力。
在金融市场中,动态知识图谱(Dynamic Knowledge Graphs,DKGs)是一种表达对象之间随时间变化的多种关系的流行结构。它们可以有效地表示从复杂的非结构化数据源(如文本或图像)中提取的信息。在金融应用中,基于从金融新闻文章中获取的信息,DKGs 可用于检测战略性主题投资的趋势。
Open-Sora-Plan迎来又一次升级。新的Open-Sora-Plan v1.3.0版本引入了五个新特性:性能更强、成本更低的WFVAE;Prompt refiner;高质量数据清洗策略;全新稀疏注意力的DiT,以及动态分辨率、动态时长的支持。
在当前内卷严重的实时目标检测 (Real-time Object Detection) 领域,性能与效率始终是难以平衡的核心问题。绝大多数现有的 SOTA 方法仅依赖于更先进的模块替换或训练策略,导致性能逐渐趋于饱和。
4199元起,OPPO全新AI旗舰机Find X8系列30号正式开售!
据 Financial Times 消息,MiniMax 向投资者表示它在今年的净收入将达到 7000 万美元。公开信息显示,MiniMax 迄今已经完成了 4 轮融资,投资者包括阿里、腾讯、红杉中国、高瓴创投、IDG 资本等,其估值超过 25 亿美元(约合 177 亿元人民币)。
Transformer 的强大实力已经在诸多大型语言模型(LLM)上得到了证明,但该架构远非完美,也有很多研究者致力于改进这一架构,比如机器之心曾报道过的 Reformer 和 Infini-Transformer。