
叶子豪、陈天奇等人开源项目FlashInfer入选,MLSys2025最佳论文奖公布
叶子豪、陈天奇等人开源项目FlashInfer入选,MLSys2025最佳论文奖公布今年的两篇最佳论文一作均为华人。
来自主题: AI技术研报
8159 点击 2025-05-14 14:40
今年的两篇最佳论文一作均为华人。
新年第一天,陈天奇团队的FlashInfer论文出炉!块稀疏、可组合、可定制、负载均衡......更快的LLM推理技术细节全公开。
不管是编写和调试代码,还是通过函数调用来使用外部工具,又或是控制机器人,都免不了需要 LLM 生成结构化数据,也就是遵循某个特定格式(如 JSON、SQL 等)的数据。 但使用上下文无关语法(CFG)来进行约束解码的方法并不高效。针对这个困难,陈天奇团队提出了一种新的解决方案:XGrammar。