
对话姬朋飞:从大厂辞职到 Chat2DB 的诞生
对话姬朋飞:从大厂辞职到 Chat2DB 的诞生今天是姬朋飞创业一周年的日子,我们找到姬朋飞做了一次专访,回顾他创业这跌宕起伏的一年。
今天是姬朋飞创业一周年的日子,我们找到姬朋飞做了一次专访,回顾他创业这跌宕起伏的一年。
数据中心设计转向高功率密度应对AI需求增长。
OpenAI正与甲骨文洽谈,计划联手构建一个全球最顶尖的AI数据中心。
准确的统计数据、时效性强的信息,一直是大语言模型产生幻觉的重灾区。谷歌在近日推出了自己筹划已久的大型数据库Data Commons,以及在此基础上诞生的大模型DataGemma。
三年走来,每一步都「作数」。 懂场景者得 AI
国内行业大模型的“江湖风云”,如今已悄然从纯算法网络PK转向了“实战派”较量。这不再是单一的技术炫技场,而是看谁能在现实世界中大展拳脚,舞出最炫的“应用落地”舞步,从真正意义上实现提效,创造出实实在在的社会价值。
企业要用好 LLM 离不开高质量数据。和传统机器学习模型相比,LLM 对于数据需求量更大、要求更高,尤其是非结构化数据。而传统 ETL 工具并不擅长非结构化数据的处理,因此,企业在部署 LLM 的过程中,数据科学家们往往要耗费大量的时间精力在数据处理环节。这一环节既关系到 LLM 部署的效率和质量,也对数据科学家人力的 ROI 产生影响。
说好的AI给人类打工呢? 为了拿到新数据、训练AI大模型,字节等互联网大厂正在亲自下场,以单次300元不等的价格招募“AI录音员”,定制语料库。
近年来,Transformer等预训练大模型在语言理解及生成等领域表现出色,大模型背后的Scaling Law(规模定律)进一步揭示了模型性能与数据量、算力之间的关系,强化了数据在提升AI表现中的关键作用。
土地和电力资源成为AI行业的“香饽饽”,而工业用地正好能满足AI数据中心建设的部分“刚需”。