深度丨AI 原生应用的定义、生态图谱,与五维评估框架
深度丨AI 原生应用的定义、生态图谱,与五维评估框架在过去的两年里,风险投资圈,以及广泛的技术生态中,关于 AI 原生应用的发展前景展开了深入讨论。我们目睹了技术价值从底层基础设施,逐步向平台和应用层转移的趋势,看到了对 AI Agent 演进的强烈关注,以及关于各个垂直领域 AI 应用发展的众多深入研究。
在过去的两年里,风险投资圈,以及广泛的技术生态中,关于 AI 原生应用的发展前景展开了深入讨论。我们目睹了技术价值从底层基础设施,逐步向平台和应用层转移的趋势,看到了对 AI Agent 演进的强烈关注,以及关于各个垂直领域 AI 应用发展的众多深入研究。
最近,语音人工智能初创公司 ElevenLabs,在他们的 ElevenReader 应用中推出了一个叫做 GenFM 的功能,这个功能能通过我们上传的内容,快速制作一期由两名 AI 对话交流的播客。
“它前进着,又跨过了新的一级台阶,耳边仿佛传来由远及近的低语:前方,即是世界。”
Netflix宣布《鱿鱼游戏》手游限时开放,计划拓展游戏市场。
最近,英国广播公司(BBC)对美国科技巨头苹果公司提出了投诉,原因是苹果推出的一款新产品错误地生成并传播了与 BBC 相关的假新闻。这款名为 “Apple Intelligence” 的产品在英国上线后,通过人工智能技术将多个信息来源的通知进行汇总,并以此向用户推送信息。
OpenAI的实时API支持低延迟、双向音频流,使得多模态AI应用(如语音对话Agent)得以实现。它通过WebSocket连接管理对话状态,并提供短语结束检测和语音活动检测(VAD)功能,大大简化了实时语音应用的开发。
Transformer模型自2017年问世以来,已成为AI领域的核心技术,尤其在自然语言处理中占据主导地位。然而,关于其核心机制“注意力”的起源,学界存在争议,一些学者如Jürgen Schmidhuber主张自己更早提出了相关概念。
Apple MM1Team 再发新作,这次是苹果视频生成大模型,关于模型架构、训练和数据的全面报告,87 亿参数、支持多模态条件、VBench 超 PIKA,KLING,GEN-3。
谷歌放大招推出 Gemini 2.0 Flash 模型,抢跑外加狙击OpenAI,正式开启Agent时代,诚意十足,全部免费使用
继量子芯片之后,谷歌又来抢“OpenAI双12直播”的流量了! 就在刚刚,谷歌新一代大模型Gemini 2.0突然登场,再次由谷歌CEO皮猜亲自官宣。