字节整新活!照片+音频让蒙娜丽莎秒变播客主理人
字节整新活!照片+音频让蒙娜丽莎秒变播客主理人在大语言模型和 AIGC 的热潮下,科研人员对构建「视觉对话智能体」(Visual Chat Agent)展现出极大兴趣。其中,可实时交互的人像生成技术(Audio-Driven Real-Time Interactive Head Generation)是实现链路中极为关键的一环。
在大语言模型和 AIGC 的热潮下,科研人员对构建「视觉对话智能体」(Visual Chat Agent)展现出极大兴趣。其中,可实时交互的人像生成技术(Audio-Driven Real-Time Interactive Head Generation)是实现链路中极为关键的一环。
最近,硅谷最有影响力且以“独家”、“深度”著称的科技媒体之一The Information发布了2024「全球50家最具潜力初创公司榜」。
“我在AI领域做了七年的产品经理,现在是一名创业者,一年多中上线了2款自己的AI Native应用,最近分享一些个人观察和思考:我觉得,这波AI浪潮最重要的特征,是让高度个性化的服务实现规模化成为可能。
按照计划,细红线将在蛇年春节前后发布首款新品,据了解,这个新品的主菜是软件方案,并附带了一款AI native硬件,“理念非常超前”,一位内部员工如是认为。不过内部对于这款产品的销量暂不抱期待,“新事物往往没有可参照对象”。
The Information消息,初代GPT论文第一作者Alec Radford也要离开OpenAI,转向独立研究。据了解, Alec于2016年加入OpenAI,从初代GPT到GPT-4o的论文中全都有他的名字,其中前两代还是第一作者。
LLM 强大的语言能力,使其被广泛部署于 LLM 应用系统(LLM-integrated applications)中。此时,LLM 需要访问外部数据(如文件,网页,API 返回值)来完成任务。
BLT 在许多基准测试中超越了基于 token 的架构。
近日,谷歌DeepMind的研究人员推出了苏格拉底式学习,在没有外部数据的情况下,让AI通过语言游戏不断变强。
大模型“套壳”事件防不胜防,有没有方法可以检测套壳行为呢? 来自上海AI实验室、中科院、人大和上交大的学者们,提出了一种大模型的“指纹识别”方法——REEF(Representation Encoding Fingerprints)。
OpenAI 连续 12 天 “Shipmas”发布活动终于要发布让大家期待已久的视频生成模型 Sora,这再一次激起人们对图片生成、视频生成的关注。而AI Creativity 一直是我们非常关注的 GenAI 落地方向,图像生成和视频生成模型快速迭代,离商业可用越来越近。