大一统视频编辑框架:浙大&微软推出UniEdit,无须训练、支持多种编辑场景
大一统视频编辑框架:浙大&微软推出UniEdit,无须训练、支持多种编辑场景随着 Sora 的爆火,人们看到了 AI 视频生成的巨大潜力,对这一领域的关注度也越来越高。
搜索
随着 Sora 的爆火,人们看到了 AI 视频生成的巨大潜力,对这一领域的关注度也越来越高。
北大团队联合兔展发起了一项Sora复现计划——Open Sora。
只靠一张物体图片,大语言模型就能控制机械臂完成各种日常物体操作吗?
996作息表爆火后,许多人一定好奇在OpenAI工作究竟是怎样的感受。最近,多位匿名员工在求职网站Glassdoor纷纷对雇主打分评价,高薪却996。最经典的评价是:潜力巨大,但成长烦恼也是真实的。
谷歌DeepMind、UC伯克利和MIT的研究人员认为,如果用大语言模型的思路来做大视频模型,能解决很多语言模型不擅长的问题,可能能更进一步接近世界模型。
近日,来自香港大学的Jihan Yang和纽约大学的谢赛宁等人发表了新的成果,将真实世界的地图、街景等各种信息融入Agent所在的虚拟世界,为智能体的未来赋予了无限可能。
随着终端侧 AI 变革席卷全球,「小而强」的端侧大模型,成为行业主流玩家的必争之地。
苹果放弃了最为野心勃勃的项目之一——造车,并考虑将2000名员工转移到人工智能部门。有接近苹果的相关人士向虎嗅透露,此前就有Vision Pro和汽车项目组的人转岗至人工智能项目。
一年多来,AI 渐渐变得普通和日常。当巨头们你追我赶扔下新的王炸,AI 也在更多不起眼的地方出现,地铁、电梯间、产品海报、软件开屏,与普通人的线上和线下擦肩而过。
机器人,成为 AI 巨头最关注的下一个方向。
3 月 1 日,「2024 首届AIGC工具展」在云栖小镇国际会展中心举行。
如果说 OpenAI 已经占据了今天闭源大模型生态的一极,那 Meta 无疑是代表开源大模型的另一极。
一项最新研究发现,人工智能在创造力方面的表现超过了人类。通过对人类和AI参与者进行创造力测量任务的比较,研究显示AI在原创性和详细程度上具有明显优势。然而,真正的创造力远远超越了创新思想的产生,它还需要实践能力来解决现实世界问题。
3月1日下午,由36C与36Kr联合举办的「GenAI超级路演」在杭州云栖小镇成功举办。
在目前的模型训练范式中,偏好数据的的获取与使用已经成为了不可或缺的一环。在训练中,偏好数据通常被用作对齐(alignment)时的训练优化目标,如基于人类或 AI 反馈的强化学习(RLHF/RLAIF)或者直接偏好优化(DPO),而在模型评估中,由于任务的复杂性且通常没有标准答案,则通常直接以人类标注者或高性能大模型(LLM-as-a-Judge)的偏好标注作为评判标准。
有人表示:「等待已久的 AI 图像创建功能终于迎来了图层!」
全新升级的第二代Ameca来了,GPT-4加持,能够实时对答。
老黄关于未来最新的想法和预测,以及他对于过去很多问题的再思考,还有他的很多日常生活小习惯,都在这篇专访里了。
马斯克一纸诉状,把OpenAI告上法庭,科技圈又炸开了锅。
Sora刚发布不久,就被逆向工程“解剖”了?!
接触Sora没几天,主动放弃了8亿美元的电影制片厂扩建计划。
黄院士在《赛博朋克2077》里搞的智能NPC,已经飙起中文了?
中国企业家对于人工智能的发展充满焦虑,担心自己的企业会被颠覆。他们思考如何将AI应用于企业发展,并担心AI是否会成为新的生产力,对生产和生活产生何种影响。
Google 最近在大模型上动作不断,先是发布了性能更强大的多模态 Gemini 1.5 Pro,然后是开源的小模型 Gemma,评测结果超过了 7b 量级的 Llama 2。
能够给个体的伤痛带来一定的慰藉和救赎,恰恰是技术进步本身最大的意义所在。
黄仁勋预测AI产业扩张,历史教训或指导未来。
AI课程是否收费引发争议,多种观点并存。
经过了2023年ChatGPT和2024年Sora对“AI改变人类未来”的铺垫后,当下中国的手机厂商正带着一大批“AI手机”扑面而来。
作为发生在 CES 后,2024 Q1 最后一场大规模、世界级展会——2月26日在西班牙巴塞罗那举办的世界移动通信大会(MWC) ,为这一年的通信行业、移动终端市场奠定了主旋律——如果用两个词来概括,应该是:AI与全连接能力。
GPT早已成为大模型时代的基础。国外一位开发者发布了一篇实践指南,仅用60行代码构建GPT。