AI资讯新闻榜单内容搜索-Gen

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Gen
Browser-Use + LightRAG Agent:可使用 LLM 抓取 99% 的网站

Browser-Use + LightRAG Agent:可使用 LLM 抓取 99% 的网站

Browser-Use + LightRAG Agent:可使用 LLM 抓取 99% 的网站

在这个故事中,我将提供一个快速教程,展示如何使用浏览器使用、LightRAG和本地LLM创建一个强大的聊天机器人,以开发一个能够抓取您选择的任何网站的AI代理。此外,您可以询问有关您的数据的问题,这将为您提供该问题的回答。

来自主题: AI资讯
8518 点击    2024-12-29 11:10
首篇「角色扮演AI」综述!复旦等提出大模型三层人格分类框架:群体、角色、个性化 | TMLR

首篇「角色扮演AI」综述!复旦等提出大模型三层人格分类框架:群体、角色、个性化 | TMLR

首篇「角色扮演AI」综述!复旦等提出大模型三层人格分类框架:群体、角色、个性化 | TMLR

数字生命一直是人类几十年来的追求,反映了我们对技术与人类体验交汇的深层探索。近期,复旦大学发表了一篇综述论文,首次系统梳理了角色扮演AI(Role-Playing Language Agents,RPLAs)的研究现状,现已被机器学习顶级期刊TMLR接收。

来自主题: AI技术研报
9554 点击    2024-12-28 11:43
拨开 12 天发布云雾,一窥 OpenAI 的真实进度

拨开 12 天发布云雾,一窥 OpenAI 的真实进度

拨开 12 天发布云雾,一窥 OpenAI 的真实进度

OpenAI 前段时间做了 12 天的持续发布,赛博禅心进行了全程追踪:《o3详解,与 12 天发布汇总》

来自主题: AI资讯
7517 点击    2024-12-27 16:08
微软开源视频Tokenizer新SOTA!显著优于Cosmos Tokenizer和Open-Sora

微软开源视频Tokenizer新SOTA!显著优于Cosmos Tokenizer和Open-Sora

微软开源视频Tokenizer新SOTA!显著优于Cosmos Tokenizer和Open-Sora

Sora、Genie等模型会都用到的Tokenizer,微软下手了—— 开源了一套全能的Video Tokenizer,名为VidTok。

来自主题: AI技术研报
7897 点击    2024-12-26 15:43
2025 AI Agent剑指何方?两份前沿报告描绘全景地图

2025 AI Agent剑指何方?两份前沿报告描绘全景地图

2025 AI Agent剑指何方?两份前沿报告描绘全景地图

2024年,AI Agent称得上最火热的概念。一方面,大模型赛道降温,并呈现出赢家通吃的局面;另一方面,AI Agent则是大模型应用落地的最佳形式,其能够解决LLMs在具体应用场景中的局限性。

来自主题: AI技术研报
8269 点击    2024-12-26 09:15
终于等来能塞进手机的文生图模型!十分之一体量,SnapGen实现百分百的效果

终于等来能塞进手机的文生图模型!十分之一体量,SnapGen实现百分百的效果

终于等来能塞进手机的文生图模型!十分之一体量,SnapGen实现百分百的效果

近些年来,以 Stable Diffusion 为代表的扩散模型为文生图(T2I)任务树立了新的标准,PixArt,LUMINA,Hunyuan-DiT 以及 Sana 等工作进一步提高了图像生成的质量和效率。然而,目前的这些文生图(T2I)扩散模型受限于模型尺寸和运行时间,仍然很难直接部署到移动设备上。

来自主题: AI技术研报
7885 点击    2024-12-25 14:02
突破数据瓶颈!交大研发电脑智能体,让 AI 替你熬夜做 PPT

突破数据瓶颈!交大研发电脑智能体,让 AI 替你熬夜做 PPT

突破数据瓶颈!交大研发电脑智能体,让 AI 替你熬夜做 PPT

想象这样一个场景:深夜 11 点,你已经忙碌了一天,正准备休息,却想起明天早上还得分享一篇经典论文《Attention Is All You Need》,需要准备幻灯片。这时,你突然想到了自己的 AI 助手 —— PC Agent。

来自主题: AI技术研报
9976 点击    2024-12-25 11:04
字节整新活!照片+音频让蒙娜丽莎秒变播客主理人

字节整新活!照片+音频让蒙娜丽莎秒变播客主理人

字节整新活!照片+音频让蒙娜丽莎秒变播客主理人

在大语言模型和 AIGC 的热潮下,科研人员对构建「视觉对话智能体」(Visual Chat Agent)展现出极大兴趣。其中,可实时交互的人像生成技术(Audio-Driven Real-Time Interactive Head Generation)是实现链路中极为关键的一环。

来自主题: AI资讯
8391 点击    2024-12-24 15:44
智能体互联网(Agentic Web)有什么不同之处

智能体互联网(Agentic Web)有什么不同之处

智能体互联网(Agentic Web)有什么不同之处

智能体基本上已经成为AI行业的共识,如果说有分歧,大概率也是对落地的时间有分歧。

来自主题: AI资讯
7136 点击    2024-12-24 10:12