AI资讯新闻榜单内容搜索-GE

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GE
北大校友造通用AI Agent,可执行1000个操作,无邀请码立即上手试用

北大校友造通用AI Agent,可执行1000个操作,无邀请码立即上手试用

北大校友造通用AI Agent,可执行1000个操作,无邀请码立即上手试用

北大校友官宣推出号称“最强通用Agent” Fairies(中译仙女),能执行Deep research、代码生成、发邮件等1000个操作。关键是无需邀请码,Mac和Windows用户只需下载APP就能立即上手试玩。(⊙ˍ⊙)

来自主题: AI资讯
8808 点击    2025-06-01 22:10
Anthropic 官方:Genspark 是如何构建 Agents 的?

Anthropic 官方:Genspark 是如何构建 Agents 的?

Anthropic 官方:Genspark 是如何构建 Agents 的?

Genspark 借助 Claude 打造自适应的 AI Agents,改变了人们研究和创建内容的新姿势,为复杂的工作流提供了极大的效率和规模。Genspark 借助 Claude 打造自适应的 AI Agents,改变了人们研究和创建内容的新姿势,为复杂的工作流提供了极大的效率和规模。

来自主题: AI资讯
7755 点击    2025-06-01 10:49
速递|a16z计划以53亿美金估值投资一款AI笔记软件

速递|a16z计划以53亿美金估值投资一款AI笔记软件

速递|a16z计划以53亿美金估值投资一款AI笔记软件

据 BloomBerg 报道,Abridge AI Inc. 是一家利用人工智能转录医疗对话的AI笔记初创公司,目前正在进行一轮由 Andreessen Horowitz 领投的 3 亿美元新融资。

来自主题: AI资讯
7248 点击    2025-05-31 16:56
Perplexity将Agent接入搜索,一个框解决你所有需求,实现了百度16年前的框计算概念?

Perplexity将Agent接入搜索,一个框解决你所有需求,实现了百度16年前的框计算概念?

Perplexity将Agent接入搜索,一个框解决你所有需求,实现了百度16年前的框计算概念?

人工智能搜索引擎Perplexity重磅发布新产品Perplexity Labs,这是一款面向专业版用户(20美金/月)的智能Agent工具,为用户提供了更强大的生产力解决方案。用户可以在搜索框下方一键切换至"实验室模式",通过该模式可高效生成:专业分析报告、结构化电子表格、交互式网页应用、数据可视化图表等。

来自主题: AI资讯
7605 点击    2025-05-31 16:05
10个小模型并联跑赢GPT-4.1!无额外训练,方法仅4步

10个小模型并联跑赢GPT-4.1!无额外训练,方法仅4步

10个小模型并联跑赢GPT-4.1!无额外训练,方法仅4步

近年来,语言模型技术迅速发展,然而代表性成果如Gemini 2.5Pro和GPT-4.1,逐渐被谷歌、OpenAI等科技巨头所垄断。

来自主题: AI技术研报
6837 点击    2025-05-31 15:35
GPT-4o-Image仅完成28.9%任务!上海AI实验室等发布图像编辑新基准,360道人类专家严选难题

GPT-4o-Image仅完成28.9%任务!上海AI实验室等发布图像编辑新基准,360道人类专家严选难题

GPT-4o-Image仅完成28.9%任务!上海AI实验室等发布图像编辑新基准,360道人类专家严选难题

GPT-4o-Image也只能完成28.9%的任务,图像编辑评测新基准来了!360个全部由人类专家仔细思考并校对的高质量测试案例,暴露多模态模型在结合推理能力进行图像编辑时的短板。

来自主题: AI技术研报
8641 点击    2025-05-31 14:37
专治AI生图「人脸崩坏」,8倍速碾压GPT!新版FLUX.1多方位刷新SOTA

专治AI生图「人脸崩坏」,8倍速碾压GPT!新版FLUX.1多方位刷新SOTA

专治AI生图「人脸崩坏」,8倍速碾压GPT!新版FLUX.1多方位刷新SOTA

FLUX.1 Kontext是一款融合即时文本图像编辑与文本到图像生成的新一代模型,支持文本与图像提示,角色一致性强,速度快达GPT-Image-1的8倍。

来自主题: AI资讯
6665 点击    2025-05-31 14:26
字节开源了一个了不得的模型!

字节开源了一个了不得的模型!

字节开源了一个了不得的模型!

字节跳动开源了一个口碑还不错的模型——BAGEL (ByteDance Agnostic Generation and Empathetic Language model), 一个统一多模态基础模型。啥叫“统一”?一个模型就能同时理解和生成文本、图像、视频!

来自主题: AI资讯
5918 点击    2025-05-31 13:45
全面评估多模态模型视频OCR能力,Gemini 准确率仅73.7%

全面评估多模态模型视频OCR能力,Gemini 准确率仅73.7%

全面评估多模态模型视频OCR能力,Gemini 准确率仅73.7%

多模态大模型(MLLM)在静态图像上已经展现出卓越的 OCR 能力,能准确识别和理解图像中的文字内容。MME-VideoOCR 致力于系统评估并推动MLLM在视频OCR中的感知、理解和推理能力。

来自主题: AI技术研报
6579 点击    2025-05-30 17:30