
贝索斯投资的Toloka:human-AI co-agency是什么?如何从简单的标注任务发展到专家判断和与智能体的共同执行
贝索斯投资的Toloka:human-AI co-agency是什么?如何从简单的标注任务发展到专家判断和与智能体的共同执行Toloka是一家专注于AI数据标注与模型评估的众包平台,成立于2014年,创始人Olga Megorskaya曾是俄罗斯科技巨头Yandex董事会成员。公司总部位于阿姆斯特丹,之前由AI基础设施公司Nebius Group控股。
Toloka是一家专注于AI数据标注与模型评估的众包平台,成立于2014年,创始人Olga Megorskaya曾是俄罗斯科技巨头Yandex董事会成员。公司总部位于阿姆斯特丹,之前由AI基础设施公司Nebius Group控股。
螺旋镖还是回到通用 Agent 了, 100天里,我们一起见证了创作、设计、搜索、编程、旅游、办公、播客等垂直领域 Agent 们的诞生, 也迎来了通用 Agent 一次完整的能力升级 —— MiniMax Agent
AI应用股王Palantir在6月举办的7thAIP Conference公布了最新一批Agent用例,Palantir公布Agent新用例,不止于next level|AIPCon7介绍了3家医疗客户用例,今天介绍的金融Agent,客户实践出来的企业AI落地原则非常有意义。
今年上半年,最吊足胃口和期待的,莫过于 Agent 工具,饼画得都很大:日常中那些烧脑、重复、耗时间的任务,现在似乎只需要动动手指、敲几行 prompt 就能搞定。
快到7月份了,一年一度,准时准点,让我需要在工作日顶着大太阳,穿梭在各大小区,一天爬五十几层楼梯的固定任务要刷新了:用人话说,租的房子快到期了
近年来,大型语言模型(LLM)在处理复杂任务方面取得了显著进展,尤其体现在多步推理、工具调用以及多智能体协作等高级应用中。这些能力的提升,往往依赖于模型内部一系列复杂的「思考」过程或 Agentic System 中的 Agent 间频繁信息交互。
编程智能体确实厉害!Transformer作者Llion Jones初创公司,专门收集了NP难题并测试了AI智能体,结果竟在上千人竞赛中排第 21!这意味着,它已经比绝大多数人写得好了。
GUI智能体总是出错, 甚至是不可逆的错误。 即使是像GPT-4o这样的顶级多模态大模型,也会因为缺乏常识而在执行GUI任务时犯错。在它即将执行错误决策时,需要有人提醒它出错了。
Anthropic 前两天发了一篇文章,重点讨论了他们是如何通过多智能体系统来构建 claude 的“深度研究功能”。
AI迈入经验时代,2025 年 6 月 6 日,第七届北京智源大会在北京正式开幕,强化学习奠基人、2025年图灵奖得主、加拿大计算机科学家Richard S. Sutton以“欢迎来到经验时代”为题发表主旨演讲