ControlNet作者搞起大模型:让天下没有难写的生图提示词,一句话变构图小作文
ControlNet作者搞起大模型:让天下没有难写的生图提示词,一句话变构图小作文ControlNet作者新项目,居然也搞起大模型和Agent了。
ControlNet作者新项目,居然也搞起大模型和Agent了。
3D生成也有自个儿的人工评测竞技场了~ 来自复旦大学和上海AI lab的研究人员搞了个3DGen-Arena,和大语言模型的Chatbot-Arena、GenAI-Arena等一脉相承,要让大伙儿对3D生成模型来一场公开、匿名的评测
AI 智能体的宣传很好,现实不太妙。
如封面展示,就在昨天,特工宇宙作为合作伙伴,参与了扣子动手实验室的杭州站活动。
鹅厂搞了个150多人的“翻译公司”,从老板到员工都是AI智能体! 主营业务是翻译网络小说,质量极高,参与评价的读者认为比真人翻译得还要好。 而且相比于雇佣真人,用它来翻译文学作品,成本降低了近80倍。
越来越多的生成AI公司考虑加入出售的行列
在多标签图像识别领域中,由于图像本身和潜在标签类别的复杂性,收集满足现有模型训练的多标签标注信息往往成本高昂且难以拓展。中山大学联合广东工业大学联手探索标注受限情况下的多标签图像识别任务,通过对多标签图像中的强语义相关性的探索研究,提出了一种异构语义转移(Heterogeneous Semantic Transfer, HST) 框架,实现了有效的未知标签生成。
半个月前,粗心的我细心地发现,有一本关于 Agent 的书籍竟然在上市预售,作者还是熟悉的咖哥(黄佳老师,当年拜读过他的《零基础学机器学习》)果断下单。 而在昨天,我终于收到了!立刻花了半个小时品读起来~觉得还是非常不错的,所以忍不住给大家分享推荐一下!
AI Agent的应用趋势,从近期国内外几个科技巨头的动作上可见一斑。
近年来,「scaling」是计算机视觉研究的主角之一。随着模型尺寸和训练数据规模的增大、学习算法的进步以及正则化和数据增强等技术的广泛应用,通过大规模训练得到的视觉基础网络(如 ImageNet1K/22K 上训得的 Vision Transformer、MAE、DINOv2 等)已在视觉识别、目标检测、语义分割等诸多重要视觉任务上取得了令人惊艳的性能。