一种基于视觉指令微调与演示学习增强的多模态讽刺检测方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于视觉指令微调与演示学习增强的多模态讽刺检测方法
申请号:CN202410755737
申请日期:2024-06-12
公开号:CN118468224A
公开日期:2024-08-09
类型:发明专利
摘要
本发明提出了一种基于视觉指令微调与演示学习增强的多模态讽刺检测方法。该方法将传统的讽刺检测任务重新定义为生成任务,利用生成式多模态大语言模型的强大跨模态交互能力。通过设计指令模板和检索模块,模型能够更好地理解任务目标,并从训练集中检索与输入样本相似的示例作为提示信息,从而提高检测性能。此外,提出了新的测试数据集RedEval,用于评估模型在不同场景下的泛化能力。该方法提高了多模态讽刺检测的准确性和泛化能力,推动了多模态理解和处理技术在复杂情感分析领域的应用。
技术关键词
大语言模型 文本编码器 图像编码器 样本 视觉特征 社交媒体平台 多模态 标签 指令 格式化 多层感知器 微调方法 图像嵌入 图像组合 传播算法 参数 数据
系统为您推荐了相关专利信息
鼻咽癌诊断 血清 鼻咽癌患者 预后评估试剂盒 诊断试剂盒
身份识别系统 身份验证模块 近场通信设备 权限管理模块 近场通信单元
容器管理平台 性能监控 长短期记忆模型 数据存储模块 性能指标数据
深度学习网络模型 小麦不完善粒识别方法 识别装置 图像 进料装置
危险场景 大语言模型 自动驾驶系统 多传感器数据融合 自然语言