一种基于视觉指令微调与演示学习增强的多模态讽刺检测方法

申请号：CN202410755737

申请日期：2024-06-12

公开号：CN118468224A

公开日期：2024-08-09

类型：发明专利

摘要

本发明提出了一种基于视觉指令微调与演示学习增强的多模态讽刺检测方法。该方法将传统的讽刺检测任务重新定义为生成任务，利用生成式多模态大语言模型的强大跨模态交互能力。通过设计指令模板和检索模块，模型能够更好地理解任务目标，并从训练集中检索与输入样本相似的示例作为提示信息，从而提高检测性能。此外，提出了新的测试数据集RedEval，用于评估模型在不同场景下的泛化能力。该方法提高了多模态讽刺检测的准确性和泛化能力，推动了多模态理解和处理技术在复杂情感分析领域的应用。

技术关键词

大语言模型文本编码器图像编码器样本视觉特征社交媒体平台多模态标签指令格式化多层感知器微调方法图像嵌入图像组合传播算法参数数据

系统为您推荐了相关专利信息

一种检测血清代谢物组的试剂在制备鼻咽癌诊断和/或预后产品中的应用

鼻咽癌诊断血清鼻咽癌患者预后评估试剂盒诊断试剂盒

一种用于SPD医疗柜的多模态身份识别系统

身份识别系统身份验证模块近场通信设备权限管理模块近场通信单元

一种容器管理平台中数据库性能监控及预测的系统和方法

容器管理平台性能监控长短期记忆模型数据存储模块性能指标数据

小麦不完善粒识别方法与小麦不完善粒识别装置

深度学习网络模型小麦不完善粒识别方法识别装置图像进料装置

一种基于大语言模型的自动驾驶危险场景检测方法

危险场景大语言模型自动驾驶系统多传感器数据融合自然语言