一种面向可信度的基于LSTM与PPO的MCS激励方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种面向可信度的基于LSTM与PPO的MCS激励方法
申请号:CN202510137339
申请日期:2025-02-07
公开号:CN120216900A
公开日期:2025-06-27
类型:发明专利
摘要
本发明提供一种面向可信度的基于LSTM与PPO的MCS激励方法,能够将参与者的感知决策过程建模为非合作博弈,并采用马尔可夫决策过程MDP来描述其行为。在不了解全局信息的情况下,利用长短期记忆网络LSTM与近端策略优化算法PPO相结合的激励模型LSTM‑PPO,为每位参与者制定最合理且有效的感知时长策略,以最大化效用奖励。任务完成后,通过评估上传数据的质量来动态更新参与者的可信度,从而调整其下一阶段的效用奖励。在真实数据集上,我们对CIM‑LP和现有的其他激励机制进行了大量的仿真实验。结果表明,CIM‑LP机制使参与者平均效用提高了19.3%,任务完成率提高了12.8%。
技术关键词
激励方法 长短期记忆网络 决策 策略 动态更新 非合作博弈 转移概率矩阵 深度强化学习 平台 数据 估计算法 社交 机制