摘要
本发明涉及基于深度强化学习的两阶段工作流调度方法和系统,属于深度强化学习技术领域。包括:1)根据用户提供的工作流和数据传输信息,构建工作流池,并初始化每个工作流的状态和任务数量;2)利用TD2QN算法循环遍历每个工作流,并将入口任务加入到就绪队列中;将进入到就绪任务队列中的任务,利用TD2QN算法进行动态地选择,并为任务分配适当的计算资源,从而最大化整个工作流的效率和性能;3)当工作流成功完成时,生成并返回有关已完成工作流的详细信息,为用户提供全面的调度结果和性能评估。本发明综合考虑成本和通信时间,提高了系统效率和性能。