摘要
本发明提供一种基于强化学习的高速通信芯片宏放置方法,包括从网表中提取静态特征和动态特征;将静态特征和动态特征融合后,输入至基于强化学习架构的共享图神经网络中;策略网络根据当前环境状态输出动作概率分布,选择合法且概率值最大的动作执行;价值网络输出当前环境状态的累积价值估计;执行动作后获取即时奖励和下一个状态信息,根据获取到的信息更新策略网络和价值网络;构建基于宏放置约束的多目标优化函数。本发明通过强化学习与约束建模的深度融合,提高宏单元放置的自动化水平和设计质量,从而满足高速通信芯片对低功耗、高性能和紧凑面积的需求。