摘要
本发明涉及人工智能技术领域,公开了网页信息的采集方法、装置、设备、介质及程序产品。该方法包括:获取目标网页的统一资源定位符,并根据统一资源定位符,获取目标网页对应的网页内容数据;根据网页内容数据,获取多个初始网页主题词,并计算得到各初始网页主题词与各已存情感词之间的初始相似度;根据各初始网页主题词与各已存情感词之间的初始相似度,以及各预设情感词库对应的权重值,获取各初始网页主题词与各已存情感词之间的目标相似度;根据各初始网页主题词与各已存情感词之间的目标相似度,获取目标网页主题词。本实施例的方案,可以实现对获取网页内容数据的自动筛选,可以提升网页信息采集的效率和精准度,可以提升用户体验。