摘要
本申请提供一种港口文本数据处理方法、装置、设备及介质。在该方法中,通过根据港口数据项对应的替换字符串对第一大语言模型和第二大语言模型进行分词器和嵌入值修改处理,得到第三大语言模型和第四大语言模型。进而根据第三大语言模型和港口号码替换表,对原始港口训练数据进行数据项替换处理,得到目标港口训练数据后,对第四大语言模型进行训练,得到目标大语言模型。最后根据目标大语言模型和文本嵌入模型,对初始港口文本数据进行处理,得到目标向量。本方案通过使用训练得到的用于替换港口数据项的目标大语言模型,以及文本嵌入模型,对初始港口文本数据进行处理,得到目标向量,有效提高了目标向量与港口数据项的匹配性。