没有训练集,我用余弦相似度进行文本相似度匹配,我不知道自己的匹配是否正确,我该如何评估匹配结果?
如果没有训练集,可以使用人工标注的样本进行评估,即手动选择一些文本对,计算其余弦相似度,然后比较计算结果和人工标注的相似度是否一致。另外,可以使用一些基准数据集进行评估,如SemEval等公开数据集。同时,可以使用交叉验证的方法,将数据集分为训练集和测试集,使用训练集训练模型,然后对测试集进行预测,计算预测结果与真实结果的准确率、精确率、召回率等指标。
原文地址: https://www.cveoy.top/t/topic/AsZ 著作权归作者所有。请勿转载和采集!