命名实体的两种标注方式bio和bioes有什么区别
BIO和BIOES是命名实体识别中常用的两种标注方式,它们的区别如下:
-
BIO标注方式:将一个实体分成三个部分,即开头(Beginning)、中间(Inside)和其他(Outside)。例如,“我爱北京天安门”,使用BIO标注后为:[O, O, B-LOC, I-LOC, I-LOC, I-LOC, O],其中B-LOC表示开始位置为地名,I-LOC表示中间位置为地名,O表示其他。
-
BIOES标注方式:将一个实体分成四个部分,即开头(Beginning)、内部(Inside)、结束(End)和其他(Single)。例如,“我爱北京天安门”,使用BIOES标注后为:[S-LOC, O, B-LOC, I-LOC, E-LOC, O],其中S-LOC表示单个位置为地名,E-LOC表示结束位置为地名,其他的标注与BIO相同。
BIOES相比BIO标注方式,多了一个Single标注,表示某个实体只有一个词的情况。另外,BIOES将实体的开始和结束位置分别标注出来,更加明确,但是标注量较BIO要多。
原文地址: https://www.cveoy.top/t/topic/buHM 著作权归作者所有。请勿转载和采集!