BertForMaskedLM 初始化错误:预期与非预期情况
- 如果你从另一个任务或具有不同架构的模型的checkpoint初始化 BertForMaskedLM,那么这是预期的(例如,从 BertForPreTraining 模型初始化 BertForSequenceClassification 模型)。
- 如果你从一个你期望完全相同的模型的checkpoint初始化 BertForMaskedLM,那么这是不预期的(例如,从 BertForSequenceClassification 模型初始化 BertForSequenceClassification 模型)。
原文地址: https://www.cveoy.top/t/topic/pfpe 著作权归作者所有。请勿转载和采集!