$q$ 模型输出的预测概率分布是一个向量,表示每个类别的概率。具体地,如果有 $k$ 个类别,则该向量的长度为 $k$。假设第 $i$ 个类别的概率为 $p_i$,则预测概率分布可以表示为 $(p_1, p_2, \dots, p_k)$,并且满足以下条件:

  • $p_i \geq 0$,对于所有的 $i$。
  • $\sum_{i=1}^k p_i = 1$,即所有概率之和为 $1$。

$q$ 模型的目标是学习一个预测概率分布,使得该分布能够最好地解释训练数据,并能够泛化到未见过的数据上。在训练过程中,我们通常使用交叉熵损失函数来衡量预测概率分布与真实标签之间的差距。

$q$ 模型输出的预测概率分布

原文地址: https://www.cveoy.top/t/topic/39T 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录