大型语言模型的“涌现”能力：从乘法到解码电影

最近的研究，例如 Dyer 所从事的研究，揭示出 LLMs 可以产生数百种'紧急'能力——大型模型可以完成而小型模型无法完成的任务，其中许多似乎与文本分析无关。它们涵盖从乘法到生成可执行的计算机代码以及根据表情符号解码电影等范围。新的分析表明，在某些任务和某些模型中，存在超过阈值的复杂性，超过该阈值后，模型的功能急剧提高。（它们也暗示了一个黑暗的反面：随着复杂性的增加，一些模型揭示出其响应中的新偏见和不准确性。）