针对N-gram算法来识别中文文本传抄过程中的错误设计一个有效而快速的算法。请描述算法的原理估计其速度并举算例。

算法原理：

根据给定的N值，将原始文本划分为长度为N的多个子串。
对于每个子串，使用某种中文分词工具将其分词，并将分词结果保存为一个列表。
对于每个列表中的词语，计算其在整个文本中出现的频率，并将其保存为一个字典。
对于每个子串中的每个词语，计算其在字典中的频率，并将其乘以该词语在子串中出现的次数，得到一个得分。
对于每个子串，将其所有词语的得分相加，得到该子串的总得分。
对于原始文本中的每个子串，计算其总得分，并将其保存为一个列表。
对于每个子串的总得分，如果其低于某个阈值，则认为该子串存在传抄错误。

估计速度：

该算法的速度取决于N值的大小，中文分词工具的性能以及字典的大小。一般来说，N值越大，算法的速度越慢，但准确率越高。中文分词工具的性能和字典的大小也会影响算法的速度和准确率。根据实际情况，可以选择适当的N值、分词工具和字典大小，以达到较好的速度和准确率。

举例：

假设原始文本为“这是一段测试文本，用来测试N-gram算法的效果。”，N值为2。将原始文本划分为长度为2的多个子串，得到以下子串列表：

“这是”、“是一”、“一段”、“段测”、“测试”、“试文”、“文本”、“用来”、“来测”、“测试”、“试N”、“N-g”、“gra”、“ram”、“算法”、“法的”、“的效”、“效果”。

使用中文分词工具将每个子串分词，并计算每个词语在整个文本中出现的频率，得到以下字典：

{ “这”: 1, “是”: 1, “一”: 1, “段”: 1, “测”: 1, “试”: 2, “文”: 1, “本”: 1, “用”: 1, “来”: 1, “N”: 1, “g”: 1, “ram”: 1, “算”: 1, “法”: 1, “的”: 1, “效”: 1, “果”: 1 }

对于每个子串中的每个词语，计算其在字典中的频率，并将其乘以该词语在子串中出现的次数，得到以下得分：

“这是”: 1 * 1 = 1 “是一”: 1 * 1 = 1 “一段”: 1 * 1 = 1 “段测”: 1 * 1 = 1 “测试”: 2 * 1 = 2 “试文”: 2 * 1 = 2 “文本”: 1 * 1 = 1 “用来”: 1 * 1 = 1 “来测”: 1 * 1 = 1 “测试”: 2 * 1 = 2 “试N”: 2 * 1 = 2 “N-g”: 1 * 1 = 1 “gra”: 1 * 1 = 1 “ram”: 1 * 1 = 1 “算法”: 1 * 1 = 1 “法的”: 1 * 1 = 1 “的效”: 1 * 1 = 1 “效果”: 1 * 1 = 1

对于每个子串，将其所有词语的得分相加，得到以下总得分：

“这是”: 1 “是一”: 1 “一段”: 1 “段测”: 1 “测试”: 4 “试文”: 2 “文本”: 1 “用来”: 1 “来测”: 1 “试N”: 2 “N-g”: 1 “gra”: 1 “ram”: 1 “算法”: 1 “法的”: 1 “的效”: 1 “效果”: 1

对于每个子串的总得分，如果其低于某个阈值，则认为该子串存在传抄错误。根据实际情况，可以选择适当的阈值，以达到较好的准确率。

针对N-gram算法来识别中文文本传抄过程中的错误设计一个有效而快速的算法。请描述算法的原理估计其速度并举算例。