使用 Python 的 NLTK 库中的 'sent_tokenize' 函数可以将文本分成句子,再使用 'len' 函数求出每个句子的长度。

示例代码:

import nltk

# 读取文本
with open('text.txt', 'r') as f:
    text = f.read()

# 将文本分成句子
sentences = nltk.sent_tokenize(text)

# 求每个句子的长度
lengths = [len(sentence) for sentence in sentences]

# 输出结果
print(lengths)

其中,'text.txt' 为需要读取的文本文件路径。输出结果为一个列表,每个元素为一个句子的长度。

Python 英文文本句子长度计算方法

原文地址: http://www.cveoy.top/t/topic/oK3q 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录