下面是一个python实现Levenshtein算法从excel表里面读取与关键字相似的名称的示例代码:

import pandas as pd
import numpy as np
import Levenshtein

# 读取Excel表格数据
df = pd.read_excel('data.xlsx')

# 关键字
keyword = 'apple'

# 计算所有名称与关键字之间的编辑距离
distances = np.array([Levenshtein.distance(keyword.lower(), name.lower()) for name in df['名称']])

# 找到所有编辑距离小于等于2的名称
similar_names = df[distances <= 2]['名称'].tolist()

print(similar_names)

在这个示例代码中,我们首先使用pandas库读取Excel表格数据。然后,我们定义一个关键字“apple”,并使用Levenshtein算法计算所有名称与该关键字之间的编辑距离。接着,我们筛选出所有编辑距离小于等于2的名称,并打印它们的列表。

注意,我们在计算编辑距离之前将所有名称和关键字都转换为小写字母,以便比较时不受大小写的影响。

python实现Levenshtein算法从excel表里面读取与关键字相似的名称

原文地址: https://www.cveoy.top/t/topic/bKQ3 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录