Python 获取字符串中汉字的十进制区位码
Python 获取字符串中汉字的十进制区位码
本代码实现的功能是:输入一个字符串,输出这个字符串所有汉字(假定仅含常用汉字)的十进制区位码。
思路:
- 将字符串转成 Unicode 编码字符串;
- 遍历 Unicode 编码字符串,判断每个字符是否是汉字;
- 如果是汉字,则计算其十进制区位码,并存入结果列表中。
代码实现如下:
s = input('请输入一个字符串:')
result = []
for c in s:
if 'u4e00' <= c <= 'u9fa5': # 判断是否是汉字
code = ord(c) # 计算十进制区位码
result.append(str(code))
print(' '.join(result))
代码说明:
- 'u4e00' 和 'u9fa5' 是 Unicode 编码中汉字的起始和结束编码。
- ord() 函数用于将字符转成其对应的十进制编码。
- 最后将结果列表转成字符串,用空格隔开输出。
示例:
输入:'你好世界' 输出:20320 22823 25105 26108 29992
注意:
本代码仅适用于常用汉字,对于一些生僻字或特殊字符可能无法识别。
原文地址: https://www.cveoy.top/t/topic/nE8g 著作权归作者所有。请勿转载和采集!