Python 获取字符串中汉字的十进制区位码

本代码实现的功能是:输入一个字符串,输出这个字符串所有汉字(假定仅含常用汉字)的十进制区位码。

思路:

  1. 将字符串转成 Unicode 编码字符串;
  2. 遍历 Unicode 编码字符串,判断每个字符是否是汉字;
  3. 如果是汉字,则计算其十进制区位码,并存入结果列表中。

代码实现如下:

s = input('请输入一个字符串:')
result = []
for c in s:
    if 'u4e00' <= c <= 'u9fa5':  # 判断是否是汉字
        code = ord(c)  # 计算十进制区位码
        result.append(str(code))
print(' '.join(result))

代码说明:

  • 'u4e00' 和 'u9fa5' 是 Unicode 编码中汉字的起始和结束编码。
  • ord() 函数用于将字符转成其对应的十进制编码。
  • 最后将结果列表转成字符串,用空格隔开输出。

示例:

输入:'你好世界' 输出:20320 22823 25105 26108 29992

注意:

本代码仅适用于常用汉字,对于一些生僻字或特殊字符可能无法识别。

Python 获取字符串中汉字的十进制区位码

原文地址: https://www.cveoy.top/t/topic/nE8g 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录