思路:

  1. 判断一个字符是否为汉字,可以使用 Unicode 编码,汉字的编码范围为 0x4E00 ~ 0x9FA5。

  2. 对于汉字,其区位码可以通过以下公式计算:区位码 = (高位字节-0xA0)*100 + (低位字节-0xA0)

代码实现:

string = input('请输入字符串:')
for char in string:
    if '一' <= char <= '鿿':
        code = ord(char)
        high_byte = (code >> 8) & 0xff
        low_byte = code & 0xff
        region_code = (high_byte - 0xA0) * 100 + (low_byte - 0xA0)
        print(char, region_code)

示例输入: 你好,世界!

示例输出:

你 20320 好 22909 世 19990 界 30059

Python 获取字符串中所有汉字的十进制区位码

原文地址: https://www.cveoy.top/t/topic/nE8h 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录