Python 获取字符串中所有汉字的十进制区位码
思路:
-
判断一个字符是否为汉字,可以使用 Unicode 编码,汉字的编码范围为 0x4E00 ~ 0x9FA5。
-
对于汉字,其区位码可以通过以下公式计算:区位码 = (高位字节-0xA0)*100 + (低位字节-0xA0)
代码实现:
string = input('请输入字符串:')
for char in string:
if '一' <= char <= '鿿':
code = ord(char)
high_byte = (code >> 8) & 0xff
low_byte = code & 0xff
region_code = (high_byte - 0xA0) * 100 + (low_byte - 0xA0)
print(char, region_code)
示例输入: 你好,世界!
示例输出:
你 20320 好 22909 世 19990 界 30059
原文地址: https://www.cveoy.top/t/topic/nE8h 著作权归作者所有。请勿转载和采集!