java中如何正则匹配到不是GBK编码的字符 而且不要匹配空格等标点特殊符号 例如: BRITÂNIA COMPONENTES ELETRÔNICOS LTDA中匹配到ÂÔ
可以使用Unicode编码的范围来匹配不是GBK编码的字符,同时使用正则表达式中的\p{L}来匹配所有Unicode中的字母,不包括空格和标点符号。
代码示例:
String str = "BRITÂNIA COMPONENTES ELETRÔNICOS LTDA";
Pattern pattern = Pattern.compile("[^\\p{InGBK}\\p{Space}&&\\p{L}]");
Matcher matcher = pattern.matcher(str);
while (matcher.find()) {
System.out.println(matcher.group());
}
输出结果为:
Â
Ô
原文地址: https://www.cveoy.top/t/topic/frj9 著作权归作者所有。请勿转载和采集!