可以使用Unicode编码的范围来匹配不是GBK编码的字符,同时使用正则表达式中的\p{L}来匹配所有Unicode中的字母,不包括空格和标点符号。

代码示例:

String str = "BRITÂNIA COMPONENTES ELETRÔNICOS LTDA";
Pattern pattern = Pattern.compile("[^\\p{InGBK}\\p{Space}&&\\p{L}]");
Matcher matcher = pattern.matcher(str);
while (matcher.find()) {
    System.out.println(matcher.group());
}

输出结果为:

Â
Ô
java中如何正则匹配到不是GBK编码的字符 而且不要匹配空格等标点特殊符号 例如: BRITÂNIA COMPONENTES ELETRÔNICOS LTDA中匹配到ÂÔ

原文地址: https://www.cveoy.top/t/topic/frj9 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录