可以使用Unicode范围来匹配非GBK编码的字符,同时使用正则表达式中的字符类来排除空格和标点特殊符号。具体实现代码如下:

String str = "BRITÂNIA COMPONENTES ELETRÔNICOS LTDA";
Pattern pattern = Pattern.compile("[^\\p{InGBK}\\p{P}\\p{Z}]+");
Matcher matcher = pattern.matcher(str);
while (matcher.find()) {
    System.out.println(matcher.group());
}

其中,[^\\p{InGBK}\\p{P}\\p{Z}]+表示匹配一个或多个不属于GBK编码、标点符号(Punctuation)和空格(Separator)类别的字符。使用matcher.find()方法来不断寻找符合条件的字符串,使用matcher.group()方法获取匹配到的字符串。在这个例子中会输出ÂÔ

java中如何正则匹配到不是GBK编码的字符 而且不要匹配空格等标点特殊符号如下:BRITÂNIA COMPONENTES ELETRÔNICOS LTDA中匹配到ÂÔ

原文地址: https://www.cveoy.top/t/topic/frjx 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录