以下是一个简单的Java程序,可以去除HTML标签:

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class HtmlTagRemover {

    public static void main(String[] args) {
        String htmlString = '<h1>Hello, World!</h1><p>This is a paragraph.</p>';

        String plainText = removeHtmlTags(htmlString);
        System.out.println(plainText);
    }

    public static String removeHtmlTags(String htmlString) {
        Pattern pattern = Pattern.compile('<.*?>');
        Matcher matcher = pattern.matcher(htmlString);
        String plainText = matcher.replaceAll('');
        return plainText;
    }
}

说明:

  • 我们使用正则表达式来匹配所有的HTML标签,并把它们替换为空字符串。
  • 我们定义了一个静态方法removeHtmlTags,它接受一个包含HTML标签的字符串,并返回一个不包含HTML标签的字符串。
  • main方法中,我们演示了如何使用这个方法。
Java去除HTML标签代码示例

原文地址: https://www.cveoy.top/t/topic/luUz 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录