Java去除HTML标签代码示例
以下是一个简单的Java程序,可以去除HTML标签:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class HtmlTagRemover {
public static void main(String[] args) {
String htmlString = '<h1>Hello, World!</h1><p>This is a paragraph.</p>';
String plainText = removeHtmlTags(htmlString);
System.out.println(plainText);
}
public static String removeHtmlTags(String htmlString) {
Pattern pattern = Pattern.compile('<.*?>');
Matcher matcher = pattern.matcher(htmlString);
String plainText = matcher.replaceAll('');
return plainText;
}
}
说明:
- 我们使用正则表达式来匹配所有的HTML标签,并把它们替换为空字符串。
- 我们定义了一个静态方法
removeHtmlTags,它接受一个包含HTML标签的字符串,并返回一个不包含HTML标签的字符串。 - 在
main方法中,我们演示了如何使用这个方法。
原文地址: https://www.cveoy.top/t/topic/luUz 著作权归作者所有。请勿转载和采集!