使用jsoup获取HTML文本并保留换行符
在jsoup中,获取html文本并保留换行符可以通过调用'text()'方法,并在输出前添加换行符' '实现。例如:
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
public class Example {
public static void main(String[] args) {
String html = '<html><body><p>这是第一行。</p><p>这是第二行。</p></body></html>';
Document doc = Jsoup.parse(html);
String text = doc.text().replaceAll('(?i)<br[^>]*>', '
');
System.out.println(text);
}
}
这个例子中,我们首先使用'Jsoup.parse()'方法将html解析为一个'Document'对象。然后,我们调用'text()'方法获取文本,并使用'replaceAll()'方法将所有的'
'标签替换为换行符。最后,我们输出处理后的文本。
原文地址: https://www.cveoy.top/t/topic/nenZ 著作权归作者所有。请勿转载和采集!