java使用jsoup递归获取html中的iframe
使用Jsoup递归获取HTML中的iframe可以通过以下步骤实现:
- 导入Jsoup库:
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
- 使用Jsoup解析HTML文档:
String html = "<html>...</html>"; // 替换为你要解析的HTML文档
Document doc = Jsoup.parse(html);
- 编写递归方法来获取所有的iframe元素:
public void getAllIframes(Document doc) {
Elements iframes = doc.select("iframe");
for (Element iframe : iframes) {
String src = iframe.attr("src");
System.out.println("Found iframe: " + src);
// 如果iframe中有子页面,继续递归获取子页面中的iframe
if (!src.isEmpty()) {
Document childDoc = Jsoup.connect(src).get();
getAllIframes(childDoc);
}
}
}
- 调用递归方法来获取所有的iframe元素:
getAllIframes(doc);
这样就可以递归获取HTML中的所有iframe元素了。
原文地址: https://www.cveoy.top/t/topic/i5V5 著作权归作者所有。请勿转载和采集!