您可以使用Python的BeautifulSoup库来解析HTML并提取超链接。下面是一个示例代码:

from bs4 import BeautifulSoup

# 假设您已经获取了一段HTML并将其存储在变量html中
html = """
<html>
<body>
    <h1>网页标题</h1>
    <ul>
        <li><a href="http://www.example.com">链接1</a></li>
        <li><a href="http://www.example.com/page2">链接2</a></li>
        <li><a href="http://www.example.com/page3">链接3</a></li>
    </ul>
</body>
</html>
"""

# 使用BeautifulSoup解析HTML
soup = BeautifulSoup(html, 'html.parser')

# 查找所有超链接
links = soup.find_all('a')

# 遍历超链接并打印
for link in links:
    href = link['href']
    text = link.text
    print(f"超链接文本:{text},超链接地址:{href}")

这段代码会输出每个超链接的文本和地址:

超链接文本:链接1,超链接地址:http://www.example.com
超链接文本:链接2,超链接地址:http://www.example.com/page2
超链接文本:链接3,超链接地址:http://www.example.com/page3

您可以根据需要进一步处理这些超链接,例如提取特定域名的链接或执行其他操作

py soup 取得一段html后 在这段html中查找超链接

原文地址: http://www.cveoy.top/t/topic/iQ8v 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录