用正则表达式去除href及后面的字符串
可以使用以下正则表达式去除href及后面的字符串:
import re
# 原始字符串
text = '<a href="http://www.example.com">Example</a>'
# 去除href及后面的字符串
result = re.sub(r'<a\s+href=\".*?\">', '', text)
print(result)
输出结果为:
Example</a>
正则表达式解析:
<a\s+href=\".*?\">:匹配以<a开头,后面跟着一个或多个空格,然后是href=",接着是任意字符(非贪婪模式),最后以">结尾的字符串。re.sub(pattern, repl, string):使用空字符串替换匹配到的字符串。
原文地址: https://www.cveoy.top/t/topic/ikVM 著作权归作者所有。请勿转载和采集!