Python UTF-8 网页乱码解决方法:如何正确解码中文
当你在Python中从网页上获取到UTF-8编码的内容后,你需要正确地解码它才能得到正确的中文字符。你可以使用decode方法解码字符串。
例如,假设你已经获取到了UTF-8编码的网页内容,并将其存储在变量content中:
content = content.decode('utf-8')
print(content)
这样,你就可以正确地输出中文字符了。
另外,如果你在处理网页时遇到了编码问题,你还可以检查网页的Content-Type头部信息,以确保你正确地处理了编码。例如,如果网页的Content-Type是text/html; charset=utf-8,那么你可以使用以下代码来解码网页内容:
import requests
response = requests.get(url)
content_type = response.headers.get('Content-Type')
if 'charset=utf-8' in content_type.lower():
content = response.content.decode('utf-8')
else:
content = response.text
这样,你就可以正确地处理不同编码的网页了。
原文地址: https://www.cveoy.top/t/topic/kqiB 著作权归作者所有。请勿转载和采集!