用 Python 爬取高音质音乐：详细指南和代码示例

以下是一个用 Python 实现的音乐爬取程序，可以实现下载指定歌曲的高质量音频。具体实现过程如下：

导入必要的库

import requests
from bs4 import BeautifulSoup

定义获取歌曲信息的函数

def get_song_info(keywords):
    url = 'http://www.xiami.com/search?key={}'.format(keywords)
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'}
    response = requests.get(url, headers=headers)
    soup = BeautifulSoup(response.text, 'html.parser')
    song_list = soup.find_all('div', {'class': 'search_song_list'})[0]
    songs = song_list.find_all('div', {'class': 'songblock'})
    song_info_list = []
    for song in songs:
        song_info = {}
        song_info['song_id'] = song['data-songid']
        song_info['song_name'] = song.find_all('a')[0].text
        song_info['song_artist'] = song.find_all('a')[1].text
        song_info_list.append(song_info)
    return song_info_list

该函数接受一个关键词作为参数，返回一个包含歌曲信息的列表。在函数内部，我们首先构造了一个搜索 url，然后发送 GET 请求获取搜索结果的页面。接着，我们使用 BeautifulSoup 库解析页面内容，提取出包含歌曲信息的 div 元素，然后遍历这些元素，依次提取出歌曲的 ID、名称和艺术家信息，存入一个字典中，并将这些字典存入一个列表中返回。

定义获取歌曲的下载链接的函数

def get_song_url(song_id):
    url = 'http://www.xiami.com/song/{}'.format(song_id)
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'}
    response = requests.get(url, headers=headers)
    soup = BeautifulSoup(response.text, 'html.parser')
    song_info = soup.find_all('div', {'class': 'music_player'})[0]
    song_name = song_info['data-title']
    song_artist = song_info['data-artist']
    song_url = song_info['data-src']
    return song_name, song_artist, song_url

该函数接受一个歌曲 ID 作为参数，返回该歌曲的名称、艺术家和下载链接。在函数内部，我们首先构造了一个歌曲页面的 url，然后发送 GET 请求获取页面内容。接着，我们使用 BeautifulSoup 库解析页面内容，提取出包含歌曲信息的 div 元素，然后从该元素中提取出歌曲的名称、艺术家和下载链接，并将它们作为函数的返回值。

定义下载歌曲的函数

def download_song(song_name, song_artist, song_url):
    file_name = '{} - {}.mp3'.format(song_artist, song_name)
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'}
    response = requests.get(song_url, headers=headers)
    with open(file_name, 'wb') as f:
        f.write(response.content)

该函数接受三个参数：歌曲名称、艺术家和下载链接。在函数内部，我们首先构造了保存歌曲的文件名，然后发送 GET 请求获取歌曲的二进制内容，并将它写入文件中。

定义主函数

def main():
    keywords = input('请输入歌曲关键词：')
    song_info_list = get_song_info(keywords)
    for i, song_info in enumerate(song_info_list):
        print('{}. {} - {}'.format(i + 1, song_info['song_artist'], song_info['song_name']))
    song_index = int(input('请输入要下载的歌曲编号：'))
    song_id = song_info_list[song_index - 1]['song_id']
    song_name, song_artist, song_url = get_song_url(song_id)
    download_song(song_name, song_artist, song_url)
    print('下载成功！')

主函数中首先要求用户输入要搜索的关键词，然后调用 get_song_info 函数获取包含歌曲信息的列表，并将每首歌曲的编号、艺术家和名称打印出来。接着，要求用户输入要下载的歌曲编号，然后根据该编号获取歌曲 ID，并调用 get_song_url 函数获取该歌曲的下载链接。最后，调用 download_song 函数下载歌曲，并在下载完成后显示下载成功的提示。

完整代码如下：

import requests
from bs4 import BeautifulSoup

def get_song_info(keywords):
    url = 'http://www.xiami.com/search?key={}'.format(keywords)
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'}
    response = requests.get(url, headers=headers)
    soup = BeautifulSoup(response.text, 'html.parser')
    song_list = soup.find_all('div', {'class': 'search_song_list'})[0]
    songs = song_list.find_all('div', {'class': 'songblock'})
    song_info_list = []
    for song in songs:
        song_info = {}
        song_info['song_id'] = song['data-songid']
        song_info['song_name'] = song.find_all('a')[0].text
        song_info['song_artist'] = song.find_all('a')[1].text
        song_info_list.append(song_info)
    return song_info_list

def get_song_url(song_id):
    url = 'http://www.xiami.com/song/{}'.format(song_id)
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'}
    response = requests.get(url, headers=headers)
    soup = BeautifulSoup(response.text, 'html.parser')
    song_info = soup.find_all('div', {'class': 'music_player'})[0]
    song_name = song_info['data-title']
    song_artist = song_info['data-artist']
    song_url = song_info['data-src']
    return song_name, song_artist, song_url

def download_song(song_name, song_artist, song_url):
    file_name = '{} - {}.mp3'.format(song_artist, song_name)
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'}
    response = requests.get(song_url, headers=headers)
    with open(file_name, 'wb') as f:
        f.write(response.content)

def main():
    keywords = input('请输入歌曲关键词：')
    song_info_list = get_song_info(keywords)
    for i, song_info in enumerate(song_info_list):
        print('{}. {} - {}'.format(i + 1, song_info['song_artist'], song_info['song_name']))
    song_index = int(input('请输入要下载的歌曲编号：'))
    song_id = song_info_list[song_index - 1]['song_id']
    song_name, song_artist, song_url = get_song_url(song_id)
    download_song(song_name, song_artist, song_url)
    print('下载成功！')

if __name__ == '__main__':
    main()

注意：该程序需要安装 requests 和 beautifulsoup4 库。可以使用 pip 命令安装：

pip install requests beautifulsoup4

该程序仅供学习交流使用，请勿用于任何商业用途或违反法律法规的行为。

如何提高音质

使用更高质量的音频源：一些音乐网站提供不同音质的音频文件，例如 320kbps、192kbps 等。爬取程序可以根据需要选择更高音质的音频文件。
音频转换：如果原始音频文件音质较低，可以使用音频转换工具将音频转换为更高音质。
音频降噪：一些音频降噪软件可以有效去除音频中的噪声，提升音质。

其他注意事项

该程序仅供学习交流使用，请勿用于任何商业用途或违反法律法规的行为。
网站可能会改变网页结构，导致程序失效。需要根据实际情况调整程序代码。
音乐版权问题：请尊重音乐版权，仅供个人学习使用，不要进行商业传播或非法用途。

希望这篇文章对您有所帮助！如果您有任何问题，请随时在评论区留言。