Python 脚本:从图片 URL 解析漫画信息并存入列表
python/nimport re/n/n# 定义字符串/ns = '<div data-v-73d47413=/'/' data-v-48dcf6a3=/'/' class=/'scroll no-scroll/'><div data-v-73d47413=/'/' class=/'list/'><div data-v-73d47413=/'/' class=/'box/'><div data-v-73d47413=/'/' class=/'cover/'><img data-v-73d47413=/'/' data-src=/'http://sakuraoka.oss-cn-shenzhen.aliyuncs.com/manga/u149/238/01.jpg?x-oss-process=style/240w/' src=/'http://sakuraoka.oss-cn-shenzhen.aliyuncs.com/manga/u149/238/01.jpg?x-oss-process=style/240w/' lazy=/'loaded/'></div> <div data-v-73d47413=/'/' class=/'info/'><p data-v-73d47413=/'/' class=/'title/'>第130话 佐城雪美③ 中篇</p> <hr data-v-73d47413=/'/'> <div data-v-73d47413=/'/' class=/'staff/'><p data-v-73d47413=/'/' class=/'group/'>汉化组:346小学</p> <p data-v-73d47413=/'/'>翻译:无名 嵌字:Mos</p></div> <div data-v-73d47413=/'/' class=/'extra/'><div data-v-73d47413=/'/'><li data-v-73d47413=/'/' class=/'comment/'><span data-v-73d47413=/'/' class=/'glyphicon glyphicon-comment/'></span> <span data-v-73d47413=/'/'>2</span></li> <li data-v-73d47413=/'/' class=/'debut-idol/'><span data-v-73d47413=/'/' class=/'glyphicon glyphicon-user/'></span> <span data-v-73d47413=/'/'>4</span></li></div> <li data-v-73d47413=/'/' class=/'time/'><span data-v-73d47413=/'/' class=/'glyphicon glyphicon-time/'></span> <span data-v-73d47413=/'/'>2023-06-25</span></li></div></div></div></div><div data-v-73d47413=/'/' class=/'list/'><div data-v-73d47413=/'/' class=/'box/'><div data-v-73d47413=/'/' class=/'cover/'><img data-v-73d47413=/'/' data-src=/'http://sakuraoka.oss-cn-shenzhen.aliyuncs.com/manga/u149/237/01.jpg?x-oss-process=style/240w/' src=/'http://sakuraoka.oss-cn-shenzhen.aliyuncs.com/manga/u149/237/01.jpg?x-oss-process=style/240w/' lazy=/'loaded/'></div> <div data-v-73d47413=/'/' class=/'info/'><p data-v-73d47413=/'/' class=/'title/'>第130话 佐城雪美③ 前篇</p> <hr data-v-73d47413=/'/'> <div data-v-73d47413=/'/' class=/'staff/'><p data-v-73d47413=/'/' class=/'group/'>汉化组:346小学</p>'/n/n# 使用正则表达式解析数字/nnumbers = re.findall(r'(?<=/)/d+(?=/)', s)/n/n# 将结果存入列表/nresult = []/nfor num in numbers:/n result.append({/n 'number': num,/n 'title': f'第{int(num) - 108}话 佐城雪美③',/n })/n/n# 输出结果/nprint(result)/n/n/n注意:上述脚本假设每个图片的 URL 中的数字都是需要解析的内容,并且数字与标题之间的关系为数字减去 108。您可以根据实际情况进行修改。
原文地址: https://www.cveoy.top/t/topic/o41H 著作权归作者所有。请勿转载和采集!