Python 脚本解析漫画章节信息
python/nimport re/n/n# 输入的字符串/ninput_string = '<div data-v-73d47413=/'/' data-v-48dcf6a3=/'/' class=/'scroll no-scroll/'><div data-v-73d47413=/'/' class=/'list/'><div data-v-73d47413=/'/' class=/'box/'><div data-v-73d47413=/'/' class=/'cover/'><img data-v-73d47413=/'/' data-src=/'http://sakuraoka.oss-cn-shenzhen.aliyuncs.com/manga/u149/238/01.jpg?x-oss-process=style/240w/' src=/'http://sakuraoka.oss-cn-shenzhen.aliyuncs.com/manga/u149/238/01.jpg?x-oss-process=style/240w/' lazy=/'loaded/'></div> <div data-v-73d47413=/'/' class=/'info/'><p data-v-73d47413=/'/' class=/'title/'>第130话 佐城雪美③ 中篇</p> <hr data-v-73d47413=/'/'> <div data-v-73d47413=/'/' class=/'staff/'><p data-v-73d47413=/'/' class=/'group/'>汉化组:346小学</p> <p data-v-73d47413=/'/'>翻译:无名 嵌字:Mos</p></div> <div data-v-73d47413=/'/' class=/'extra/'><div data-v-73d47413=/'/'><li data-v-73d47413=/'/' class=/'comment/'><span data-v-73d47413=/'/' class=/'glyphicon glyphicon-comment/'></span> <span data-v-73d47413=/'/'>2</span></li> <li data-v-73d47413=/'/' class=/'debut-idol/'><span data-v-73d47413=/'/' class=/'glyphicon glyphicon-user/'></span> <span data-v-73d47413=/'/'>4</span></li></div> <li data-v-73d47413=/'/' class=/'time/'><span data-v-73d47413=/'/' class=/'glyphicon glyphicon-time/'></span> <span data-v-73d47413=/'/'>2023-06-25</span></li></div></div></div></div><div data-v-73d47413=/'/' class=/'list/'><div data-v-73d47413=/'/' class=/'box/'><div data-v-73d47413=/'/' class=/'cover/'><img data-v-73d47413=/'/' data-src=/'http://sakuraoka.oss-cn-shenzhen.aliyuncs.com/manga/u149/237/01.jpg?x-oss-process=style/240w/' src=/'http://sakuraoka.oss-cn-shenzhen.aliyuncs.com/manga/u149/237/01.jpg?x-oss-process=style/240w/' lazy=/'loaded/'></div> <div data-v-73d47413=/'/' class=/'info/'><p data-v-73d47413=/'/' class=/'title/'>第130话 佐城雪美③ 前篇</p> <hr data-v-73d47413=/'/'> <div data-v-73d47413=/'/' class=/'staff/'><p data-v-73d47413=/'/' class=/'group/'>汉化组:346小学</p>/n/n# 使用正则表达式解析字符串/npattern = r'<p data-v-73d47413=/'/' class=/'title/'>第(/d+)话 (.*?)<//p>'/nmatches = re.findall(pattern, input_string)/n/n# 存储结果的列表/nresult = []/n/n# 提取解析结果并存入列表/nfor match in matches:/n chapter = match[0]/n title = match[1]/n result.append((chapter, title))/n/n# 打印结果/nprint(result)/n/n/n此脚本会输出以下结果:/n/n/n[('130', '佐城雪美③ 中篇'), ('130', '佐城雪美③ 前篇')]/n/n/n每个元组中的第一个元素是章节号,第二个元素是标题。你可以根据需要修改脚本以适应其他类似的输入字符串。
原文地址: https://www.cveoy.top/t/topic/o41E 著作权归作者所有。请勿转载和采集!