Selenium 自动化脚本:从网页提取数字并填充分数
from selenium.webdriver.chrome.options import Options
from selenium import webdriver
import time
import os
def get_driver():
# 检查是否已经打开浏览器
browser_opened = False
for handle in webdriver.Chrome().window_handles:
browser_opened = True
break
# 创建浏览器实例或在已有浏览器中操作
if browser_opened:
options = Options()
options.debugger_address = '127.0.0.1:9222'
driver = webdriver.Chrome(options=options)
else:
os.system(r'start chrome --remote-debugging-port=9222 --user-data-dir="D:\评阅用"')
options = Options()
options.add_experimental_option('debuggerAddress', '127.0.0.1:9222')
driver = webdriver.Chrome(options=options)
return driver
driver = get_driver()
# 找到有'内蒙古开放大学'字样的标签页
while True:
for handle in driver.window_handles:
driver.switch_to.window(handle)
if '内蒙古开放大学' in driver.title:
print('登录成功')
break
else:
time.sleep(3)
continue
break
# 在网页内查找所有class属性为summary-sub-title的元素,并提取其中的数字
elements = driver.find_elements('class name', 'summary-sub-title')
for i, element in enumerate(elements):
text = element.text
num = ''.join(filter(str.isdigit, text))
print(num)
# 判断是否已经填写了答案
answer = driver.find_element('class name', 'answer-content')
if answer.text:
# 填写分数
score_input = driver.find_elements('css selector', 'input[name='score']')[i]
score_input.send_keys(num)
time.sleep(1) # 等待自动保存
driver.quit()
代码功能:
- 使用 Selenium 打开 Chrome 浏览器,并连接到已打开的浏览器实例(如果存在)。
- 定位到包含 '内蒙古开放大学' 字样的标签页。
- 查找所有 class 属性为 'summary-sub-title' 的元素,并提取其中的数字。
- 遍历所有 class 属性为 'answer-content' 的元素,判断是否已填写内容。
- 如果已填写内容,则在对应的评分框(class 属性为 'ng-pristine ng-valid ng-isolate-scope ng-empty ng-valid-maxlength ng-touched')中填写提取到的第一个数字,以此类推。
- 自动保存填写后的分数。
代码说明:
get_driver()函数用于获取浏览器实例,如果已打开浏览器,则连接到该实例,否则打开新的浏览器。driver.find_elements()方法用于查找多个元素。driver.find_element()方法用于查找单个元素。element.text属性获取元素的文本内容。filter(str.isdigit, text)用于过滤出文本中的数字。driver.switch_to.window(handle)方法用于切换到指定标签页。driver.quit()方法用于关闭浏览器。
注意:
- 本脚本需要修改
user-data-dir参数,指向你的 Chrome 用户数据目录。 - 脚本中的 'summary-sub-title' 和 'answer-content' 需要根据实际网页结构进行调整。
- 脚本中的 'input[name='score']' 需要根据实际评分框的 CSS 选择器进行调整。
- 脚本中使用了
time.sleep(1)等待自动保存,可以根据实际情况调整等待时间。
使用步骤:
- 修改脚本中的
user-data-dir参数。 - 修改脚本中的元素选择器。
- 运行脚本。
代码示例:
from selenium.webdriver.chrome.options import Options
from selenium import webdriver
import time
import os
# ... (get_driver() 函数和登录代码)
# ... (提取数字和填充分数的代码)
driver.quit()
原文地址: https://www.cveoy.top/t/topic/fZhP 著作权归作者所有。请勿转载和采集!