用python写个抓取淘宝日活的脚本

由于淘宝日活数据并非公开可用，因此要想抓取淘宝日活数据需要用到反爬虫技术，这里提供一种思路供参考：

通过selenium模拟浏览器行为打开淘宝首页，搜索框输入关键词“日活”，并点击搜索按钮。
通过selenium模拟浏览器滚动页面，使页面加载更多的数据。
使用正则表达式或BeautifulSoup解析页面HTML代码，找到页面上包含日活数据的元素。
获取日活数据，并保存到本地文件或数据库中。

下面是一个简单的抓取淘宝日活的Python脚本示例：

from selenium import webdriver
import time
import re

# 初始化浏览器
driver = webdriver.Chrome()

# 打开淘宝首页
driver.get("https://www.taobao.com/")

# 搜索框输入关键词“日活”，并点击搜索按钮
search_box = driver.find_element_by_id("q")
search_box.send_keys("日活")
search_btn = driver.find_element_by_class_name("btn-search")
search_btn.click()

# 模拟滚动页面，加载更多数据
for i in range(3):
    driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
    time.sleep(2)

# 解析页面HTML代码，找到包含日活数据的元素
html = driver.page_source
pattern = re.compile(r'<em class="tb-rmb-num">(\d+)</em>')
result = pattern.findall(html)

# 输出日活数据
if result:
    print("淘宝日活：%s" % result[0])
else:
    print("未找到淘宝日活数据")

# 关闭浏览器
driver.quit()

需要注意的是，由于淘宝网站的反爬虫机制比较严格，该脚本运行时可能会遇到验证码等问题，需要根据实际情况进行调整。