如何使用 WebHarvy 抓取微博网站内包含特定关键词的微博
使用 WebHarvy V6.3.0.189 抓取微博网站内包含特定关键词的微博内容,请按照以下步骤操作:
-
打开 WebHarvy 软件并从菜单栏中选择'新模板'。
-
在新模板页面中输入微博网站的 URL,并点击'开始配置'按钮。
-
在网站页面中选择包含微博列表的区域,并用鼠标右键单击该区域。
-
选择'添加选择器'并在弹出的对话框中输入选择器的名称。
-
在选择器属性中选择'正则表达式'并输入包含关键词的微博的正则表达式。
-
点击'测试'按钮以确认选择器是否正确。
-
在选择器列表中选择刚刚创建的选择器,并点击'下一页'按钮以继续配置模板。
-
在下一页中选择包含微博详细信息的区域,并用鼠标右键单击该区域。
-
选择'添加选择器'并在弹出的对话框中输入选择器的名称。
-
在选择器属性中选择'文本'或'属性',并输入需要提取的信息。
-
点击'测试'按钮以确认选择器是否正确。
-
在选择器列表中选择刚刚创建的选择器,并点击'完成'按钮以保存模板。
-
点击'运行'按钮以开始抓取微博网站内包含某关键词的微博。
-
等待 WebHarvy 完成抓取工作,并将结果导出到您选择的文件格式中。
原文地址: https://www.cveoy.top/t/topic/oyvq 著作权归作者所有。请勿转载和采集!