PHP 采集百度知道答案代码示例
以下是使用 PHP 采集百度知道答案的代码示例:
<?php
// 设置关键字
$keyword = '采集';
// 构造百度知道搜索的 URL
$searchUrl = 'https://zhidao.baidu.com/search?word=' . urlencode($keyword);
// 发起 HTTP 请求并获取响应内容
$response = file_get_contents($searchUrl);
// 解析 HTML 内容
$doc = new DOMDocument();
libxml_use_internal_errors(true);
$doc->loadHTML($response);
libxml_clear_errors();
// 通过 XPath 定位答案列表
$xpath = new DOMXPath($doc);
$answerNodes = $xpath->query("//div[@class='line content']");
// 遍历答案列表并输出内容
foreach ($answerNodes as $node) {
$answer = $node->nodeValue;
echo $answer . "\n";
}
?>
此代码通过构造百度知道的搜索 URL,然后发起 HTTP 请求并获取响应内容。接着使用 DOMDocument 和 DOMXPath 库解析 HTML 内容,通过 XPath 定位答案列表,并遍历输出答案内容。
请注意,这只是一个简单的示例代码,实际情况中可能需要处理字符编码、分页、反爬虫等问题。
原文地址: https://www.cveoy.top/t/topic/qe4K 著作权归作者所有。请勿转载和采集!