PHP 获取网页内容并提取标题代码解析
这段代码的作用是获取指定 URL 的网页内容,并从中提取出网页标题。
首先,使用'file_get_contents()'函数尝试获取网页内容,如果返回值为 false,则抛出一个异常。在异常处理块中,使用 curl 函数重新获取网页内容,并将其赋值给变量 $contents。
然后,使用正则表达式匹配网页标题,并将匹配到的标题存储在变量 $title 中。最后,对 $title 进行一些优化处理,如去除换行符、逗号和空格。
try {
$contents = file_get_contents($t_url);
if ($contents === false) {
throw new Exception('file_get_contents failed');
}
} catch (Exception $e) {
// 使用 curl 函数获取网页内容
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $t_url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$contents = curl_exec($ch);
curl_close($ch);
}
preg_match('/<title>(.*)</title>/i', $contents, $title);
$title = str_replace(array("\r\n", "\r", "\n", ',', ' '), '', $title[1]);
代码详解:
- 使用
file_get_contents()函数获取网页内容,如果失败则抛出异常。 - 使用
curl函数作为备用方案,确保即使file_get_contents()失败也能获取网页内容。 - 使用正则表达式
/<title>(.*)</title>/i匹配网页标题。 - 使用
str_replace()函数去除标题中的换行符、逗号和空格,进行优化处理。
这段代码可以帮助你从网页中提取标题,并进行简单的优化处理。
原文地址: https://www.cveoy.top/t/topic/o7Rj 著作权归作者所有。请勿转载和采集!