要读取文件夹下所有网页标题,可以使用以下步骤:
glob()
函数获取文件夹中的所有网页文件。例如,假设网页文件都是以 .html
或 .htm
结尾的,可以使用以下代码获取文件列表:$files = glob('path/to/folder/*.html');
$files += glob('path/to/folder/*.htm');
file_get_contents()
函数读取文件内容,然后使用正则表达式提取标题。foreach ($files as $file) {
$html = file_get_contents($file);
preg_match("/<title>(.*?)<\/title>/i", $html, $matches);
$title = $matches[1];
echo $title;
}
注意:这里的正则表达式仅适用于简单的网页,如果网页结构复杂,可能需要更复杂的表达式来匹配标题。同时,这种方法只能获取每个文件的第一个标题,如果一个网页文件中有多个标题,可能需要进行进一步的处理。