QueryList 是一个 PHP 的网络爬虫库,它支持多种选择器来提取和操作 HTML 元素。以下是一些常用的选择器:
// 通过类名选择元素
$elements = $ql->find('.className');
// 通过 ID 选择元素
$elements = $ql->find('#elementId');
// 通过属性选择元素
$elements = $ql->find('[href]');
// 通过伪类选择元素
$elements = $ql->find('.className:hover');
// 通过 XPath 选择元素
$elements = $ql->findXPath('//div[@class="className"]');
// 使用组合选择器
$elements = $ql->find('.className, #elementId');
*
来选择所有元素。例如:// 选择所有元素
$elements = $ql->find('*');
[]
来选择具有指定属性的元素。例如:// 选择具有指定属性的元素
$elements = $ql->find('[href^="https://"]');
:
来选择具有指定伪类的元素。例如:// 选择第一个匹配的元素
$elements = $ql->find('div:first-child');
这些选择器可以组合使用,以满足不同的提取需求。更多详细信息和示例,请参考 QueryList 的官方文档:https://querylist.org/