这篇文章将为大家详细讲解有关使用PHP怎么实现抓取小说网站内容功能,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。
具体如下:
ini_set('user_agent','Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 2.0.50727; .NET CLR 3.0.04506.30; GreenBrowser)'); ini_set('max_execution_time', '0'); $base = 'https://www.qu.la/book/19434/'; $start = '7504808.html'; $content_grep = '/ (.*)<br\/>/'; //$content_grep = '/<div id="content">(.*)<br\/>/sS'; $next_grep = '/<a id="pager_next" href=\"(\d+\.html)\" target="_top" class="next">下一章<\/a>/'; $next = $start; $file_name = '听书了.txt'; while($next) { echo 'getting ' . $next . PHP_EOL; $result = file_get_contents($base . $next); preg_match_all($content_grep, $result, $match); $isTitle = true; $content = ""; foreach($match[1] as $line) { $line = str_replace("<br/>", '', $line); $line = str_replace(" ", '', $line); if($isTitle) { $content = $line . PHP_EOL . PHP_EOL; $isTitle = false; } else { $content .= ' ' . $line . PHP_EOL . PHP_EOL; } } $file = fopen($file_name, 'a'); echo 'write length: ' . strlen($content) . PHP_EOL; fwrite($file, $content); fclose($file); echo '.'; preg_match($next_grep, $result, $match); $next = $match[1]; }
php的框架:1、Laravel,Laravel是一款免费并且开源的PHP应用框架。2、Phalcon,Phalcon是运行速度最快的一个PHP框架。3、Symfony,Symfony是一款为Web项目准备的PHP框架。4、Yii,Yii是一款快速、安全和专业的PHP框架。5、CodeIgniter,CodeIgniter是一款非常敏捷的开源PHP框架。6、CakePHP,CakePHP是一款老牌的PHP框架。7.Kohana,Kohana是一款敏捷但是功能强大的PHP框架。
关于使用PHP怎么实现抓取小说网站内容功能就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。