thinkphp抓取网站内容保存本地
发布:smiling 来源: PHP粉丝网 添加日期:2018-08-31 10:28:52 浏览: 评论:0
thinkphp抓取网站内容保存到本地可以很大程度的方便我们借鉴一些内容或是图片的收集。那么thinkphp怎么抓取网站内容保存到本地呢?有什么具体操作方法?下面我们具体来看看。
thinkphp 抓取网站的内容并且保存到本地的实例详解
我需要写这么一个例子,到电子课本网下载一本电子书。
电子课本网的电子书,是把书的每一页当成一个图片,然后一本书就是有很多张图片,我需要批量的进行下载图片操作。
下面是代码部分:
- public function download() {
- $http = new \Org\Net\Http();
- $url_pref = "http://www.dzkbw.com/books/rjb/dili/xc7s/";
- $localUrl = "Public/bookcover/";
- $reg="|showImg\('(.+)'\);|";
- $i=1;
- do {
- $filename = substr("000".$i,-3).".htm";
- $ch = curl_init();
- curl_setopt($ch, CURLOPT_URL, $url_pref.$filename);
- curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
- curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10);
- curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
- $html = curl_exec($ch);
- curl_close($ch);
- $result = preg_match_all($reg,$html,$out, PREG_PATTERN_ORDER);
- if($result==1) {
- $picUrl = $out[1][0];
- $picFilename = substr("000".$i,-3).".jpg";
- $http->curlDownload($picUrl, $localUrl.$picFilename);
- }
- $i = $i+1;
- } while ($result==1);
- echo "下载完成";
- }
我这里是以人教版地理七年级地理上册为例子 http://www.dzkbw.com/books/rjb/dili/xc7s/001.htm
网页是从001.htm开始,然后数字一直加
每个网页里面都有一张图,就是对应课本的内容,以图片的形式展示课本内容
我的代码是做了一个循环,从第一页开始抓,一直抓到找不到网页里的图片为止
抓到网页的内容后,把网页里面的图片抓取到本地服务器
Tags: 内容 网站
相关文章
- ·thinkphp模板使用和内容输出(2014-04-11)
- ·thinkPHP5实现数据库添加内容的方法(2018-09-13)
- ·ThinkPHP3.1新特性之内容解析输出详解(2021-02-26)
- ·thinkphp模板用法和内容输出实例(2021-05-01)
- ·THINKPHP内容分页代码分享(2021-05-08)
推荐文章
热门文章
最新评论文章
- 写给考虑创业的年轻程序员(10)
- PHP新手上路(一)(7)
- 惹恼程序员的十件事(5)
- PHP邮件发送例子,已测试成功(5)
- 致初学者:PHP比ASP优秀的七个理由(4)
- PHP会被淘汰吗?(4)
- PHP新手上路(四)(4)
- 如何去学习PHP?(2)
- 简单入门级php分页代码(2)
- php中邮箱email 电话等格式的验证(2)