轻松搞定PHPCMS V9火车头采集自动分页
发布:smiling 来源: PHP粉丝网 添加日期:2014-10-20 23:32:50 浏览: 评论:0
这几天一直在用火车头做采集,途中遇到很多的问题,也参考了PHPCMS和火车头上很多的资料,这里多谢前辈们的指导,但好像他们说得都不全面,今天我把最近解决的问题和大家一起来分享,这里以PHPCMS v9为例.
一:首先到这里下载PHPCMS V9 火车头采集接口,分GKB和UTF-8的,地址是:http://board.locoy.com/?post=80
二:下载完后,解压到本地硬盘上,这里面一共有4个文件,根据你的PHPCMS版本把接口文件上传到你的网站根目录,建议更改接口名字,注意,在上传之前最好在本地,本机,上把$password='123456'(第十行左右)改为你自己的验证密码,修改后再上传.
三:1:下载火车头采集软件,新建站点-新建任务后-点击发布按扭,在弹出来的窗口左边按添加弹出添加web发布配置,选择导入模块,选中你刚才解压到本地的那个phpcms9 文章免登陆发布模块.cwr文件,导入后,列表框里就会显示你刚才导入的模块,选中他,然后点击左边的查看/修改按钮,然后会弹出火车头采集器-WEB在线发布模块编辑器,在刷新列表设置里把验证密码改为你之前在接口文件的验证码一致即/jiekou_gbk.php?pw=123456中的123456,另外要注意,好多的人发布不成功,这一步有一点很重要,就是你改了接口文件的名,这里的接口文件一定也要跟着改,即你上传到网站根目录的接口文件和/jiekou_gbk.php一致才可以.
2:文章发表参数里:把/jiekou_gbk.php?m=content&c=content&a=add&&pw=123456,改为了和你的接口文件一致(文件名和验证密码)
3:在自动发布数据包里,找到
- -----------------------------7dlocoyspider
- Content-Disposition: form-data; name="info[paginationtype]"
- 0 --phpfensi.com
- -----------------------------7dlocoyspider
- Content-Disposition: form-data; name="info[maxcharperpage]"
- 10000
把这里的0改为了2,即为手动发布,然后10000这里改为你想多少个字符就换页,根据实际需求,自己填写,在使用接口文件,支持变换用户名这里打勾,在列表文件里真写你自己网站已有的会员名,注意,必须是你CMS里已经有的会员名才有效,改完后保存模块,覆盖了保存退出.
四:返回火车头采集器主界面:点击编辑任务,在第二步采集内容规则里面,点击内容标签进去,把该标签在分页中匹配这个勾勾上,不然你可能采集不到分页,确定后返回第二步,在左下角的分页内容合并连接代码中填入:[page][/page],更新后,火车头采集这方面就算大功告成了.
五:修改PHPCMS V9的form.inc.php文件,具体位置在:\phpcms\modules\content\fields\pages中,调整18.19.20行的顺序,即把 <option value=\"2\">".L('page_type3')."</option>这一行放在三行的第一位位置,意思是默认为手动分页,保存后,采集后的文章就可以按照你刚才在火车头采集器设置的字数进行分页了.
Tags: PHPCMS火车头采集 PHPCMS自动分页
推荐文章
热门文章
最新评论文章
- 写给考虑创业的年轻程序员(10)
- PHP新手上路(一)(7)
- 惹恼程序员的十件事(5)
- PHP邮件发送例子,已测试成功(5)
- 致初学者:PHP比ASP优秀的七个理由(4)
- PHP会被淘汰吗?(4)
- PHP新手上路(四)(4)
- 如何去学习PHP?(2)
- 简单入门级php分页代码(2)
- php中邮箱email 电话等格式的验证(2)