php实现模拟登陆方正教务系统抓取课表
发布:smiling 来源: PHP粉丝网 添加日期:2021-05-27 10:36:26 浏览: 评论:0
课程格子和超级课程表这两个应用,想必大学生都很熟悉,使用自己的学号和教务系统的密码,就可以将自己的课表导入,随时随地都可以在手机上查看。
其实稍微了解一点php的话,我们也可以做一个类似这样的web 应用。
1,解决掉验证码
其实这是正方的一个小bug,当我们进入登陆界面时,浏览器会去请求服务器,服务器会生成一个验证码图片。如果我们不去请求这个图片,那么正方后台也不会生成相应的验证码,于是这样我们就有了可乘之机,让我高兴会儿~这时,我们在不填写验证码的情况下,可以很流畅的进入。大家可以在自己的电脑上禁止访问验证码的地址,然后试试这是不是真的~当然,这只对正方有效。
2,php 的curl 模拟登陆
接下来就是相关代码了,相信很多人和我一样,只喜欢看例子,对于长篇大论的讲解,转头就走……不过这个习惯还是不好……废话不多说!
- //模拟登陆
- function curl_request($url,$post='',$cookie='', $returnCookie=0){
- $curl = curl_init();
- curl_setopt($curl, CURLOPT_URL, $url);
- curl_setopt($curl, CURLOPT_USERAGENT, 'Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; Trident/6.0)');
- curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1);
- curl_setopt($curl, CURLOPT_AUTOREFERER, 1);
- curl_setopt($curl, CURLOPT_REFERER, "这里一定要换成教务系统登陆的url"); //填写教务系统url
- if($post) {
- curl_setopt($curl, CURLOPT_POST, 1);
- curl_setopt($curl, CURLOPT_POSTFIELDS, http_build_query($post));
- }
- if($cookie) {
- curl_setopt($curl, CURLOPT_COOKIE, $cookie);
- }
- curl_setopt($curl, CURLOPT_HEADER, $returnCookie);
- curl_setopt($curl, CURLOPT_TIMEOUT, 20);
- curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
- $data = curl_exec($curl);
- if (curl_errno($curl)) {
- return curl_error($curl);
- }
- curl_close($curl);
- if($returnCookie){
- list($header, $body) = explode("\r\n\r\n", $data, 2);
- preg_match_all("/Set\-Cookie:([^;]*);/", $header, $matches);
- $info['cookie'] = substr($matches[1][0], 1);
- $info['content'] = $body;
- return $info;
- }else{
- return $data;
- }
- }
3,教务系统登陆页面的隐藏字段
举个栗子,代码如下:
<input type="hidden" name="__VIEWSTATE" value="dDwyODE2NTM0OTg7Oz61eIbnKVojBioGYtg2vsy2SklwiA==">
这些东西在登陆的时候也是需要带上的,顺便贴出函数,顺便暴漏了博主的学校……皇家种地大学(主要是正则表达式的运用)
- //登陆页面的隐藏字段
- function getView(){
- $url = 'http://jw.hzau.edu.cn/default2.aspx';
- $result = curl_request($url);
- $pattern = '/<input type="hidden" name="__VIEWSTATE" value="(.*?)" \/>/is';
- preg_match_all($pattern, $result, $matches);
- $res[0] = $matches[1][0];
- return $res[0] ;
- }
- //返回教室查询页面的隐藏值
- private function getViewJs($cookie,$xh){
- $url = "http://jw.hzau.edu.cn/xxjsjy.aspx?xh={$xh}";
- $result = curl_request($url,'',$cookie);
- $pattern = '/<input type="hidden" name="__VIEWSTATE" value="(.*?)" \/>/is';
- preg_match_all($pattern, $result, $matches);
- $res[0] = $matches[1][0];
- return $res[0] ;
- }
4,cookie 的获取
- function login($xh,$pwd){
- $url = 'http://jw.hzau.edu.cn/default2.aspx';
- $post['__VIEWSTATE'] = $this->getView();
- $post['txtUserName'] = $xh; //填写学号
- $post['TextBox2'] = $pwd; //填写密码
- $post['txtSecretCode'] = '';
- $post['lbLanguage'] = '';
- $post['hidPdrs'] = '';
- $post['hidsc'] = '';
- $post['RadioButtonList1'] = iconv('utf-8', 'gb2312', '学生');
- $post['Button1'] = iconv('utf-8', 'gb2312', '登录');
- $result = curl_request($url,$post,'', 1);
- return $result['cookie'];
- }
5,让我们来试试查课表的功能,格式有点乱额,大家凑合着看,我把课表转成了一个二维关联数组
- //返回课表字符串
- private function classresult($xh,$pwd){
- date_default_timezone_set("PRC"); //时区设置
- $classList = "";//声明课表变量
- $cookie = $this->login($xh,$pwd);
- $view = $this->getViewJs($cookie,$xh);//验证密码是否正确
- //如果密码正确
- if (!emptyempty($view)) {
- $url = "http://jw.hzau.edu.cn/xskbcx.aspx?xh={$xh}";
- $result = curl_request($url,'',$cookie); //保存的cookies
- preg_match_all('/<table id="Table1"[\w\W]*?>([\w\W]*?)<\/table>/',$result,$out);
- $table = $out[0][0]; //获取整个课表
- preg_match_all('/<td [\w\W]*?>([\w\W]*?)<\/td>/',$table,$out);
- $td = $out[1];
- $length = count($td);
- //获得课程列表
- for ($i=0; $i < $length; $i++) {
- $td[$i] = str_replace("<br>", "", $td[$i]);
- $reg = "/{(.*)}/";
- if (!preg_match_all($reg, $td[$i], $matches)) {
- unset($td[$i]);
- }
- }
- $td = array_values($td); //将课程列表数组重新索引
- $tdLength = count($td);
- for ($i=0; $i < $tdLength; $i++) {
- $td[$i] = iconv('GB2312','UTF-8',$td[$i]);
- }
- //将课表转换成数组形式
- function converttoTable($table){
- $list = array(
- 'sun' => array(
- '1,2' => '',
- '3,4' => '',
- '5,6' => '',
- '7,8' => '',
- '9,10' => ''
- ),
- 'mon' => array(
- '1,2' => '',
- '3,4' => '',
- '5,6' => '',
- '7,8' => '',
- '9,10' => ''
- ),
- 'tues' => array(
- '1,2' => '',
- '3,4' => '',
- '5,6' => '',
- '7,8' => '',
- '9,10' => ''
- ),
- 'wed' => array(
- '1,2' => '',
- '3,4' => '',
- '5,6' => '',
- '7,8' => '',
- '9,10' => ''
- ),
- 'thur' => array(
- '1,2' => '',
- '3,4' => '',
- '5,6' => '',
- '7,8' => '',
- '9,10' => ''
- ),
- 'fri' => array(
- '1,2' => '',
- '3,4' => '',
- '5,6' => '',
- '7,8' => '',
- '9,10' => ''
- ),
- 'sat' => array(
- '1,2' => '',
- '3,4' => '',
- '5,6' => '',
- '7,8' => '',
- '9,10' => ''
- )
- );
- $week = array("sun"=>"周日","mon"=>"周一","tues"=>"周二","wed"=>"周三","thur"=>"周四","fri"=>"周五","sat"=>"周六");
- $order = array('1,2','3,4','5,6','7,8','9,10');
- foreach ($table as $key => $value) {
- $class = $value;
- foreach ($week as $key => $weekDay) {
- $pos = strpos($class,$weekDay);
- // echo $pos;
- if ($pos) {
- $weekArrayDay = $key; //获取list数组中的第一维key
- foreach ($order as $key => $orderClass) {
- $pos = strpos($class,$orderClass);
- if ($pos) {
- $weekArrayOrder = $orderClass; //获取该课程是第几节
- break;
- }
- }
- break;
- }
- }
- $list[$weekArrayDay][$weekArrayOrder] = $class;
- }
- return $list;
- }
- //调用函数
- return converttoTable($td);
- }else{
- return 0;
- }
- }
6,再试试查询空教室的功能
- //空教室查询结果
- public function roomresult(){
- $xh = ""; //设置学号
- $pwd = ""; //学号对应的密码
- $cookie = $this->login($xh,$pwd);
- $url = "http://jw.hzau.edu.cn/xs_main.aspx?xh={$xh}";
- $result = curl_request($url,'',$cookie); //保存的cookies
- $url="http://jw.hzau.edu.cn/xxjsjy.aspx?xh={$xh}";
- $post['Button2'] = iconv('utf-8', 'gb2312', '空教室查询');
- $post['__EVENTARGUMENT']='';
- $post['__EVENTTARGET']='';
- $post['__VIEWSTATE'] = $this->getViewJs($cookie,$xh);
- $post['ddlDsz'] = iconv('utf-8', 'gb2312', '单');
- $post['ddlSyXn'] = '2014-2015'; //学年
- $post['ddlSyxq'] = '1';
- $post['jslb'] = '';
- $post['xiaoq'] = '';
- $post['kssj']=$_GET['start']; //提交的开始查询时间
- $post['sjd']=$_GET['class'];//提交的课程节次
- $post['xn']='2014-2015';//所在学年
- $post['xq']='2';//所在学期
- $post['xqj']='6';//当天星期几
- $post['dpDataGrid1:txtPageSize']=90;//每页显示条数
- $result = curl_request($url,$post,$cookie,0);
- preg_match_all('/<span[^>]+>[^>]+span>/',$result,$out);
- $tip = iconv('gb2312', 'utf-8', $out[0][3]);//获取页面前部的提示内容
- preg_match_all('/<table[\w\W]*?>([\w\W]*?)<\/table>/',$result,$out);
- $table = iconv('gb2312', 'utf-8', $out[0][0]); //获取查询列表
- $this->load->view("classroom",array('tip'=>$tip,'table'=>$table));
- }
总结起来就是这些了,每个学校的教务系统都不尽相同,这时我们可以借助火狐浏览器的 firebug 抓包,看看到底提交了哪些东西。
Tags: php模拟登陆
- 上一篇:php获取json数据所有的节点路径
- 下一篇:php使用标签替换的方式生成静态页面
相关文章
- ·PHP模拟登陆163邮箱发邮件及获取通讯录列表的方法(2021-05-15)
推荐文章
热门文章
最新评论文章
- 写给考虑创业的年轻程序员(10)
- PHP新手上路(一)(7)
- 惹恼程序员的十件事(5)
- PHP邮件发送例子,已测试成功(5)
- 致初学者:PHP比ASP优秀的七个理由(4)
- PHP会被淘汰吗?(4)
- PHP新手上路(四)(4)
- 如何去学习PHP?(2)
- 简单入门级php分页代码(2)
- php中邮箱email 电话等格式的验证(2)