当前位置:首页 > PHP教程 > php应用 > 列表

PHP中截取中文乱码解决办法

发布:smiling 来源: PHP粉丝网  添加日期:2013-12-03 21:56:28 浏览: 评论:0 

如果ASCii码大于0xa0就是半个汉字;了解substr()、mb_substr()、ord()。 现在常用的编码格式是UTF8,GBK,GBK2312,BIG5。GBK是GBK2312的升级。现在我开发中遇到的基本都是UTF8,GBK常用在论坛BBS上。今天自己写了下UTF8的,测试下还说的过去,毕竟从网上拷下来的是可以用,但是如果有时间最好还是自己写一下,这样只有到自己手里的才是自己的。

最简的就是利用:例一

  1. echo substr("Hello world!",6); 
  2. //输出:world! 
  3. ?> 

例二:

  1. echo substr("Hello world!",6,5); 
  2. ?> 
  3. 英文的话没有问题,但是中文就出问题了,下面我们使用mb_substr函数处理。 
  4. /** 
  5. *—————————————————————————————————————– 
  6. *PHP有一个mbstring扩展库可以用(有朋友面试PHP的时候还被问到过这个问题哦),但是  *  
  7. 一般的服务器都没打开php_mbstring.dll,需要在  
  8. *php.ini里把php_mbstring.dll打开,如果没有权限的话就只有联系你的ISP了。 
  9. *因为mb_string的效率高一些,所以我们先检查一下mb_string是否可以用: 
  10. *—————————————————————————————————————– 
  11. */ 
  12.  代码如下 复制代码 
  13. if(function_exists(‘mb_string’)) 
  14. mb_substr($string,$start,$length,$encoding); 
  15. //other codes here 
  16. else mysubstr($string,$start,$length);// 调用自己的函数 
  17. ?> 

首先定义自己的函数:

  1. /** 
  2. *———————————- 
  3. *首先定义自己的函数: 
  4. *———————————- 
  5. */ 
  6. function mysubstr($string$start$length
  7. if(strlen($string)>$length
  8. $str=”; 
  9. $len=$start+$length
  10. for($i=$start;$i<$len;$i++) 
  11. if(ord(substr($string,$i,1))>0xa0) 
  12. $str.=substr($string,$i,2); 
  13. $i++; 
  14. else$str.=substr($string,$i,1);} 
  15. return $str.’…’; 
  16. elsereturn $string;} 

还有一个问题要注意,使用这种方法的时候,你的标签对里的charset只有设成中文的编码才可以,如GBK,GB2312。

下面自己常用的一个中英文字符截取函数,自定义截取中文字符串函数,基本上就是仿照mb_substr写个函数,直接调用罢了,以下为我找到的代码,其实很简单:

  1. function  substr_cn($string_input,$start,$length)  
  2. {  
  3.     /* 功能:  
  4.      * 此算法用于截取中文字符串  
  5.      * 函数以单个完整字符为单位进行截取,即一个英文字符和一个中文字符均表示一个单位长度  
  6.      * 参数:  
  7.      * 参数$string为要截取的字符串,  
  8.      * 参数$start为欲截取的起始位置,  
  9.      * 参数$length为要截取的字符个数(一个汉字或英文字符都算一个)  
  10.      * 返回值:  
  11.      * 返回截取结果字符串  
  12.      * */  
  13.     $str_input=$string_input;  
  14.     $len=$length;  
  15.     $return_str="";  
  16.     //定义空字符串  
  17.     for ($i=0;$i<2*$len+2;$i++)  
  18.         $return_str=$return_str." ";  
  19.     $start_index=0;  
  20.     //计算起始字节偏移量  
  21.     for ($i=0;$i<$start;$i++)  
  22.     {  
  23.         if (ord($str_input{$start_index}>=161))          //是汉语       
  24.         {  
  25.             $start_index+=2;  
  26.         }  
  27.         else                                          //是英文  
  28.         {  
  29.             $start_index+=1;  
  30.         }          
  31.     }      
  32.     $chr_index=$start_index;  
  33.     //截取  
  34.     for ($i=0;$i<$len;$i++)  
  35.     {  
  36.         $asc=ord($str_input{$chr_index});  
  37.         if ($asc>=161)  
  38.         {  
  39.             $return_str{$i}=chr($asc);  
  40.             $return_str{$i+1}=chr(ord($str_input{$chr_index+1}));  
  41.             $len+=1; //结束条件加1  
  42.             $i++;    //位置偏移量加1  
  43.             $chr_index+=2;  
  44.             continue;              
  45.         }  
  46.         else   
  47.         {  
  48.             $return_str{$i}=chr($asc);  
  49.             $chr_index+=1;  
  50.         }  
  51.     }      
  52.     return trim($return_str);  
  53. }//end of substr_cn  
  54. ?> 

Tags: 截取 中文 乱码

分享到: