PHP自动识别字符集编码并完成转码
发布:smiling 来源: PHP粉丝网 添加日期:2014-07-04 09:40:04 浏览: 评论:0
原理很简单,因为gb2312/gbk是中文两字节,这两个字节是有取值范围的,而utf-8中汉字是三字节,同样每个字节也有取值范围,而英文不管在何种编码情况下,都是小于128,只占用一个字节,全角除外.
在PHP处理页面的时候,我们对于字符集的转换都是采用了iconv或者mb_convert等函数,但这其实是有一个前提的,即我们事先得知道in和out是什么样的编码,我们才能进行正确的转换.
下面这个函数,就可以在不知道源字符串编码的情况下,自动判断其编码并进行转换,虽然只支持UTF8编码和GB2312编码,但对于国内绝大多数网站来说,已经够用了,代码如下:
- function safeEncoding($string,$outEncoding = 'UTF-8')
- {
- $encoding = "UTF-8";
- for($i=0;$i<128)
- continue;
- if((ord($string{$i})&224)==224)
- {
- //第一个字节判断通过
- $char = $string{++$i};
- if((ord($char)&128)==128)
- {
- //第二个字节判断通过
- $char = $string{++$i};
- if((ord($char)&128)==128)
- {
- $encoding = "UTF-8";
- break;
- }
- }
- }
- if((ord($string{$i})&192)==192)
- {
- //第一个字节判断通过
- $char = $string{++$i};
- if((ord($char)&128)==128)
- {
- //第二个字节判断通过
- $encoding = "GB2312";
- break;
- }
- }
- }
- if(strtoupper($encoding) == strtoupper($outEncoding))
- return $string;
- else
- return iconv($encoding,$outEncoding,$string);
- }
识别汉字编码,因为YBlog用的是utf-8,如果引用通告发过来的是gb2312的编码的话,需要可以识别并完成编码转换,代码如下:
- function safeEncoding($string,$outEncoding = 'UTF-8')
- {
- $encoding = "UTF-8";
- for($i=0;$i<strlen($string);$i++)
- {
- if(ord($string{$i})<128)
- continue;
- if((ord($string{$i})&224)==224)
- {
- //第一个字节判断通过
- $char = $string{++$i};
- if((ord($char)&128)==128)
- {
- //第二个字节判断通过
- $char = $string{++$i};
- if((ord($char)&128)==128)
- {
- $encoding = "UTF-8";
- break;
- }
- }
- }
- if((ord($string{$i})&192)==192)
- {
- //第一个字节判断通过
- $char = $string{++$i};
- if((ord($char)&128)==128)
- {
- //第二个字节判断通过
- $encoding = "GB2312";
- break;
- }
- }
- }
- if(strtoupper($encoding) == strtoupper($outEncoding))
- return $string;
- else
- return iconv($encoding,$outEncoding,$string);
- }
Tags: 字符集 自动识别 编码
相关文章
- ·php 正则判断中文(自动识别UTF-8 & GBK编码) (2014-06-06)
- ·PHP自动识别用户上传不雅图片并发邮箱提示(2014-08-21)
- ·PHP实现自动识别Restful API的返回内容类型(2021-05-10)
- ·php Base64编码文件二进制流主要使用(2014-02-17)
- ·PHP把16进制的编码转为中文程序代码(2014-06-21)
- ·PHP判断字符串编码是否为utf-8的程序代码(2014-07-05)
推荐文章
热门文章
最新评论文章
- 写给考虑创业的年轻程序员(10)
- PHP新手上路(一)(7)
- 惹恼程序员的十件事(5)
- PHP邮件发送例子,已测试成功(5)
- 致初学者:PHP比ASP优秀的七个理由(4)
- PHP会被淘汰吗?(4)
- PHP新手上路(四)(4)
- 如何去学习PHP?(2)
- 简单入门级php分页代码(2)
- php中邮箱email 电话等格式的验证(2)