PHP正确解析UTF-8字符串
发布:smiling 来源: PHP粉丝网 添加日期:2013-12-03 20:46:15 浏览: 评论:0
- $str = '今天非常Happy,所有决定去KFC吃可乐鸡翅!!!';
- /*
- $str 是待截取的字符串
- $len 是截取的字符数
- */
- function utf8sub($str,$len) {
- if($len <= 0){
- return '';
- }
- $offset = 0; // 截取高位字节时的偏移量
- $chars = 0; // 截取到的字符数
- $res = ''; // 存放截取的结果字符串
- while($chars < $len){
- // 先取字符串的第一个字节
- // 将它转为十进制
- // 再转为二进制
- $high = ord(substr($str,$offset,1));
- // echo '$high='. $high .'<br />';
- if($high == null ){ // 如果取出高位为null,证明已经取到末尾,直接break
- break;
- }
- if(($high>>2) === 0x3F){ // 将高位右移2位,和二进制111111比较,相同则取6个字节
- // 截取2个字节
- $count = 6;
- }else if(($high>>3) === 0x1F){ // 将高位右移2位,和二进制11111比较,相同则取5个字节
- // 截取3个字节
- $count = 5;
- }else if(($high>>4) === 0xF){ // 将高位右移2位,和二进制1111比较,相同则取4个字节
- // 截取4个字节
- $count = 4;
- }else if(($high>>5) === 0x7){ // 将高位右移2位,和二进制111比较,相同则取3个字节
- // 截取5个字节
- $count = 3;
- }else if(($high>>6) === 0x3){ // 将高位右移2位,和二进制11比较,相同则取2个字节
- // 截取6个字节
- $count = 2;
- }else if(($high>>7) === 0x0){ // 将高位右移2位,和二进制0比较,相同则取1个字节
- $count = 1;
- }
- // echo '$count='.$count.'<br />';
- $res .= substr($str,$offset,$count); // 取出一个字符与$res字符串连接
- $chars += 1; // 截取到的字符数+1
- $offset += $count; // 截取高位偏移量向后移$count字节
- }
- return $res;
- }
- echo utf8sub($str,100);
Tags: 正确 解析 UTF-8
相关文章
- ·php解析mht文件转换成html的实例(2018-08-08)
- ·php 检测是否为utf-8还是gb2312编码(2014-07-10)
- ·php字符串截取函数,支持中文 utf-8截取(2014-09-19)
- ·完美的2个php检测字符串是否是utf-8编码函数分享(2021-03-25)
- ·php实现utf-8转unicode函数分享(2021-05-05)
推荐文章
热门文章
最新评论文章
- 写给考虑创业的年轻程序员(10)
- PHP新手上路(一)(7)
- 惹恼程序员的十件事(5)
- PHP邮件发送例子,已测试成功(5)
- 致初学者:PHP比ASP优秀的七个理由(4)
- PHP会被淘汰吗?(4)
- PHP新手上路(四)(4)
- 如何去学习PHP?(2)
- 简单入门级php分页代码(2)
- php中邮箱email 电话等格式的验证(2)