php实现中文字符截取防乱码方法汇总
发布:smiling 来源: PHP粉丝网 添加日期:2021-05-25 11:23:38 浏览: 评论:0
直接使用PHP函数substr截取中文字符可能会出现乱码,主要是substr可能硬生生的将一个中文字符“锯”成两半。那么我们来看看如何解决这个问题呢。
大家在自己的程序中相信都会经常用到截取字符串吧,但是往往遇到截取中文字符串的时候会遇到乱码的问题。很是让人头疼,接下来介绍两种方法防止截取中文字符串的时候出现乱码的问题。
首先第一种,自己写好的一个函数方便使用
利用这个函数截取就不会出现乱码了。
- /**
- * 支持中文字符串截取
- */
- function msubstr($str, $start=0, $length, $charset="utf-8", $suffix=true){
- switch($charset){
- case 'utf-8':$char_len=3;break;
- case 'UTF8':$char_len=3;break;
- default:$char_len=2;
- }
- //小于指定长度,直接返回
- if(strlen($str)<=($length*$char_len)){
- return $str;
- }
- if(function_exists("mb_substr")){
- $slice= mb_substr($str, $start, $length, $charset);
- }else if(function_exists('iconv_substr')){
- $slice=iconv_substr($str,$start,$length,$charset);
- }else{
- $re['utf-8'] = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|[\xe0-\xef][\x80-\xbf]{2}|[\xf0-\xff][\x80-\xbf]{3}/";
- $re['gb2312'] = "/[\x01-\x7f]|[\xb0-\xf7][\xa0-\xfe]/";
- $re['gbk'] = "/[\x01-\x7f]|[\x81-\xfe][\x40-\xfe]/";
- $re['big5'] = "/[\x01-\x7f]|[\x81-\xfe]([\x40-\x7e]|\xa1-\xfe])/";
- preg_match_all($re[$charset], $str, $match);
- $slice = join("",array_slice($match[0], $start, $length));
- }
- if($suffix)
- return $slice;
- return $slice;
- }
第二种是php内置的一个函数mb_substr函数
指定要截取的字符串的编码格式,就能有效的防止出现乱码了。
说明:
- string mb_substr ( string $str , int $start [, int $length [, string $encoding ]] )
- <?php
- function substr_unicode($str, $s, $l = null) {
- return join("", array_slice(
- preg_split("//u", $str, -1, PREG_SPLIT_NO_EMPTY), $s, $l));
- }
- $str = "Büyük";
- $s = 0; // start from "0" (nth) char
- $l = 3; // get "3" chars
- echo substr($str, $s, $l) ."\n";
- echo mb_substr($str, $s, $l) ."\n";
- echo substr_unicode($str, $s, $l);
- ?>
Tags: php中文字符截取防乱码
- 上一篇:php恢复数组的key为数字序列的方法
- 下一篇:php自定义hash函数实例
推荐文章
热门文章
最新评论文章
- 写给考虑创业的年轻程序员(10)
- PHP新手上路(一)(7)
- 惹恼程序员的十件事(5)
- PHP邮件发送例子,已测试成功(5)
- 致初学者:PHP比ASP优秀的七个理由(4)
- PHP会被淘汰吗?(4)
- PHP新手上路(四)(4)
- 如何去学习PHP?(2)
- 简单入门级php分页代码(2)
- php中邮箱email 电话等格式的验证(2)