php中出现中文字符截取防乱码如何解决?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。
首先第一种,自己写好的一个函数方便使用
利用这个函数截取就不会出现乱码了。
/**
* 支持中文字符串截取
*/
function msubstr($str, $start=0, $length, $charset="utf-8", $suffix=true){
switch($charset){
case 'utf-8':$char_len=3;break;
case 'UTF8':$char_len=3;break;
default:$char_len=2;
}
//小于指定长度,直接返回
if(strlen($str)<=($length*$char_len)){
return $str;
}
if(function_exists("mb_substr")){
$slice= mb_substr($str, $start, $length, $charset);
}else if(function_exists('iconv_substr')){
$slice=iconv_substr($str,$start,$length,$charset);
}else{
$re['utf-8'] = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|[\xe0-\xef][\x80-\xbf]{2}|[\xf0-\xff][\x80-\xbf]{3}/";
$re['gb2312'] = "/[\x01-\x7f]|[\xb0-\xf7][\xa0-\xfe]/";
$re['gbk'] = "/[\x01-\x7f]|[\x81-\xfe][\x40-\xfe]/";
$re['big5'] = "/[\x01-\x7f]|[\x81-\xfe]([\x40-\x7e]|\xa1-\xfe])/";
preg_match_all($re[$charset], $str, $match);
$slice = join("",array_slice($match[0], $start, $length));
}
if($suffix)
return $slice;
return $slice;
}
第二种是php内置的一个函数mb_substr函数
指定要截取的字符串的编码格式,就能有效的防止出现乱码了。
说明
string mb_substr ( string $str , int $start [, int $length [, string $encoding ]] )
<?php
function substr_unicode($str, $s, $l = null) {
return join("", array_slice(
preg_split("//u", $str, -1, PREG_SPLIT_NO_EMPTY), $s, $l));
}
$str = "Büyük";
$s = 0; // start from "0" (nth) char
$l = 3; // get "3" chars
echo substr($str, $s, $l) ."\n";
echo mb_substr($str, $s, $l) ."\n";
echo substr_unicode($str, $s, $l);
?>
看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注亿速云行业资讯频道,感谢您对亿速云的支持。
亿速云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。