php实现中文字符串截取各种问题

时间:2023-03-08 23:50:30
php实现中文字符串截取各种问题

用php截取中文字符串会出现各种问题,做一简单汇总,文中的问题暂时还未解决,有大神解决了问题欢迎指教

 <?php

 header('Content-Type:text/html;charset=utf-8');//页面采用utf-8编码
//header('Content-Type:text/html;charset=gbk');//页面采用gbk编码 /**
* 实现中文截取无乱码
* @param $str:要截取的字符串
* @param $start:开始位置
* @param $length:截取长度
* @return null|string
*/
/*
测试失败
第一个函数:中文字符串截取会乱码
*/
/*
function GbSubstring($string,$start,$length){
if(strlen($string)>$length){
$str=null;
$len=$start+$length; for($i=$start;$i<$len;$i++){
if(ord(substr($string,$i,1))>0Xa0){
$str.=substr($string,$i,2);
$i++; }else{
$str.=substr($str,$i,1);
}
}
return $str.'....';
}else{
return $string;
} } $str1= GbSubstring('哈哈哈你好啊啊',1,3);
echo $str1;
*/ /*
第二个函数测试成功
*/
/**
* 适用utf-8
* @param $str
* @param int $start
* @param $length
* @param string $charset
* @param bool|true $suffix
* @return string|void
*/
/*
function msubstr($str, $start=0, $length, $charset="utf-8", $suffix=true)
{
if(function_exists("mb_substr"))
return mb_substr($str, $start, $length, $charset);
elseif(function_exists('iconv_substr')) {
return iconv_substr($str,$start,$length,$charset);
}
$re['utf-8'] = "/[x01-x7f]|[xc2-xdf][x80-xbf]|[xe0-xef][x80-xbf]{2}|[xf0-xff][x80-xbf]{3}/";
$re['gb2312'] = "/[x01-x7f]|[xb0-xf7][xa0-xfe]/";
$re['gbk'] = "/[x01-x7f]|[x81-xfe][x40-xfe]/";
$re['big5'] = "/[x01-x7f]|[x81-xfe]([x40-x7e]|xa1-xfe])/";
preg_match_all($re[$charset], $str, $match);
$slice = join("",array_slice($match[0], $start, $length));
if($suffix) return $slice."…";
return $slice;
} echo msubstr('哈哈哈你好啊啊',1,3);
*/ /*
第三个函数:测试出错
*/
/**
* @param $string
* @param $start
* @param $length
* @return string
*/
/*
function substr2($string, $start, $length)
{
$len = strlen($string);
if($len > $length)
{
$str = '';
$len1 = $start + $length; //截取到原字符串的位置
for($i=$start; $i<$len1; $i++)
{
if(ord(substr($string, $i, 2)) > 0xa0) //在ASCII中,0xa0表示汉字的开始
{
$str.=substr($string, $i, 2);
$i++;
}
else
{
$str.=substr($string, $i, 1);
}
}
return $str.'...';
}
else
{
return $string;
}
}
echo substr2('哈哈哈你好啊啊',1,3);
*/ /*
第四个函数:测试出错
*/
/*
function chinesesubstr($str, $start, $len){
$tmpstr=null;
$strlen = $start + $len;
for($i=0; $i<$strlen; $i++){
if(ord(substr($str, $i, 1)) > 0xa0){
$tmpstr .= substr($str, $i, 2);
$i++;
}else{
$tmpstr .= substr($str, $i, 1);
}
}
return $tmpstr;
}
$str = '哈哈哈你好啊啊';
echo chinesesubstr($str, 1,4);
*/ /*
系统函数mb_substr测试成功
*/
echo mb_substr('哈哈哈你好啊啊',1,4,"utf-8"); ?>