PHP中截取中文乱码解决办法

如果ascii码大于0xa0就是半个汉字；了解substr()、mb_substr()、ord()。现在常用的编码格式是utf8,gbk,gbk2312,big5。gbk是gbk2312的升级。现在我开发中遇到的基本都是utf8，gbk常用在论坛bbs上。今天自己写了下utf8的，测试下还说的过去，毕竟从网上拷下来的是可以用，但是如果有时间最好还是自己写一下，这样只有到自己手里的才是自己的。
最简的就是利用
例子 1
代码如下复制代码
输出：
world!
例子 2
英文的话没有问题，但是中文就出问题了，下面我们使用mb_substr函数处理。
/**
*—————————————————————————————————————–
*php有一个mbstring扩展库可以用(有朋友面试php的时候还被问到过这个问题哦),但是 *
一般的服务器都没打开php_mbstring.dll,需要在
*php.ini里把php_mbstring.dll打开,如果没有权限的话就只有联系你的isp了。
*因为mb_string的效率高一些，所以我们先检查一下mb_string是否可以用:
*—————————————————————————————————————–
*/
代码如下复制代码
if(function_exists(‘mb_string’))
{
mb_substr($string,$start,$length,$encoding);
//other codes here
}
else mysubstr($string,$start,$length);// 调用自己的函数
?>
首先定义自己的函数
代码如下复制代码
$length)
{
$str=”;
$len=$start+$length;
for($i=$start;$i{
if(ord(substr($string,$i,1))>0xa0)
{
$str.=substr($string,$i,2);
$i++;
}
else{ $str.=substr($string,$i,1);}
}
return $str.’…’;
}
else{ return $string;}
}
还有一个问题要注意，使用这种方法的时候，你的
标签对里的charset只有设成中文的编码才可以，如gbk,gb2312。下面自己常用的一个中英文字符截取函数
自定义截取中文字符串函数，基本上就是仿照mb_substr写个函数，直接调用罢了，以下为我找到的代码，其实很简单
代码如下复制代码
=161))          //是汉语
        {
            $start_index+=2;
        }
        else                                          //是英文
        {
            $start_index+=1;
        }
    }
    $chr_index=$start_index;
    //截取
    for ($i=0;$i    {
        $asc=ord($str_input{$chr_index});
        if ($asc>=161)
        {
            $return_str{$i}=chr($asc);
            $return_str{$i+1}=chr(ord($str_input{$chr_index+1}));
            $len+=1; //结束条件加1
            $i++;    //位置偏移量加1
            $chr_index+=2;
            continue;
        }
        else
        {
            $return_str{$i}=chr($asc);
            $chr_index+=1;
        }
    }
    return trim($return_str);
}//end of substr_cn
?>
http://www.bkjia.com/phpjc/632151.htmlwww.bkjia.comtruehttp://www.bkjia.com/phpjc/632151.htmltecharticle如果ascii码大于0xa0就是半个汉字；了解substr()、mb_substr()、ord()。现在常用的编码格式是utf8,gbk,gbk2312,big5。gbk是gbk2312的升级。现在我开发中遇...

PHP中截取中文乱码解决办法_PHP教程

VIP推荐