电光石火电光石火

陌晴博客
ilkhome.cn

关于PHP字符编码的函数区别

在以前的学习当中,比方说有一次的写采集过程中转换字符的编码的时候老是失败,转换的结果总没有完全输出,后来经过网络查询得知是iconv有一个“-”漏洞,所以我们有必要掌握PHP的另一个字符编码函数mb_convert_encoding。



mb_convert_encoding函数为php内部多字节字符串编码转换函数,可以在有需要的使用场合(如:解决在GB2312编码环境下使用Ajax产生的中文字乱码的问题)方便进行编码转换,以解决网页乱码的问题,使用非常方便,效率非常高,几乎支持所有编码。PHP 4 >= 4.0.6、PHP 5 版本支持。



      函数原型

/**

* 多字节字符串编码转换函数

*

* @param string str 需要进行编码转换的字符串

* @param string to_encoding 指定转换为某种编码,如:gb2312、gbk、utf-8等

* @param mixed from_encoding 混合指定原来字串的编码,如:同时指定 JIS, eucjp-win, sjis-win 混合编码

* @return string

*/

string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )



      使用举例


1、把 GBK 编码字串转换成 UTF-8 编码字串

header("content-Type: text/html; charset=Utf-8");      
echo mb_convert_encoding("你是我的好朋友", "UTF-8", "GBK");  

2、把 UTF-8 编码字串转换成 GB2312 编码字串

// 注意将此文件存盘成 utf-8 编码格式文件再测试    

header("content-Type: text/html; charset=gb2312");      
echo mb_convert_encoding("你是我的好朋友", "gb312", "utf-8");   

  3、对整个页面进行转换

       该方法适用所有编码环境。这样把前128个字符以外(显示字符)的字符集都用 NCR(Numeric character reference,如“汉字”将转换成“汉字”这种形式)来表示,这样的编码在任意编码环境下页面都能正常显示。

       在php文件的头部加上下面三行代码:

mb_internal_encoding("gb2312");   // 这里的gb2312是你网站原来的编码    
mb_http_output("HTML-ENTITIES");    
ob_start('mb_output_handler');  



 使用mb_convert_encoding 函数需启用PHP 的mbstring (multi-byte string)扩展。

  如果没有没有开启php的mbstring扩展,则需要做如下设置,让php支持该扩展。

  1、windows 服务器环境

       编辑 php.ini 文件,将; extension=php_mbstring.dll 前面的 ; 去掉,重启网页服务器。

  2、Linux服务器环境

       在编译配置时加入 –enable-mbstring=cn 编译参数,再进行PHP的编译安装。


另外有一种区别说法是

1、mb_convert_encoding() 该函数会根据内容自动识别编码,但是执行效率比iconv差;
2、然后有一种说法就是iconv()在一些字符转换下会不正常,网上有种说法就是:发现iconv在转换字符”—”到gb2312时会出错,如果没有ignore参数,所有该字符后面的字符串都无法被保存。不管怎么样,这个”—”都无法转换成功,无法输出。 另外mb_convert_encoding没有这个bug.
3、mb_convert_encoding()是PHP扩展函数,要开启扩展库才能用;而iconv是PHP内置函数,不需另外开启扩展库就可以使用。
4、一般情况下用 iconv,只有当遇到无法确定原编码是何种编码,或者iconv转化后无法正常显示时才用mb_convert_encoding 函数.


本博客所有文章如无特别注明均为原创。作者:似水的流年
版权所有:《电光石火》 => 关于PHP字符编码的函数区别
本文地址:http://ilkhome.cn/index.php/archives/190/
欢迎转载!复制或转载请以超链接形式注明,文章为 似水的流年 原创,并注明原文地址 关于PHP字符编码的函数区别,谢谢。

评论