在 PHP 中,处理多字节字符(如 UTF-8 编码的字符)时,可以使用以下字符串函数:
mb_strlen
:此函数用于获取字符串的长度,支持多字节字符。参数为字符串和编码类型(默认为 “UTF-8”)。$str = "你好,世界!";
$length = mb_strlen($str, "UTF-8");
echo $length; // 输出 6
mb_substr
:此函数用于截取字符串,支持多字节字符。参数为字符串、起始位置和截取长度,以及编码类型(默认为 “UTF-8”)。$str = "你好,世界!";
$substring = mb_substr($str, 0, 3, "UTF-8");
echo $substring; // 输出 你好
mb_strtolower
:此函数用于将字符串转换为小写,支持多字节字符。参数为字符串和编码类型(默认为 “UTF-8”)。$str = "你好,世界!";
$lowercase = mb_strtolower($str, "UTF-8");
echo $lowercase; // 输出 你好,世界!
mb_strtoupper
:此函数用于将字符串转换为大写,支持多字节字符。参数为字符串和编码类型(默认为 “UTF-8”)。$str = "你好,世界!";
$uppercase = mb_strtoupper($str, "UTF-8");
echo $uppercase; // 输出 你好,世界!
mb_split
:此函数用于根据指定的分隔符拆分字符串,支持多字节字符。参数为分隔符、字符串和编码类型(默认为 “UTF-8”)。$str = "你好,世界!";
$parts = mb_split(",", $str, "UTF-8");
print_r($parts); // 输出 Array ( [0] => 你好 [1] => 世界! )
在使用这些函数时,请确保 PHP 安装包含了多字节字符串支持的扩展(mbstring
)。可以通过 php.ini
文件启用或禁用该扩展。要启用 mbstring
扩展,请取消以下行的注释(或添加该行,如果不存在):
extension=mbstring