为什么[\u4e00-\u9fa5]不能匹配中文

用php的preg_match()函数匹配中文的时候，
匹配规则这么写，

$rule ='/[\u4e00-\u9fa5]/';

编译出错，说不知道\u，
该怎么办？
php怎么匹配utf-8编码的中文和gb2312编码的中文？？

9 个解决方案

#1

/[\x{4e00}-\x{9fa5}]/u
字符串需要unicode

#2

gbk 和 utf-8是不一样的...utf-8很轻松的就可以匹配了...

#3

测试了一下，
匹配出来时乱码。

	
function pregCh($test){
		$rule ='/[\x{4e00}-\x{9fa5}]/u';
		preg_match($rule,$test,$result);
		return $result;
	}
	$test ='asfasdhs中afhajs90中文8327849023';
	var_dump(pregCh($test));

输出结果是
array(1) { [0]=> string(3) "涓�" }
页面编码是utf-8
为什么呢？

#4

你的php文件自身是gbk编码
或者charset没有设为utf-8

#5

你的php文件不是utf-8编码

#6

该回复于2013-04-03 16:18:32被版主删除

#7

哦，
确实是啊，
我用过的是notepad++
设置格式为utf-8,
结果匹配到的是乱码，
接了个header('Content-type:text/html;charset=utf-8');
就好了，
编辑器搞得是毛啊

#8

谁让你要所谓“国际化”呢？
中国第一！gbk 无所不能

#9

引用 8 楼 xuzuning 的回复:

谁让你要所谓“国际化”呢？
中国第一！gbk 无所不能

版主批评的是

#1

/[\x{4e00}-\x{9fa5}]/u
字符串需要unicode

#2

gbk 和 utf-8是不一样的...utf-8很轻松的就可以匹配了...

#3

测试了一下，
匹配出来时乱码。

	
function pregCh($test){
		$rule ='/[\x{4e00}-\x{9fa5}]/u';
		preg_match($rule,$test,$result);
		return $result;
	}
	$test ='asfasdhs中afhajs90中文8327849023';
	var_dump(pregCh($test));

输出结果是
array(1) { [0]=> string(3) "涓�" }
页面编码是utf-8
为什么呢？

#4

你的php文件自身是gbk编码
或者charset没有设为utf-8

#5

你的php文件不是utf-8编码

#6

该回复于2013-04-03 16:18:32被版主删除

#7

哦，
确实是啊，
我用过的是notepad++
设置格式为utf-8,
结果匹配到的是乱码，
接了个header('Content-type:text/html;charset=utf-8');
就好了，
编辑器搞得是毛啊

#8

谁让你要所谓“国际化”呢？
中国第一！gbk 无所不能

#9

引用 8 楼 xuzuning 的回复:

谁让你要所谓“国际化”呢？
中国第一！gbk 无所不能

版主批评的是

秒客网

为什么[\u4e00-\u9fa5]不能匹配中文

9 个解决方案

#1

#2

#3

#4

#5

#6

#7

#8

#9

#1

#2

#3

#4

#5

#6

#7

#8

#9

相关文章