由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
BuildingWeb版 - php iconv() 问题
相关主题
问一个关于charset的问题如何设置网页的语言?
[转载] 紧急求助 制作网页乱码的问题[转载]国外空间乱码显示问题的解决
apache中文问题。急!(不能修改httpd.conf)中文显示的问题
网页编码问题请教关于google搜索
asp论坛乱码怎么办动态网页一问
特菜的一个问题: 汉字页面的自动调用.一个简单的Javascript菜单制作的问题
用了META,为什么还是要选择Chinese才能看中文?table在IE7中显示不正常,何故?
再请教。Hostmonster中文乱码问题
相关话题的讨论汇总
话题: iconv话题: gb2312话题: php话题: 网页话题: 问题
进入BuildingWeb版参与讨论
1 (共1页)
e***y
发帖数: 1152
1
$str 是一个长度未知、混合含有gb2312和big5的字串,可否通过iconv()转换为一致编码的字串,
要么gb2312,要么big5
例如:$str='简体繁體'
m*****k
发帖数: 1864
2
我怀疑是不行。iconv怎么能知道哪个是繁体哪个是简体。
不过,并不是繁体字就一定是big5啊?
e***y
发帖数: 1152
3
有道理。我碰到的问题是这样:我在学习DOMDocument抓网页,碰到一些中文网站混合
了简繁体时经常出现问题,如下例:
$raw = file_get_contents('http://bbs.wenxuecity.com/ktv');
$html = new DOMDocument();
$html->loadHtml( $raw );
echo $html->saveHTML();
?>
网页抓不全,报错
input conversion failed due to input error, bytes 0x8F ...
检查之后经常发现是因为网页中某处含有非法字符(繁体也会)。如果在loadHtml之前
,插入:
$str = iconv('gb2312', 'gb2312//IGNORE', $raw);
网页通常可以抓下来,但是所有繁体字符被silently drop.
这个问题有解吗?
网页可以代换为: http://bbs.wenxuecity.com/{ktv, music, cooking, etc}
m*****k
发帖数: 1864
4
convert成utf-8?
e***y
发帖数: 1152
5
问题解决。原网页中有语句,在*创建DOM对象前*必须删除。
1 (共1页)
进入BuildingWeb版参与讨论
相关主题
Hostmonster中文乱码问题asp论坛乱码怎么办
打开网页全是乱码咋回事?特菜的一个问题: 汉字页面的自动调用.
如何强制PHP生成的网页utf-8用了META,为什么还是要选择Chinese才能看中文?
php DOM parse 中文乱码问题再请教。
问一个关于charset的问题如何设置网页的语言?
[转载] 紧急求助 制作网页乱码的问题[转载]国外空间乱码显示问题的解决
apache中文问题。急!(不能修改httpd.conf)中文显示的问题
网页编码问题请教关于google搜索
相关话题的讨论汇总
话题: iconv话题: gb2312话题: php话题: 网页话题: 问题