p***o 发帖数: 1252 1
mit是用gb2312编码的,你拿utf-8解码可不都是乱码么 ...
改成 print response.decode('gb2312').encode('utf-8') 再说
w*****s 发帖数: 122 2
Can I use GB2312?
Maybe. A conforming XML processor must support UTF-8 and UTF-16 (Unicode). But XML can be encoded using almost
any character set. It is the parser-writer's decision which encodings to support.
Outside the XML processor, the document is encoded in GB2312 (e.g. the EUC encoding of GB2312 and ASCII, also
called cn-euc);
Inside the XML system, the document is encoded as ISO10646. (ISO10646 is the character set that Java uses. It is
the same character set as Unicode.
c**********e 发帖数: 236 3
zz:
我倾向于 gb2312
我现在用的是英文 2000,可除了界面的“开始”变成“Start”这样的微小变化外其他东
西用起来没有感到任何差别,刚装完 2000 的时候随便去一个国内网站他就会问你是否要
装简体中文,点了是,安一下,连 IE 都不用重新打开就可以直接看中文了,英文系统看
中文是如此简单,换成繁体系统看简体应该没有任何差别的,不可能会出现看不了或者乱
码的情况。
UTF-8 的同屏显示多语种确实是个很有意思的新玩意,不过毕竟是后来的,只要用就得成
天考虑兼容问题,况且很少需要 UTF-8 的特性:我用简体中文写东西,看的人一般系统
里只有简体中文或者安个简体中文就可以看了,永远不会出现一个倭文或者韩文,那么
UTF-8 还有用的必要了吗?
XML 和 DVD
这些非常好的东西,推行了很多年也无法成为“缺省配置”,恩,对,GB2312 之于
UTF-8,正如同 VCD 之于 DVD:DVD 好是好,可目前几乎所有的软件还都是用 650MB 的
光盘发行,一台家用电脑可以读不了 DVD,但绝对不可以读不了普通的光盘,否则连装个
系统启动起来都很困难。
http://www
N****w 发帖数: 21578 4
到目前为止,用的都是 GB2312 locale, 输入的都是Gb2312 文件名.
Samba 倒也能转换, Windows 下看到没问题
发现有个从网上抓下来的 dir tree 用的都是 UTF8 的, 不知道怎么回事
偶咋办呢...
f**u 发帖数: 559 8
最近在看看RSS和BLOG,发现许多中文的BLOG已经开始用UTF-8码了.
这样和GB2312相比,有什么好处吗? 我现在用的RSS view
好象对这些编码不能自动判断. //ft.
c***c 发帖数: 21374 9
还是gb2312好一些
win98+IE5.0在阅读utf-8的页面的时候会有一些问题
a*******e 发帖数: 3021 10
i am old-fashioned so i stick to gbk or gb18030 since i am using both
windows and linux.
another issue is most bt downloads are encoded on windows by gb2312, so if u
use utf on linux, u need to convmv... troublesome...
N****w 发帖数: 21578 11
不行, 偶 gb2312 的文件实在太多了
还是继续硬挺着...
s******u 发帖数: 247 12
比如这个mitbbs的网页,我怎么print都是乱码呢?
谁给指点一下?谢谢。代码如下:
import os
import sys
import urllib2
import cookielib
import codecs
url= 'http://www.mitbbs.com/article_t/Programming/31237353.html '
cj = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
# add a fake UA
opener.addheaders = [('User-Agent', 'Mozilla/5.0 (compatible; MSIE 9
.0; Windows NT 6.1; Trident/5.0)')]
urllib2.install... 阅读全帖
c*****m 发帖数: 1160 13
用 python3,程序修改成:
import os
import sys
import urllib
import http.cookiejar
import codecs
url= 'http://www.mitbbs.com/article/Programming/31238113_0.html '
cj = http.cookiejar.CookieJar()
opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cj))
# add a fake UA
opener.addheaders = [('User-Agent', 'Mozilla/5.0 (compatible; MSIE 9.0;
Windows NT 6.1; Trident/5.0)')]
urllib.request.install_opener(opener)
request = urllib.request.Request(url)
response = opener.open(request).read()
... 阅读全帖
D****g 发帖数: 2860 14
FreeBSD 4.6, x86,装好了XFree86.中文字体也没有问题.装好了自带的Chinput 2.1
在.cshrc里面也设了locale:
setenv LANG zh_CN.GB2312
setenv LC_ALL zh_CN.GB2312
setenv CHARSET GB2312
setenv XMODIFIERS "@im=Chinput"
locale命令的输出也没有问题:
[*^_^*://braveheart/home/lg]locale
LANG=zh_CN.GB2312
LC_CTYPE="zh_CN.GB2312"
LC_NUMERIC="zh_CN.GB2312"
LC_TIME="zh_CN.GB2312"
LC_COLLATE="zh_CN.GB2312"
LC_MONETARY="zh_CN.GB2312"
LC_MESSAGES="zh_CN.GB2312"
LC_PAPER="zh_CN.GB2312"
LC_NAME="zh_CN.GB2312"
LC_ADDRESS="zh_CN.GB2312"
LC_TELEPHONE="zh_CN.G
g****d 发帖数: 3461 15
有没有装字体?
试试下面这个命令:
xlsfonts | grep song
我的机器上出这个:
-isas-fangsong ti-medium-r-normal--16-160-72-72-c-160-gb2312.1980-0
-isas-fangsong ti-medium-r-normal--16-160-72-72-c-160-gb2312.1980-0
-isas-song ti-medium-r-normal--16-160-72-72-c-160-gb2312.1980-0
-isas-song ti-medium-r-normal--16-160-72-72-c-160-gb2312.1980-0
-isas-song ti-medium-r-normal--24-240-72-72-c-240-gb2312.1980-0
-isas-song ti-medium-r-normal--24-240-72-72-c-240-gb2312.1980-0
或者,你用Web能看中文,就说明有字体。
在konsole下,选
Settings->Edit Current Pro
A*******i 发帖数: 31 16
大家好。我用hostmonster买了空间和域名建了自己的网站,没有购买独立IP(dedicate
d IP)。
英文网页可以显示,中文网页是乱码,大家知道怎么弄吗?
在HTML语句里面,我已经强行将coding从ISO-8859-1改成UF-8或者GB2312,可是中文还
是乱码。
在用网站http://validator.w3.org/detailed.html 验证我的网页html语言的时候,总是
用ISO-8859-1编码,完全不理会我在HTML语句的命令。
我的目录下有个.htaccess文件,
我改了
AddDefaultCharset GB2312
DefaultLanguage zh-cn
AddDefaultCharset none
AddDefaultCharset Off
AddLanguage zh-cn .cn
AddCharset gb2312 .html
AddCharset gb2312 .htm
IndexOptions Charset=GB2312
都没有用,请问有谁在hostmonster遇到类似的问题,怎么解决的?
f****a 发帖数: 28 17
呵呵,那只是一个中文terminal啦。
我需要的是在CDE任意窗口下能正常显示中文的方法:(
其实,我用的是x-win32远程登陆到学校的sun server的。
刚才google了一下,下载了一个far east的中文支持包,号称是只要在x-win32的
font里加上它就可以了,试了试,不成:(
在server的/usr/openwin/lib/font/locale/里面没有发现zh目录;
运行了xlsfonts -display mypc.ip:0 | grep gb2312;
系统信息:
wangz-2-% xlsfonts -display 139.13.209.183:0 | grep gb2312
-isas-fangsong ti-medium-r-normal--0-0-72-72-c-0-gb2312.1980-0
-isas-fangsong ti-medium-r-normal--16-160-72-72-c-160-gb2312.1980-0
-isas-song ti-medium-r-normal--0-0-72-72-c-0-gb2312.1980-
A*******i 发帖数: 31 18
大家好。我用hostmonster买了空间和域名建了自己的网站,没有购买独立IP(dedicate
d IP)。
英文网页可以显示,中文网页是乱码,大家知道怎么弄吗?
在HTML语句里面,我已经强行将coding从ISO-8859-1改成UF-8或者GB2312,可是中文还
是乱码。
在用网站http://validator.w3.org/detailed.html 验证我的网页html语言的时候,总是
用ISO-8859-1编码,完全不理会我在HTML语句的命令。
我的目录下有个.htaccess文件,
我改了
AddDefaultCharset GB2312
DefaultLanguage zh-cn
AddDefaultCharset none
AddDefaultCharset Off
AddLanguage zh-cn .cn
AddCharset gb2312 .html
AddCharset gb2312 .htm
IndexOptions Charset=GB2312
都没有用,请问有谁在hostmonster遇到类似的问题,怎么解决的?
M******t 发帖数: 309 19
php/apache
我在php 的output里面加了
但是用IE浏览还是乱码,必须改encoding才能出现汉字
如果我在php.ini里面
将
default_mimetype = "text/html"改为
default_mimetype = "text/html; charset=gb2312"
就一切正常,汉字自动显示,encoding自动为gb2312
问题是这样一来,即使是英文的网页也成了gb2312
我们学校的服务器上面也安装了php,我用phpinfo()来看,default_mimetype='text/html'
但是汉字显示一点问题都没有。
那位大侠给看看怎么才能做到像学校一样?
g******e 发帖数: 352 20
试着用python urlopen 获取mitbbs的页面
Windows下,没有再加encode, decode
遇到一个奇怪的问题,有些帖子的页面抓下来没问题,
但有些帖子的页面获取到的就是乱码,如果用chardet来检测,也检测不出
是什么编码 (返回None). 而那些能正常抓下来的页面,则chardet会正确返回
gb2312
如果加上content.encode('gb2312').encode(type)
就报错'gb2312' codec can't decode bytes in position 1-2: illegal multibyte
sequence
mitbbs所有页面应该都是gb2312编码呀,
有哪位大牛给看看问题出在哪里,谢谢,有包子答谢
l**n 发帖数: 7272 25
http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
http://www.w3.org/1999/xhtml">
http://gmpg.org/xfn/11">
音乐快递:【最好不相见】仓央嘉措诗 - 由没有期待发表 - 文学城
阅读全帖
d****n 发帖数: 5 27
(1)Java works internally with Unicode, so when compiling source code files
that used a Chinese encoding such as Big5 or GB2312, you need to specify the
encoding to the compiler in order to properly convert it to Unicode.
javac -encoding big5 sourcefile.java
or
javac -encoding gb2312 sourcefile.java
(2)If you read chinese chars from a file or database, most likely it is gb2312
or big5 encoding, then you have to map them to Unicode.
j******y 发帖数: 1143 28
受不了了,你个BSO狂!!!!
我输入了你个命令,出现以下字符
-isas-fangsong ti-medium-r-normal--16-160-72-72-c-160-gb2312.1980-0
-isas-song ti-medium-r-normal--16-160-72-72-c-160-gb2312.1980-0
-isas-song ti-medium-r-normal--24-240-72-72-c-240-gb2312.1980-0
我的KONSOLE里面没有你说的选项啊。我搞不懂他倒底是用啥版本的LINUX,都用
CONFIGURE,好象跟法语结合了。
不如你跟我说说怎么在Irix下编译cxterm,设font path,那好象比较好玩啊。
s**e 发帖数: 2543 30
何伯的回答:
发信人: ylsdd (河伯), 信区: sysop
标 题: Re: 3K,小微请考虑支持藏文输入
发信站: BBS 未名空间站 (Thu Mar 22 15:45:05 2007), 转信
这个技术上很难的,因为有文字编码的障碍。telnet 终端通常支持 gb2312/gbk 编码
,但不支持 utf-8/gb18030 编码。所以 bbs 内部都是用 gb2312/gbk 编码保存资料的
。然而 gb2312/gbk 编码并不包含藏文。如果改用 gb18030 保存资料,telnet 下大体
兼容原来的格式,程序大概不用多改,但是现在很多浏览器并不支持 gb18030,特别是
美国的读者。如果改用 utf-8,www 比较方便,然而 telnet 下需要进行复杂的换码,
动态转换为 gbk,程序改动太大,而且最后负载也会很高。所以两种方法都难以行得通
。第三种方法是指望用户都采用支持 utf-8 的终端,但显然用户没有这个动力。
d*****l 发帖数: 8441 33
前一阵有不少网友要我批判方舟子,据他们说,方舟子自称是中文互联网的先驱,创办
了世界上第一份中文网络文学刊物《新语丝》。我当时一笑置之。美国前副总统戈尔自
称是互联网先驱,经常被美国电视脱口秀和政客作为笑话讲,只要谁说自己发明了互联
网,台下肯定是会意的哄堂大笑。方舟子如果真这么说了,就是贻笑大方。所以,我没
有理会网友们的多次请求。
但今天突然在网上看到方舟子题为《互联网的力量》的演讲记录,时间地点是2010年11
月20日互联网年会。这个演讲的大部分内容是方舟子自称为互联网“恐龙”级人物、中
文网络先驱。方舟子称ACT是“第一个中文的网络”,他在上面跟人掐架,后来ACT之类
被淘汰,1996年,他办了新语丝网站,搞了个论坛,其简历居然确确实实地自封为“中
文互联网先驱”。真是这样吗?
我是1990年秋季到美国明尼苏达大学物理系的。到后,找系里的教授要了一个EMAIL账
号,用陈旧的VAX终端与各地的同学联络。大概一年后,在计算机系的机房获得了账号
,开始可以使用UNIX工作站。其后,我同时在计算机系攻读学位,所以,对互联网的那
段历史我是亲历者。期间,我与其他中国同学一样,都在互联... 阅读全帖
e**i 发帖数: 1983 36
http://news.backchina.com/comments-189695-gb2312.html
原文新闻评论呈两个极端,挺薄反温和挺温反薄。挺薄反温部分评论如下:
[2楼的游客](74.99.x.x) 发表于 2012/4/1 06:16
what about 习近平女儿的奖学金?
[3楼的游客](72.84.x.x) 发表于 2012/4/1 06:29
why only afternoon bo was turned down, all the scandals start sufacing?
[6楼的游客](174.115.x.x) 发表于 2012/4/1 06:34
胡瘟看看自己的屁股吧。
[7楼的游客](50.99.x.x) 发表于 2012/4/1 06:36
把他是金主的证据拿出来。
[8楼的游客](204.197.x.x) 发表于 2012/4/1 06:59
中国一般公务员、银行高级职员等都能供子女留学,欧美名牌大学也都有奖学金,薄瓜
瓜留学有啥希奇?难不成薄熙来的工资只够自己吃穿,连平头百姓都不如?
[9楼的游客](96.255.x.x) 发表于 20... 阅读全帖
e****1 发帖数: 136 37
LOL
▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂
发信人: Diaz (Diaz), 信区: Military
标 题: 薄熙来的糜烂生活:把男女演员请到家里 表演床戏
发信站: BBS 未名空间站 (Fri Sep 7 16:29:29 2012, 美东)
http://news.backchina.com/viewnews-211519-gb2312.html
▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂
发信人: Math1978 (数学), 信区: Military
标 题: Re: 薄熙来的糜烂生活:把男女演员请到家里 表演床戏
发信站: BBS 未名空间站 (Fri Sep 7 16:36:08 2012, 美东)
文革时批判贺龙的材料说贺龙空运活鱼,为了保证鱼不死还要输氧气。
那时候觉得这新生资产阶级分子真可恶,后来知道其他的中央领导也都这样,腊肉尤其
如此。
现在光知道薄熙来干这事,将来你会知道,所有的政治局委员都这么干。
▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂... 阅读全帖
k********k 发帖数: 5617 39
http://news.backchina.com/viewnews-239618-gb2312.html
撒切尔夫人晚年疾病缠身 丈夫离世无比失落(图)
京港台时间:2013/4/9 消息来源:中国日报网站 网友评论 2 条
如果不是他的姓氏,马克•撒切尔无论是再婚,还是被通缉,人们不会太注
意。但他是英国前首相撒切尔夫人的儿子,一切就不一样了。2008年3月 29日,赤道几
内亚发出了全球通缉令 捉拿马克,这个西非国家的总检察长何塞•奥洛•
奥博诺气恼地说:“我们有证据,4年前他在我国煽动了一场未遂的政变。可我问过国
际刑警组织,没有人知道他现在在哪里。”
话音刚落,英国记者就在西班牙的太阳海岸发现了满不在乎的马克。“我实在不知
道赤道几内亚还能拿我怎样。”他拍拍记者的肩膀:“还是说说好事情吧,我结婚了,
就在两天前,在英属直布罗陀的一个政府办事处里,是秘密婚礼。”
“撒切尔夫人不知道你再婚?”
“哦,你登报了,她就知道了。”
第二天,马克远在瑞士的姐姐卡罗尔看见了报道,她气急败坏地赶回伦敦陪伴撒切
尔夫人:“母亲的身体每况愈下,我这个不争气... 阅读全帖