由买买提看人间百态

topics

全部话题 - 话题: iconv
1 (共1页)
e***y
发帖数: 1152
1
来自主题: BuildingWeb版 - php iconv() 问题
$str 是一个长度未知、混合含有gb2312和big5的字串,可否通过iconv()转换为一致编码的字串,
要么gb2312,要么big5
例如:$str='简体繁體'
m*****k
发帖数: 1864
2
来自主题: BuildingWeb版 - php iconv() 问题
我怀疑是不行。iconv怎么能知道哪个是繁体哪个是简体。
不过,并不是繁体字就一定是big5啊?
e***y
发帖数: 1152
3
来自主题: BuildingWeb版 - php iconv() 问题
有道理。我碰到的问题是这样:我在学习DOMDocument抓网页,碰到一些中文网站混合
了简繁体时经常出现问题,如下例:
$raw = file_get_contents('http://bbs.wenxuecity.com/ktv');
$html = new DOMDocument();
$html->loadHtml( $raw );
echo $html->saveHTML();
?>
网页抓不全,报错
input conversion failed due to input error, bytes 0x8F ...
检查之后经常发现是因为网页中某处含有非法字符(繁体也会)。如果在loadHtml之前
,插入:
$str = iconv('gb2312', 'gb2312//IGNORE', $raw);
网页通常可以抓下来,但是所有繁体字符被silently drop.
这个问题有解吗?
网页可以代换为: http://bbs.wenxuecity.com/{ktv, music, cooking, etc}
s*******n
发帖数: 730
4
我的wd mybook world 硬盘上的linux系统
没有iconv,也没有locale,是arm的cpu
怎么才能把这些装上啊。有一个optware的包管理
顺便问一下。我用它备份文件到amazon s3。
文件都是windows下建立的,所以文件名都是utf-8是吧?
这个linux系统貌似默认编码是ISO 8859-1,在ruby里看到的
如果ruby读文件,不转换编码。存到amazon不会乱吧。
a*******s
发帖数: 295
5
来自主题: Unix版 - tough! help! expert needed!
I searched "iconv" But I am not sure which one is the desired.
that's why I tryed libiconv .
Where can I find the iconv package needed?
what files will this package copy to the system?
Thanks.
BTW, seems I have a executable named iconv in /sbin directory. Is this
the one we want?
a**y
发帖数: 335
6
来自主题: SanFrancisco版 - php问题求救--悬赏100包子...:)
情况:
有一个sql server 2005 express database, 建了一个odbc给php用
开始完全正常,后来发现sqlserver 2005里的中文在php下面没法正确解码
sqlserver里的中文Column是nvarchar类型,在asp.net下面用UTF-8显示完全正常。
在php下面返回的都是??????
试了好多次iconv, 无一成功,有些不再返回??????但也是乱码
比如:
echo $row["Title"];
echo iconv('UCS-2LE', 'UTF-8', $row["Title"]);
正确的方式应该是怎么样啊?
谢谢了
r**********d
发帖数: 510
7
来自主题: BuildingWeb版 - php DOM parse 中文乱码问题
我请教一个问题。
我想把 http://q.stock.sohu.com/app2/rpsholder.up?code=&sd=2013-7-13&ed=&type=date&dir=1&p=1
上的数据用 php DOM parse, 然后写道数据库中。 但
sohu encoding是gbk, php dom parse 后的encoding是ascii, 我 百度的很多, 试了
一些方法,都不能显示。
我现在只希望能在mysql 用utf8 ecoding 里显示中文。 然后我用 csmar数据做一些分
析。
各位大牛请指点迷津。我叮当包子相报。
$con = mysql_connect($host, $user, $pass);

if (!$con) {
echo "Could not connect to server\n";
trigger_error(mysql_error(), E_USER_ERROR);
} else {
echo "Connection established\n";
}
$ok = mysql_select_d... 阅读全帖
b*********n
发帖数: 1258
8
【 以下文字转载自 Programming 讨论区 】
发信人: babyfacenan (黑土), 信区: Programming
标 题: 请教:如何用Java get URL content是.swe并且是utf-16 encoding的文件
发信站: BBS 未名空间站 (Tue Mar 4 01:46:50 2008)
url指向一个 .swe 文件,这个.swe文件是utf-16的
用less看不了,要用iconv 从 utf-18 转换成 utf-8才能用less看
我用了java URL class, url.openStream()等等来get content
complain 是什么http error 400 之类的
试了一下别的url,没问题,就是这个url报error
不过这个url本生肯定也没问题,url指向的.swe文件用firefox打得开
我用了perl的http request, userAgent, 加上
`iconv -f utf-16 -t utf-8` 就可以把content弄下来
并且存成一个less可以看得了的文件
也不知道我有没有把
N****w
发帖数: 21578
9
用 ls , xargs, mv, iconv 写个命令把所有文件从 utf8 改成 gbk
该怎么写?
iconv 这牙的只认 stdin stdout

u
t**y
发帖数: 15
10
贡献一个用iconv把gbk转UTF8的script. 没好好研究过,但是好象觉得现在的好多东西
都是在下载和寸盘是按你LOCAL的编码转换寸的.
#/bin/sh
## this script convert all file under current dir from gbk to utf
rm -f tmp1 tmp2 tmp3 tmp4.sh
ls > tmp1
cat tmp1 |grep -v tmp1 | sed "s/^/\"/" | sed "s/$/\"/" > tmp2
iconv -f gbk -t utf8 tmp2 -o tmp3
paste tmp2 tmp3 > tmp4
cat tmp4 | sed "s/^/mv /" > tmp4.sh
chmod +x tmp4.sh
./tmp4.sh
rm -f tmp1 tmp2 tmp3 tmp4 tmp4.sh
o**e
发帖数: 26
11
来自主题: Linux版 - 转换encoding问题
好多不太常用的字好像认不出来
iconv -f gb2312 -t utf8 f.gb > f.utf
iconv: illegal input sequence at position 241
b*********n
发帖数: 1258
12
url指向一个 .swe 文件,这个.swe文件是utf-16的
用less看不了,要用iconv 从 utf-18 转换成 utf-8才能用less看
我用了java URL class, url.openStream()等等来get content
complain 是什么http error 400 之类的
试了一下别的url,没问题,就是这个url报error
不过这个url本生肯定也没问题,url指向的.swe文件用firefox打得开
我用了perl的http request, userAgent, 加上
`iconv -f utf-16 -t utf-8` 就可以把content弄下来
并且存成一个less可以看得了的文件
也不知道我有没有把问题描述清楚
哪位高手给帮帮忙吧,谢谢
D****r
发帖数: 309
13
来自主题: Programming版 - How to convert zipped text files to a ePub
我参考网上捣鼓了个小程序,请各位大侠指正:
我用的cygwin + iconv, ebook-convert.exe
先把zipped text file unzip to a directory.
------------
#!/bin/bash
# convert all txt files in current DIR into one ePub ---- by Donier
### Firstly convert all files into utf-8 charset ###
for f in *.txt
do
if test -f $f
then
echo -e "\nConverting $f"
CHARSET="$( file -bi "$f"|awk -F "=" '{print $2}')"
if [ "$CHARSET" != utf-8 ]
then
mv $f $f.old
iconv -f "$CHARSET... 阅读全帖
r**********d
发帖数: 510
14
来自主题: Programming版 - php DOM parse 中文乱码问题 (转载)
【 以下文字转载自 BuildingWeb 讨论区 】
发信人: rslgreencard (IS), 信区: BuildingWeb
标 题: php DOM parse 中文乱码问题
发信站: BBS 未名空间站 (Mon Jan 13 23:20:10 2014, 美东)
我请教一个问题。
我想把 http://q.stock.sohu.com/app2/rpsholder.up?code=&sd=2013-7-13&ed=&type=date&dir=1&p=1
上的数据用 php DOM parse, 然后写道数据库中。 但
sohu encoding是gbk, php dom parse 后的encoding是ascii, 我 百度的很多, 试了
一些方法,都不能显示。
我现在只希望能在mysql 用utf8 ecoding 里显示中文。 然后我用 csmar数据做一些分
析。
各位大牛请指点迷津。我叮当包子相报。
$con = mysql_connect($host, $user, $pass);

if (!$con) {
echo "Could n... 阅读全帖
a*******s
发帖数: 295
15
来自主题: Unix版 - tough! help! expert needed!
Hello, there
Have anyone successfully installed gvim in their machine?
I am keep trying. solved all the dependency except the following one:
[root@arrows root]# rpm -i gvim-gnome-6.1.212-4.i386.rpm
error: failed dependencies:
iconv is needed by gvim-gnome-6.1.212-4
I don't know what does this mean, I've already installed the
libiconv-1.8 and recompiled the gettext. I checked that
libiconv.so and iconv.h both there.
I don't understand what it requires for the install.
BTW, the environment
o***z
发帖数: 133
16
来自主题: Unix版 - tough! help! expert needed!
iconv is just different from libiconv
why didn't you install iconv?
h*******c
发帖数: 248
17
For Linux, I have this:
APE (& CUE) to FLAC tracks
You need the following packages:
* ffmpeg
* flac
* shntool
* cuetools
The following steps will convert a whole ape (with cue) to multiple flac
tracks: (assume the system locale is UTF-8, cue has GBK characters)
1. Convert cue to UTF-8: >$ cat orig.cue|iconv -f GBK -t UTF8 >cdimage.
cue
2. Convert ape to wav: >$ ffmpeg -vn -i cdimage.ape cdimage.wav
3. Split the wav and encode to flac: >$ shnsplit -f cdimage.cue -o flac -
N**********d
发帖数: 9292
18
来自主题: NewJersey版 - kindle到手啦,请教~~
$ iconv -f GBK -t UTF-8 INPUTFILE_NAME -o OUTPUTFILE_NAME
p*********w
发帖数: 23432
19
使用xetex直接由围棋棋谱文件创建pdf书籍zz
发信人: young (..), 信区: TeX
标 题: 使用xetex直接由围棋棋谱文件创建pdf书籍
发信站: 水木社区 (Thu Mar 13 21:54:40 2008), 站内
本人是一个围棋爱好者,这几天心血来潮,看到xe(la)tex 能够对中文字体提供原生的
支持,不由试了试,看能否由sgf(Smart Go Format)文件直接生成pdf文档。
由sgf制作 tex,历史上已经有人为之,一个很著名的包,sgf2tex,就能够完成类似功
能,该软件包经过完善,后来改名为sgf2dg,提供了更好、更强大的功能(好像应该与
时俱进得使用很好、很强大:P)。
我的系统是Debian lenny,安装了sgf2dg 4.026-9和texlive-xetex 2007.dfsg.1-2以
及一些个人比较喜欢的字库,转换工作就由此基础开始。
简要转换步骤如下:
1 使用iconv将sgf文件的文字内码由gbk转换成utf-8
2 使用sgf2dg将sgf文件转换成tex文件
3 在sgf文件中添加如下三行(在文件头部的任何
c********0
发帖数: 262
20
iconv -f gb18030 -t utf-8 your.txt > new.txt
J********a
发帖数: 5208
21
来自主题: Apple版 - 【请教】VLC 方块字
srt文件?
如果是的话用textwrangler转成UTF-8
或者
cat xxx.srt | iconv -f GBK -t UTF-8 > xxx-1.srt
m*****k
发帖数: 1864
22
来自主题: BuildingWeb版 - php iconv() 问题
convert成utf-8?
e***y
发帖数: 1152
23
来自主题: BuildingWeb版 - php iconv() 问题
问题解决。原网页中有语句,在*创建DOM对象前*必须删除。
g****z
发帖数: 1135
24
来自主题: BuildingWeb版 - php DOM parse 中文乱码问题
iconv('cp936', 'utf-8', $nodeValue);
不行吗?
t**d
发帖数: 6474
25

什么server?是不是server的模块不全? 我的lighttpd里面用ipkg list_installed显
示有如下模块安装。你的如果没有,就装上这些模块 (不一定要全装)。
expat - 2.0.1-1 - XML Parser library
fcgi - 2.4.0-2 - FastCGI is a language independent, scalable, open extension
to fontconfig - 2.5.0-0 -
freetype - 2.3.6-1 - Free truetype library
gconv-modules - 2.5-1 - Provides gconv modules missing from the firmware.
gdbm - 1.8.3-2 -
libcurl - 7.20.0-1 -
libdb - 4.2.52-3 - Berkeley DB Libraries
libgd - 2.0.35-5 -
libjpeg - 6b-3 - collection of jpeg tools
libpng - ... 阅读全帖
E*V
发帖数: 17544
26
来自主题: Linux版 - 继续批评 gentoo
不用,不过因我们要用汉字
USE要相应设一下
mine:
USE="X acl alsa amd64 avahi bzip2 cdr cjk cli consolekit cracklib crypt cups
dbus dri dvd fortran gdbm gnome gpm gtk hal iconv isdnlog java kde kpathsea
mdnsresponder-compat mmx mng mudflap multilib mysql ncurses nls nptl
nptlonly nsplugin opengl openmp pam pcre perl pppd python qt3 qt3support qt4
readline reflection session sockets socks5 spl sql sse sse2 ssl svg sysfs
tcpd unicode webkit xorg zlib" ALSA_CARDS="hda-intel" ALSA_PCM_PLUGINS="
adpcm alaw asym copy dmix
e****r
发帖数: 581
27
try iconv
y***u
发帖数: 5243
28
windows不是utf-8的,是cpxxx,windows自己的编码系统,中文大概是cp796?
linux看你lang怎么设置,一般都是en_US.UTF8了
x****u
发帖数: 44466
29
ft。。。
windows的code page也是开放标准。
N**********d
发帖数: 9292
30
简体中文用cp936吧
g**d
发帖数: 723
31
装一大堆跟gbk有关的就慢慢把dependance搞顶了.
N**********d
发帖数: 9292
32
用iconv转成utf8,一般就能看了
L***n
发帖数: 6727
33
用iconv转换编码先,一般是gb2312到utf-8
c**t
发帖数: 2744
34
没有RH Subscription,不能加repo,只好从源码编译PHP。
./configure --prefix=/usr/local --with-pdo-mysql --with-libdir=lib64 --
libdir=/usr/lib64 --enable-bcmath --enable-calendar --enable-exif --enable-
ftp --enable-mbstring --enable-soap --enable-zip --with-curl --with-freetype
-dir --with-gettext --with-iconv --with-jpeg-dir --with-kerberos --with-
mhash --with-mysql --with-mysqli --with-openssl --with-png-dir --with-regex
--with-xmlrpc --with-xsl --with-zlib-dir --with-config-file-path=/usr/local/
lib --with... 阅读全帖
n******t
发帖数: 4406
35
如果Linux,UNix下面的话,用iconv就很方便了.

u4eec
i*****o
发帖数: 1714
36
来自主题: Programming版 - u码转换中文
Try iconv
q*****g
发帖数: 1568
37
iconv, iconvmv
1 (共1页)