z*********e 发帖数: 10149 | 1 "如果两个系统具有同样大的消息量,如一篇用不同文字写的同一文章,由于汉字的信
息量较大,中文文章应用的汉字就比英文文章使用的字母要少。所以汉字印刷的文章要
比其他应用总体数量少的字母印刷的文章要短。即使一个汉字占用两个字母的空间,汉
字印刷的文章也要比英文字母印刷的用纸少。"
https://zh.wikipedia.org/wiki/%E7%86%B5_(%E4%BF%A1%E6%81%AF%E8%AE%BA)
以前咋没想到过呢? |
c******n 发帖数: 16666 | 2 一个很大的因素就是汉语很多词是表意
表音的语言 感觉要么就和用拉丁语来做scientific name一样不断叠加 结果越来越长
要么就和日语韩文那样用相近的词来凑对 结果越来越看不懂 |
r*******r 发帖数: 2565 | 3 这个不是早就研究过了,同样的文章,中文读起来比英文快的多,然后做阅读理解成绩
更好 |
p*****h 发帖数: 1369 | 4 中文是二维码
字母语言是一维的
【在 z*********e 的大作中提到】 : "如果两个系统具有同样大的消息量,如一篇用不同文字写的同一文章,由于汉字的信 : 息量较大,中文文章应用的汉字就比英文文章使用的字母要少。所以汉字印刷的文章要 : 比其他应用总体数量少的字母印刷的文章要短。即使一个汉字占用两个字母的空间,汉 : 字印刷的文章也要比英文字母印刷的用纸少。" : https://zh.wikipedia.org/wiki/%E7%86%B5_(%E4%BF%A1%E6%81%AF%E8%AE%BA) : 以前咋没想到过呢?
|
k***n 发帖数: 1557 | 5 中国人当然读中文比英文快得多,不用研究也知道
【在 r*******r 的大作中提到】 : 这个不是早就研究过了,同样的文章,中文读起来比英文快的多,然后做阅读理解成绩 : 更好
|
H********g 发帖数: 43926 | 6 除了是二维码之外,中文长期以刻在竹子上的古文为标准,美学标准是简洁明快。西人
的一些文章以用复杂句式为荣,就算实际长度不长,用词不很偏僻,也要费一定的时间
解码。 |
s**x 发帖数: 7506 | 7 汉字少但笔画复杂,所以应该是表达同样信息,用的油墨总量应该是个常数。 |
a9 发帖数: 21638 | 8 英文真是个傻X的语言,处理什么都需要buffer。
比如听交通信息,一般是说
车祸 车动不了 on xxx
你就得buffer每条交通信息,要不然听到你感兴趣的路的时候,你根本记不起来发生了
什么。是不是要选择绕行。
【在 z*********e 的大作中提到】 : "如果两个系统具有同样大的消息量,如一篇用不同文字写的同一文章,由于汉字的信 : 息量较大,中文文章应用的汉字就比英文文章使用的字母要少。所以汉字印刷的文章要 : 比其他应用总体数量少的字母印刷的文章要短。即使一个汉字占用两个字母的空间,汉 : 字印刷的文章也要比英文字母印刷的用纸少。" : https://zh.wikipedia.org/wiki/%E7%86%B5_(%E4%BF%A1%E6%81%AF%E8%AE%BA) : 以前咋没想到过呢?
|
c*****m 发帖数: 1160 | 9 很早就有这个说法吧,当时说的是联合国六大语言发同一个法令,汉子的本子总是最薄
的。 |
l***y 发帖数: 4671 | 10 这都是什么伪科学?怎么比较的?拿汉字跟字母数比?还是比总笔画数?笔画的总线条
长度?
【在 z*********e 的大作中提到】 : "如果两个系统具有同样大的消息量,如一篇用不同文字写的同一文章,由于汉字的信 : 息量较大,中文文章应用的汉字就比英文文章使用的字母要少。所以汉字印刷的文章要 : 比其他应用总体数量少的字母印刷的文章要短。即使一个汉字占用两个字母的空间,汉 : 字印刷的文章也要比英文字母印刷的用纸少。" : https://zh.wikipedia.org/wiki/%E7%86%B5_(%E4%BF%A1%E6%81%AF%E8%AE%BA) : 以前咋没想到过呢?
|
|
|
H********g 发帖数: 43926 | 11 What kind pseudoscience is it? How are they compared? To compare counts of
Chinese characters with that of letters? Or to compare total strokes? Total
lengths of the strokes?
【在 l***y 的大作中提到】 : 这都是什么伪科学?怎么比较的?拿汉字跟字母数比?还是比总笔画数?笔画的总线条 : 长度?
|
H********g 发帖数: 43926 | 12 比相同字号下的印刷长度比较合理。还可以拿两个译本,各请1000个英语母语和汉语母
语的人来读,取二者的耗时做统计比较。
【在 l***y 的大作中提到】 : 这都是什么伪科学?怎么比较的?拿汉字跟字母数比?还是比总笔画数?笔画的总线条 : 长度?
|
l***y 发帖数: 4671 | 13 语言学中的确有比较口语的时长的,即单位时间的信息量。文字不容易比较。
Total
【在 H********g 的大作中提到】 : What kind pseudoscience is it? How are they compared? To compare counts of : Chinese characters with that of letters? Or to compare total strokes? Total : lengths of the strokes?
|
H********g 发帖数: 43926 | 14 由于汉字词汇视觉特征很强,很容易找到一大段文字里面的特征词汇,直接猜出来这段
说了啥,所谓一目十行。
不知道英语母语的人能不能这样。
【在 l***y 的大作中提到】 : 语言学中的确有比较口语的时长的,即单位时间的信息量。文字不容易比较。 : : Total
|
d********f 发帖数: 43471 | 15 这个还要研究,别的不看就说中文=chinese,这字母语言就已经篇幅翻倍了,而且中文
不需要空格
【在 z*********e 的大作中提到】 : "如果两个系统具有同样大的消息量,如一篇用不同文字写的同一文章,由于汉字的信 : 息量较大,中文文章应用的汉字就比英文文章使用的字母要少。所以汉字印刷的文章要 : 比其他应用总体数量少的字母印刷的文章要短。即使一个汉字占用两个字母的空间,汉 : 字印刷的文章也要比英文字母印刷的用纸少。" : https://zh.wikipedia.org/wiki/%E7%86%B5_(%E4%BF%A1%E6%81%AF%E8%AE%BA) : 以前咋没想到过呢?
|
z*********e 发帖数: 10149 | 16 老兄,建议你看看随便哪本信息论教材的第一章,信息怎么度量的
【在 l***y 的大作中提到】 : 这都是什么伪科学?怎么比较的?拿汉字跟字母数比?还是比总笔画数?笔画的总线条 : 长度?
|
B**r 发帖数: 2109 | 17 中文还有大量成语,使用起来几个字起到一个索引的作用,可以有效压缩信息。
【在 z*********e 的大作中提到】 : "如果两个系统具有同样大的消息量,如一篇用不同文字写的同一文章,由于汉字的信 : 息量较大,中文文章应用的汉字就比英文文章使用的字母要少。所以汉字印刷的文章要 : 比其他应用总体数量少的字母印刷的文章要短。即使一个汉字占用两个字母的空间,汉 : 字印刷的文章也要比英文字母印刷的用纸少。" : https://zh.wikipedia.org/wiki/%E7%86%B5_(%E4%BF%A1%E6%81%AF%E8%AE%BA) : 以前咋没想到过呢?
|
r****z 发帖数: 12020 | 18 bus 公共汽车
car 小汽车
taxi 出租车
bike 自行车
curb 马路沿
gay 男同性恋
lab 实验室
why 为什么
we 我们
if 如果
id ?
......
【在 z*********e 的大作中提到】 : "如果两个系统具有同样大的消息量,如一篇用不同文字写的同一文章,由于汉字的信 : 息量较大,中文文章应用的汉字就比英文文章使用的字母要少。所以汉字印刷的文章要 : 比其他应用总体数量少的字母印刷的文章要短。即使一个汉字占用两个字母的空间,汉 : 字印刷的文章也要比英文字母印刷的用纸少。" : https://zh.wikipedia.org/wiki/%E7%86%B5_(%E4%BF%A1%E6%81%AF%E8%AE%BA) : 以前咋没想到过呢?
|
G*O 发帖数: 706 | 19 中文这么复杂的文字,真的是不容易学会
字母文字比中文好学多了(入门) |
l***y 发帖数: 4671 | 20 建议对信息论的教科书不要随便看看就觉得自己好像懂了。要不然你随便给我写一下英
文和中文的可以比较的信息熵的计算方法?跨语言比较信息熵不是那么容易的。
【在 z*********e 的大作中提到】 : 老兄,建议你看看随便哪本信息论教材的第一章,信息怎么度量的
|
|
|
l***y 发帖数: 4671 | 21 当然能。著名的打乱单词内的字母顺序但是不改变首尾字母不影响阅读的那个实验就证
明了字母语言的识别是以单词而不是字母为单位的。速读的时候也是整段扫关键字的,
而不是逐句读。一个成熟的交流方式下,交流的速度其实不是受语言制约的,而是由应
用决定。
具体谈到中文,语言和文字的一个巨大区别就是有效发音的种类远少于文字,继而因为
大量音调的简化,造成口语相对文字来说要大量使用组合词来避免歧义。同时普通话为
了容错(容纳各地口音),造成进一步的音节冗余。我们说话的方式,是在特定的应用
情况下,折中了效率和容错后的产物。各语言间区别不大。
而文字则与语言差异巨大,一般不做文种间的大跨度比较,因为很难定义一个一致性的
度量。比如说,汉字以单字,词组,部首还是笔画为基本单位?要不要按照频率和组合
方式做权重调整?英文按字母还是词根还是单词做基本单位?这些都会造成极大的差别
。所以一般而言都是同一应用条件下同一种语言的不同表达方式来做内部比较。
【在 H********g 的大作中提到】 : 由于汉字词汇视觉特征很强,很容易找到一大段文字里面的特征词汇,直接猜出来这段 : 说了啥,所谓一目十行。 : 不知道英语母语的人能不能这样。
|
l***y 发帖数: 4671 | 22 相同字号肯定不合理,因为英文可阅读的最小字号比中文小得多。最小行间距也不同。
另外,如果比印刷面积,sans serif的大写字母的最小可识别字号小很多,但是阅读速
度会显著降低。阅读速度和字体,字号,排版密切相关。再说译本的公平性:原版的语
言很重要;中英互译,原版的多半比译文要读起来速度快。内容更是关键。同一语境很
重要。阅读速度和理解程度又是两码事,评估交流要权衡速度和准确性,有很多指标。
总的来说,各种语言的效率是相当的,没有可靠的明显的差异。这其实是因为现代常见
语言都是完备语言,本身会随着应用而自发优化到语言本身不再是交流的制约因素。
其实一个很有意思的比较是通用语和方言或者通用语和专用语。后者效率往往显著的高
,代价是通用性降低。基本上越通用的语言,效率就越低。这反而是语言价值的一个指
标。高效的语言往往是狭隘无用的。
【在 H********g 的大作中提到】 : 比相同字号下的印刷长度比较合理。还可以拿两个译本,各请1000个英语母语和汉语母 : 语的人来读,取二者的耗时做统计比较。
|
l***y 发帖数: 4671 | 23 哪种语言没有成语?
【在 B**r 的大作中提到】 : 中文还有大量成语,使用起来几个字起到一个索引的作用,可以有效压缩信息。
|
r*******r 发帖数: 2565 | 24 你智力估计不太高,这个研究当然是请各国学生阅读母语材料比较的
【在 k***n 的大作中提到】 : 中国人当然读中文比英文快得多,不用研究也知道
|