由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
WaterWorld版 - 语言学分析:韩寒与韩仁均作品分离度高达90%
相关主题
韩寒作品语言学分析--转自天涯曹长青这篇质疑的比较合理吧
苏杰文本侦察学发现:《儿子韩寒》作者非韩仁均回顾:韩寒的化学试卷
复旦古籍所苏杰博士:《三重门》作者身份的语言学分析【韩寒记不清他的作品顺序】
苏杰:《三重门》作者身份的语言学分析(代笔门终于可以了结了) 来源: 杨昉的日志署名“韩寒”的作品语言指纹鉴定结果汇总 —- 作者:石毓智
为什么蝴蝶和屎壳郎不能成为朋友----正面回应方舟子(zz)PSU访问学者破破的桥:韩寒代笔探讨:强质疑、弱质疑、和忽悠
一个简单方法测试韩寒是否作假。 (转载)尼玛这得多低的智商还会相信是小韩寒写的三重门
其实HH最大的漏洞声讨韩老贼,欺世13载(ZT)
人造韩寒之 父替子答从质疑到揭骗---韩寒14岁发表的《小镇生活》(转发)
相关话题的讨论汇总
话题: 作品话题: 韩寒话题: 韩仁均话题: 分离话题: 三重门
进入WaterWorld版参与讨论
1 (共1页)
D*******a
发帖数: 1723
1
语言学分析:韩寒与韩仁均作品分离度高达90%
2012-03-07 09:55:03 来源: 网易读书
韩寒的七本书(包括《三重门》)和韩仁均的作品(11万字)的平均分离度高于90%;
而韩寒自身作品之间的平均分离度只有30%。因此,韩寒绝大部分作品(包括《三重门
》)的作者不是韩仁均是显著的。
语言学分析:韩寒与韩仁均作品分离度高达90%
注解1:”频率“ - 16万字(和《三重门》等长)中该此出现的次数。
注解2:分析材料。(2.1)《三重门》和韩仁均作品的分析结果来自苏杰。(2.2)韩
寒的7本书是在网上所找到的韩寒的全部长篇作品。另外两本《通稿2003》和《就这么
漂来漂去》只有两万字左右,篇幅太短,未作分析。(2.3)非韩氏作品例子是从挑战
者@中国商军 的例子中随机取样的。
注解3:分析方法。(3.1)核心技术的韩寒5词文学指纹(谁知-光-这人-没想到-不幸
)是由苏杰提取的。
(3.2)每个词分离度(韩寒 VS韩仁均)最大额度分配如下:反类:30%,“谁知”;
零类:20%, “光”,“这人”,“不幸”;大小类:10%,“没想到”。韩寒自身作
品比对,因只有大小类,故每个词分离度最大额度均为20%。(3.3)每一个指纹词频率
差1-4时,分离度为0%;5-8时为该词分离度最大额度之半,9为该词分离度最大额度。
所以,若5个指纹词的频率差都10以上则分离度是100%。这是以12为基数的数值,此数
值和基数成正比。注意这100%是分离度相对指数,并非绝对的概率置信度。
结论:
1)韩寒的七本书(包括《三重门》)和韩仁均的作品(11万字)的平均分离度高于90%
;而韩寒自身作品之间的平均分离度只有30%。因此,韩寒绝大部分作品(包括《三重
门》)的作者不是韩仁均是显著的。
2)苏杰提出的韩寒5词文学指纹-(这人,光,不知道,谁知,不幸)不仅能有效地分
辨韩寒和韩仁均的作品,还能分辨他们与其他小说家的作品。其他小说家的作品比对《
三重门》和韩仁均的作品,分离度也接近80%。
3)苏杰提出的韩寒5词文学指纹,是从《三重门》和韩仁均的作品(11万字)提取的。
如果说5词文学指纹对《三重门》而言,苏杰有边射箭边画靶子凑数据之嫌疑,那么《
三重门》之外的六部韩寒的作品对于该指纹完全是一个随机的抽样,从而验证了该指纹
的有效性、敏感性和可靠性。
1 (共1页)
进入WaterWorld版参与讨论
相关主题
从质疑到揭骗---韩寒14岁发表的《小镇生活》(转发)为什么蝴蝶和屎壳郎不能成为朋友----正面回应方舟子(zz)
老赵会客厅中方舟子自相矛盾逻辑混乱一个简单方法测试韩寒是否作假。 (转载)
我的父亲韩仁均以及他的作品其实HH最大的漏洞
韩寒“代笔”的直接证据--润涛阎人造韩寒之 父替子答
韩寒作品语言学分析--转自天涯曹长青这篇质疑的比较合理吧
苏杰文本侦察学发现:《儿子韩寒》作者非韩仁均回顾:韩寒的化学试卷
复旦古籍所苏杰博士:《三重门》作者身份的语言学分析【韩寒记不清他的作品顺序】
苏杰:《三重门》作者身份的语言学分析(代笔门终于可以了结了) 来源: 杨昉的日志署名“韩寒”的作品语言指纹鉴定结果汇总 —- 作者:石毓智
相关话题的讨论汇总
话题: 作品话题: 韩寒话题: 韩仁均话题: 分离话题: 三重门