Redian新闻
>
语言学分析:韩寒与韩仁均作品分离度高达90%
avatar
语言学分析:韩寒与韩仁均作品分离度高达90%# WaterWorld - 未名水世界
D*a
1
语言学分析:韩寒与韩仁均作品分离度高达90%
2012-03-07 09:55:03 来源: 网易读书
韩寒的七本书(包括《三重门》)和韩仁均的作品(11万字)的平均分离度高于90%;
而韩寒自身作品之间的平均分离度只有30%。因此,韩寒绝大部分作品(包括《三重门
》)的作者不是韩仁均是显著的。
语言学分析:韩寒与韩仁均作品分离度高达90%
注解1:”频率“ - 16万字(和《三重门》等长)中该此出现的次数。
注解2:分析材料。(2.1)《三重门》和韩仁均作品的分析结果来自苏杰。(2.2)韩
寒的7本书是在网上所找到的韩寒的全部长篇作品。另外两本《通稿2003》和《就这么
漂来漂去》只有两万字左右,篇幅太短,未作分析。(2.3)非韩氏作品例子是从挑战
者@中国商军 的例子中随机取样的。
注解3:分析方法。(3.1)核心技术的韩寒5词文学指纹(谁知-光-这人-没想到-不幸
)是由苏杰提取的。
(3.2)每个词分离度(韩寒 VS韩仁均)最大额度分配如下:反类:30%,“谁知”;
零类:20%, “光”,“这人”,“不幸”;大小类:10%,“没想到”。韩寒自身作
品比对,因只有大小类,故每个词分离度最大额度均为20%。(3.3)每一个指纹词频率
差1-4时,分离度为0%;5-8时为该词分离度最大额度之半,9为该词分离度最大额度。
所以,若5个指纹词的频率差都10以上则分离度是100%。这是以12为基数的数值,此数
值和基数成正比。注意这100%是分离度相对指数,并非绝对的概率置信度。
结论:
1)韩寒的七本书(包括《三重门》)和韩仁均的作品(11万字)的平均分离度高于90%
;而韩寒自身作品之间的平均分离度只有30%。因此,韩寒绝大部分作品(包括《三重
门》)的作者不是韩仁均是显著的。
2)苏杰提出的韩寒5词文学指纹-(这人,光,不知道,谁知,不幸)不仅能有效地分
辨韩寒和韩仁均的作品,还能分辨他们与其他小说家的作品。其他小说家的作品比对《
三重门》和韩仁均的作品,分离度也接近80%。
3)苏杰提出的韩寒5词文学指纹,是从《三重门》和韩仁均的作品(11万字)提取的。
如果说5词文学指纹对《三重门》而言,苏杰有边射箭边画靶子凑数据之嫌疑,那么《
三重门》之外的六部韩寒的作品对于该指纹完全是一个随机的抽样,从而验证了该指纹
的有效性、敏感性和可靠性。
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。