Re: 关于汉语语法的问题,我是这么看的 (转载)# AnthroLing - 人类学和语言学
p*r
1 楼
【 以下文字转载自 History 讨论区 】
发信人: pythonlover (pascal de chine), 信区: History
标 题: Re: 关于汉语语法的问题,我是这么看的
发信站: BBS 未名空间站 (Sat Dec 23 21:27:26 2006)
看来汉语不光比其他语言多用了语序,还在语音上又多利用了一个dimension。
结果就是效率远远超过其他语言。
多用语序,morphology就不用了。于是时态、语态、性数格要么没有(就是只能从上下
文和语境推得),要么靠
助词(了,过,还。。。),非常简单。
光这一点就使汉语比其他语言短很多。parallel corpus一般中英文的字节比在1:1.3以
下。而且这还是对中文
uniform encoding的结果(就是常用字和冷僻字用的字节一样多),而英文明显常用字
短很多。所以如果对中文
进行优化编码(例如五笔,最常用字就一个字母),还可以进一步缩小这个比例。
再加上语音上多一个dimension (tone) 和大量同音字,汉语单位长度能表达的意思实
在是比其他语言多太多了。
不过,反过来说,高效的汉
发信人: pythonlover (pascal de chine), 信区: History
标 题: Re: 关于汉语语法的问题,我是这么看的
发信站: BBS 未名空间站 (Sat Dec 23 21:27:26 2006)
看来汉语不光比其他语言多用了语序,还在语音上又多利用了一个dimension。
结果就是效率远远超过其他语言。
多用语序,morphology就不用了。于是时态、语态、性数格要么没有(就是只能从上下
文和语境推得),要么靠
助词(了,过,还。。。),非常简单。
光这一点就使汉语比其他语言短很多。parallel corpus一般中英文的字节比在1:1.3以
下。而且这还是对中文
uniform encoding的结果(就是常用字和冷僻字用的字节一样多),而英文明显常用字
短很多。所以如果对中文
进行优化编码(例如五笔,最常用字就一个字母),还可以进一步缩小这个比例。
再加上语音上多一个dimension (tone) 和大量同音字,汉语单位长度能表达的意思实
在是比其他语言多太多了。
不过,反过来说,高效的汉