原帖由 3_141592653589 于 2013-9-20 11:56 发表
QUOTE:
英语有20个元音和20个辅音,所以英语的声音种类最多不会超过20×20=400个
可英语就不一样了:英语可没有规定必须要先元音后辅音,一个单词里面里面也可以有好多个辅音,他直接20×20算什么?一个单词中一个片段的发音种类?
你这个理解有问题,主贴说的是声音种类,不是单词数目,比如I,YOU都是一个音,OUT就是2个音,虽然可能有少数例外,但是20X20=400是没有问题的,而且还有大量音根本没有使用,实际数目可能比400还低
举个例子:假设有一个仅会发两种声音的人,具体地讲,他就会发a和b两个音。根据电脑的理论,我们知道,他用这两个符号依然可以表达整个世界。再假设,世界上仅有400种事物需要表达,那么,一个英国人可以用每一个发音来表达400种事物中的一件,因为他有400个发音,而仅会发两个声音的人,有时就不得不用9个发音来表达400种事物中的一件,因为2的9次方才大于400。
比如,英国人用‘I’代表‘我’而仅会两个声音的人可能要用abbababba代表‘我’这个概念。比较两者就会看出,仅会两个声音的人,不但表达得慢,而且还费力气。在表达‘我’这个概念的时候,英国人使用0.25秒的时间,而仅会两个声音的人使用了2.25秒。如果两个人总以这样的比例生活一辈子,他们一生中所享受到的所有信息将是它的反比9∶1。
这个理论从信息学的角度看也是有问题的。
通俗的说,我可以优化编码,让短的编码来表达常见的意思。比如我这个意思,只用a来表达。
从信息的角度看,2元编码和9元编码直接所谓的信息9:1完全是胡扯。这位应该完全没学过信息论。
你这是编码优化,但是发明语言的人并没有用最优编码,所以无法严格按照最优编码的方式计算,虽然2元编码和9元编码实际使用起来语速无法达到9:1,但是5:1左右应该是没有问题的