从统计数字看尖团合流的危害
本站多次提到:尖团音是汉语里的重要发音(方法)。有多重要呢?国家语委等一些研究机构对汉字的使用频度有过统计,但资料并不公开,我们只能根据网上搜集到的零星资料,推算如下。
1.清华大学对6763个汉字在一定的文字资料里出现的频率做了统计(含一级汉字3755个、二级汉字3008个,资料总字数为86405823),发现:使用频度最高的500字,覆盖面为78.53%,以此类推,列表如下:
字数 | 覆盖率(%) |
---|---|
500 | 78.53202 |
1000 | 91.91527 |
1500 | 96.47563 |
2000 | 98.38765 |
2500 | 99.24388 |
3000 | 99.63322 |
3500 | 99.82015 |
4000 | 99.91645 |
4500 | 99.96471 |
5000 | 99.98633 |
5500 | 99.99553 |
6000 | 99.99901 |
6479 | 100.00000 |
剩余244个汉字没在选定的文字资料里出现过。
2.小学生的识字要求是2500字,这个数字不是随便定的,根据就是类似上表这样的统计:2500个常用字可以满足99%以上的读写需求。而我们日常说话,基本上不会超出这2500个常用字(方言字除外)。
3.根据百度文库的《3500汉字频度表》,我统计出前2500字里共有255个团音字(占比高达10.2%)、177个尖音字(占比高达7.08%);团音字使用频率之和为8.22%、尖音字使用频率之和为5.74%,尖团音使用频率总和为13.96%。而我估计在实际生活中,尖团音使用频率要在15%以上。
口语和书面语存在明显区别,主要区别是口语更简练、更随便,比如《3500汉字频度表》里排名第一的“的”字(频率高达4.126%),在口语里远用不了这么多。例如:
他(的)人品好。
这谁家(的)孩子啊?
甲:就这样定吧? 乙:好(的)
()里的字可用可不用,但口语中明显比书面语用得少。
再如“一”、“是”、“什”、“么”、“吗”等字,口语里省略或简化的情况很多,如:
来(一)碗面吧?
这(是)啥?【口语中多数方言都说“啥”而不说“什么”】
你也去(吗)?
更重要的是,书面语中的双音节词占比远高于口语,比如:口语“你要想清啊”在书面语里可能就变成了“你要考虑清楚啊”。
这些差别大大稀释了尖团音所占的比例,书面中尖团音的比例就将近14%,那么口语中估计在15%以上。
在尖团合流的情况下,等于把近6%的字音取消了,又因为尖音并入团音而导致近9%的语音受到污染,一共影响了15%的字音,这对汉语是何其严重的损害!如果完全按现行拼音方案说话,那么每100个字有15个字得靠猜,害人啊!