From: skhuang.bbs@csie.nctu.edu.tw (Shih-Kun Huang)
Newsgroups: tw.bbs.comp.chinese,tw.bbs.lists
Subject: Re: 1994 年 Big5 中文網路討論字頻統計
Date: 11 Mar 1995 02:42:39 GMT

Moving-Windows (Purkinje.bbs@bbs.cis.nctu.edu.tw) 提到:
:   段落  字數(出現比率)       使用字集(比率)
:   -------------------------------------------
:   常用: 134137146( 82.49%)   5401(100.00%)
:   次常:    310814(  0.19%)   7652(100.00%)
:   符號:  28163084( 17.32%)    913(100.00%)
:   -------------------------------------------
:   總共: 162611044(100.00%)  13966(100.00%)
: 黃兄,這 162611044 應該是 13,053 個字的總頻率,不包括符號。
: 我用紙筆計算累積頻率得到的結果,就是 162611044。
: 等等,你該不會真的相信我用紙筆計算吧?

很慚愧, 程式錯了. 不過, 關於非符號字的統計還是正確的, 
只有在符號字的加總上出錯, 並把非符號字總數誤為總字數.
(常用字字數 = 總字數 - 次常用字數 - 符號字總數)
訂正如下:
段落  字數(出現比率)       使用字集(比率)
-------------------------------------------
常用: 162300230( 99.81%)   5401(100.00%)
次常:    310814(  0.19%)   7652(100.00%)
-------------------------------------------
總共: 162611044(100.00%)  13053(100.00%)

-------------------------------------------
常用: 162300230( 86.56%)   5401(100.00%)
次常:    310814(  0.17%)   7652(100.00%)
符號:  24891123( 13.27%)    913(100.00%)
-------------------------------------------
總共: 187502167(100.00%)  13966(100.00%)

其它非符號字的累積頻率統計仍然正確.
感謝 Purkinje 兄指正.
--
Shih-Kun Huang
EC638, CSIE, NCTU, Taiwan, R.O.C. Phone: 886-35-712121 (x54709)