From: skhuang.bbs@csie.nctu.edu.tw (Shih-Kun Huang) Newsgroups: tw.bbs.comp.chinese,tw.bbs.lists Subject: Re: 1994 年 Big5 中文網路討論字頻統計 Date: 11 Mar 1995 02:42:39 GMT Moving-Windows (Purkinje.bbs@bbs.cis.nctu.edu.tw) 提到: : 段落 字數(出現比率) 使用字集(比率) : ------------------------------------------- : 常用: 134137146( 82.49%) 5401(100.00%) : 次常: 310814( 0.19%) 7652(100.00%) : 符號: 28163084( 17.32%) 913(100.00%) : ------------------------------------------- : 總共: 162611044(100.00%) 13966(100.00%) : 黃兄,這 162611044 應該是 13,053 個字的總頻率,不包括符號。 : 我用紙筆計算累積頻率得到的結果,就是 162611044。 : 等等,你該不會真的相信我用紙筆計算吧? 很慚愧, 程式錯了. 不過, 關於非符號字的統計還是正確的, 只有在符號字的加總上出錯, 並把非符號字總數誤為總字數. (常用字字數 = 總字數 - 次常用字數 - 符號字總數) 訂正如下: 段落 字數(出現比率) 使用字集(比率) ------------------------------------------- 常用: 162300230( 99.81%) 5401(100.00%) 次常: 310814( 0.19%) 7652(100.00%) ------------------------------------------- 總共: 162611044(100.00%) 13053(100.00%) ------------------------------------------- 常用: 162300230( 86.56%) 5401(100.00%) 次常: 310814( 0.17%) 7652(100.00%) 符號: 24891123( 13.27%) 913(100.00%) ------------------------------------------- 總共: 187502167(100.00%) 13966(100.00%) 其它非符號字的累積頻率統計仍然正確. 感謝 Purkinje 兄指正. -- Shih-Kun Huang EC638, CSIE, NCTU, Taiwan, R.O.C. Phone: 886-35-712121 (x54709)