Feb 27 Wed 2008 02:25 想學中文輸入法?就該學倉頡輸入法(一) 就目前最常見的中文輸入法而言, 使用人數最多的應該是「泛注音輸入法」, 所謂「泛注音輸入法」包括注音輸入法、新注音輸入法、自然輸入法……等, 因為中華民國的國語教育是以注音符號為教學基礎, 所以受過國語教育的人不需要學習別的技能就自然會使用「泛注音輸入法」。 反觀偽「中華人民共和國」的國語教育是以漢語拼音為教學基礎, 因此大陸同胞也不需要學習別的技能就自然會使用「拼音輸入法」。 漢字因為有太多的同音字, 所以用注音符號或漢語拼音字母來輸入某個讀音後, 電腦會出現很多候選字等待使用者選擇, 就這樣,輸入文字的速度被大大的拖累了! 儘管新注音輸入法、自然輸入法會依常見詞庫來自動幫使用者選好正確的詞語, 可以省去使用者必須反覆選字的麻煩, 但是使用者免不了還是必須自行更正輸入法軟體選錯的字, 而且如果不知道某個字的讀音時還需要查字典, 可以說相當的不方便! 於是,倉頡、行列、大易、嘸蝦米輸入法因應而生, 這些輸入法的好處是「不太」需要選字, 而且只要知道字怎麼寫就夠了!不需要理會字怎麼唸。 這四種輸入法的前三種,自 1980 年代以來都不行使專利權保護, 所以任何作業系統(不管是 Windows、Mac OS、Linux)內建的輸入法軟體, 想支援這三種輸入法的話,都不必另外付費給原本的發明人。 唯獨只有嘸蝦米輸入法,自 1989 年以來都行使專利權保護, 使用時必須由使用者另外取得輸入法軟體! (儘管嘸蝦米輸入法的專利權在 2003 年 11 月 11 日因未依限繳費,而使專利權消滅了! 但至今衍生出來的輸入法軟體並不多,大部份皆為免費但並不實用的對照表)。 在台販售的電腦鍵盤, 除了印有 37 個注音符號(位於各按鍵右上角), 以及二、三、四、輕聲(一聲直接按空白鍵完成組字)外, 還印有 26 個英文字母(位於各按鍵左上角)、 26 個倉頡字根(各對應一個英文字母,位於各按鍵左下角), 加上 46 個大易字根(位於各按鍵右下角;不過,筆記型電腦不一定有印), 所以,使用注音、倉頡、大易、嘸蝦米輸入字元時,可以直接看鍵盤來得知字根的位置, 而行列的字根位置則需要由使用者自行背誦、記憶。 嘸蝦米輸入法以 26 個英文字母為字根; 倉頡輸入法雖然有 26 個字根, 但「重」這個字根只有「零壹中文」和兼容「第五代倉頡」的輸入法軟體才有用到, 它最理想的情況是用來實現輸入所有漢字時,不會有重碼字的問題, 但因為使用「重」字根的時機(規則)太難理解, 比如:為何「未」的倉頡碼是「十木」,「宋」的倉頡碼是「重十木」,而不是顛倒過來? (也就是為何不是「宋」的倉頡碼取「十木」,「未」的倉頡碼取「重十木」?) 雖然「未」可能比「宋」常用,但有些重碼字的常用頻率並不是這麼好理解, 所以倚天中文及 Windows(Vista 除外)內建的倉頡輸入法軟體並不採用「重」字根, 以致造成輸入一萬三千多個 Big5 碼的漢字時, 仍有 1,034 個字會出現等待使用者選擇候選字的情況, 另外「難」字根沒有對應固定形狀的輔根, 所以也有人說倉頡輸入法只有 24 個字根。 對於行列輸入法及大易輸入法, 因為我涉獵不深,所以以下先輕輕帶過! 行列是 4 種字形輸入法裡,較好背誦的輸入法, 最懶的情況是只需背誦由它的 10 類基本筆形所衍生出來的 50 種基本輔根。 這 10 類基本筆形是: 1─;2└;3│;4+;5┐;6、;7ㄇ;8\;9/;0口 由於使用時常常需要將兩種筆形組合成一個較大的輔根來進行拆字, 所以為求打字打得快,有必要背誦它變化出來的所有輔根(約 250 種左右)。 一般常見的「行列 30」運用 1 下方的「Q A Z」, 一直到 0 下方的「P ; /」這三排的按鍵(共 30 鍵,所以稱為「行列 30」); Q 代表的代碼為 10∼14;A 代表的代碼為 15、1-;Z 代表的代碼為 16∼19, W 代表的代碼為 20∼24;S 代表的代碼為 25、2-;X 代表的代碼為 26∼29…依此類推。 (「-」代表只用它對應類別裡的基本筆形或基本輔根, 沒有搭配其他類別的基本筆形或基本輔根)。 例如:「土」這個字是由「4+」和「1─」組成的, 所以這個字的代碼為「41」,對應鍵盤上的「R」。 「口」這個字只由「0口」組成, 所以這個字的代碼為「0-」,對應鍵盤上的「;」。 「吉」字因為可以拆為「土」(41;對應「R」)和「口」(0-;對應「;」), 所以它的「組字字根」便是「R;」。 行列的缺點為拆字時需要從很細的形狀著手! 初學者如果不背下所有輔根的話, 在拆一個字時,需要在腦中分解、結合多次,才能決定按哪些鍵! 例如:要拆「調」字時,第一次大分解是將它分解為「言、ㄇ、土、口」, 第二次小分解是將「言」分為「、口」;「土」分為「十一」; 「ㄇ」(7-;對應「J」)、「口」(0-;對應「;」)已是完整的輔根,所以不必再分解。 第一次小結合是將「言」該取的「6、」及「0口」結合為「60」,對應「Y」; 將「土」該取的「4十」及「1一」結合為「41」,對應「R」; 最後大結合時,再將「言、ㄇ、土、口」對應的「Y J R ;」組合,然後出字! 另外,「; , . /」四個按鍵被定義為字根,不利作為全形標點符號的快速鍵。 大易用 46 個按鍵作為字根,本身就是一大敗筆! 不只手指要移動的範圍變大, 使用一般的筆記型電腦(鍵盤右邊沒有九宮格的鍵字鍵) 來輸入阿拉伯數字夾帶漢字的字串時, 必須在大易、英數兩種輸入法軟體之間反覆切換,徒增麻煩。 另外,它也有全形標點符號快速鍵的問題, 而且,它的輔根多達 250 個左右,也不容易初學者背誦。 它與嘸蝦米較為類似的一點是拆字時「有時」可以從「較大的形狀」著手, 這有利於初學者不必從細微處去思考要怎麼拆字, (例如:「米」部的字, 大易取「米」開頭,嘸蝦米取「M」開頭;倉頡卻要取「火木」開頭) 所以很多初學者會覺得大易和嘸蝦米雖然要背的輔根比較多, 但至少拆字上比較便利。 不過,漢字是由一些「共同的細微字形」來做變化的, 這些「共同的細微字形」切割到最細的話,就是四十多種「筆形」, 與行列的十大類基本筆形不同的地方是: 它們是計算漢字筆劃時的依據,書寫時需要一筆寫完。 取「較大的形」時,就需要為這些「較大的形」各編一個對應的字根, 當這些「較大的形」數量太多,字根又被限定只能用 26 鍵時, 就會變成一個字根需要對應很多「較大的形」, 無形之中忽略了「字形輸入法應取漢字共同的細微字形」的重點, 加上碼長最多只取四碼,因此助長了重碼字的機會, 嘸蝦米重碼字高居 4 種字形輸入法之冠,主要肇因於此。 倉頡輸入法掌握了漢字「共同的細微字形」(公約數、基因)這項特徵, 比較 4 種字形輸入法的「字根表」時, 各位可以發現「倉頡字根表」裡輔根的筆劃都很少! 筆劃多的大多為倉頡字母(即字根)本身! 而且倉頡字母大多為常見的部首, 字典裡的每個部首大多又對應到不同的倉頡碼, 因此「字首」重碼率變低了,「字身」重碼率又低的話, 全部漢字的倉頡碼重碼率自然就會降低。 加上考慮到「共用」這項特性,所以輔根是最少的, 雖然拆字時要思考到較細微的部分,但卻可以有效降低重碼率的問題。 註:除了這項特徵之外, 倉頡重碼字相對較少的另一個主因是取碼長度可以取到五碼, (行列、大易、嘸蝦米取碼長度最多只取到四碼) 排列組合數較多,重碼率自然也會較少。 由最多取五碼的規則可以猜到: 朱邦復先生當初發明倉頡輸入法時, 並不是要讓使用者在輸入常見的幾千個漢字時有絕對的便利性, (另外,他也沒有發明違反取碼原則一致性的「簡碼」, 因為那樣做只是討好只有常見字需求的使用者) 他思考的是如何應付數萬個漢字的輸入、處理、運用…等問題。 在 Unicode 3.1 加入了近五萬個 CJK Ext A/B 區的漢字之後, 只要系統字型有支援,要處理罕見漢字的顯示問題變得容易多了, 事實也證明朱先生當初將倉頡的最大碼長定為五碼是有其道理的, 因為在不改變輸入模式、不區分輸入模式的情況下, 倉頡輸入法仍舊能輕易應付全部 Unicode 3.1 的 70,195 個漢字, 而且重碼率依然比行列、大易、嘸蝦米低。 目前,能完整支援這七萬多個漢字的輸入法都是倉頡系列的,而且都是免費的! 這是倉頡族最大的福利! (蝦米族網站上,在 2009 年 4 月發表的加字加詞檔短缺七百多字; 香草輸入法內建的行列短缺近一萬字; 大易系列方面,有支援 CJK Ext A/B 區漢字的作品並不常見; 所以「泰瑞系列中文輸入法對照表」並沒有整理出行列、大易的對照表, 因為要補一萬多個行列碼、近五萬個大易碼,並不是一件容易的事!) 下一篇我將接續比較倉頡輸入法和嘸蝦米輸入法的優缺點, 日後有機會再拿倉頡輸入法與行列輸入法、大易輸入法做進一步的比較。 針對「容易背誦」、「重碼率低」、「使用一種模式可輸入 70,195 個漢字」這三點而言, 倉頡輸入法是四種字形輸入法裡最具優勢的! (儘管有人覺得它的取碼原則較難理解、最大取碼長度也較長, 但它仍然有其他方面的優勢,請繼續看下一篇的講述)。 文章引用網址: http://terryhung.pixnet.net/blog/post/16029318 |
本站公告:〔您越需要我們,我們就越有創意〕 | 本站說明書:〔發現故鄉還有改進的地方,請來信告訴原丁們〕 |
觀察應用學習點數 :〔咱的故鄉有您的參與,會使我們有更大的發揮空間,展現更豐富精彩的學習畫面〕 | 〔期待藉由無障礙網頁設計,能讓視障小朋友更愛看書、更愛寫作且更愛學習〕:盲用電腦「心得分享」 |