佳礼资讯网

 找回密码
 注册

ADVERTISEMENT

查看: 1719|回复: 3

朱邦复: 中文系統功能與環境

[复制链接]
发表于 20-9-2004 01:51 AM | 显示全部楼层 |阅读模式
以下是中文电脑之父丶仓颉输入法发明人朱邦复最近在《第三屆漢文史研討會》上发表的文章,讲述了其发明之中文电脑系统功能与环境,朱先生认为中文系统应具备八大功能,即:字集、字碼、字序、字體、字形、字音、字辨、字義,对中文电脑有兴趣者不妨细读以下文章。


转自: http://www.hanculture.com/show.php?id=56
http://www.hanculture.com/file/20040916014049_p11.pdf



------------
中 文 系 統 功 能 與 環 境
------------

作者:朱邦復 文信傳文史研究院 院長

甲、知識分子在資訊時代之任務

  二十世紀末,資訊時代到來,電子計算機掀起了驚濤駭浪,人類文明面臨興衰存亡的考驗。舉世在英文強勢主導下,由經濟、軍事的震撼,到文化、生活的影響,若置身事外,必有亡國滅種之災。中華文化歷經五千年的磨練,有賴於炎黃子孫之奮發努力,始終屹立如山。但在這一波的衝擊下,稍稍應付失當,文亡道圮,就算中國能振衰起敝,中國人必為西化奴隸、中華文化將成廢墟。

  中華文化博大精深、源遠流長,自備一套做人行事之有效準則。一旦被不過數百年歷史之西方取代,子孫不肖,宗廟蒙塵,先聖先賢所思所謀盡化雲煙!斯時也,國人焚典忘祖,迷聲迷色,一切唯蝌蚪文是尊。西人行南是趨、行北亦趨,待發現彼等質鹵未化,人子情何以堪?

  讀書人是社會精英、天之驕子,讀聖賢書,所為何事?天有不測風雨,人豈能坐以待晴?兵來將擋、水來土掩,西方資訊之侵略,將以我傳統文化之優勢以迎之!

  傳統之讀書人,即今之知識分子,本人不才,積三十餘年奮鬥之經驗,已取得超英越美之重大成果。於此,謹以實事求是之精神,不作虛言矯語,茲代表香港文化傳信股份有限公司,將所作所為公之於世,呈獻給全體同胞,以告慰我炎黃祖先在天之靈。

.......................................................

戊、漢字系統之科學理論

文傳資訊系統以實現多元文化資訊應用為最終目標,但於發展期間,尚有一定之步驟。
故目前僅以中文為主,英文為輔,至於其他文字,當逐步發展之。
於中文系統中,目前亦僅開發出「漢字」一種。唯因漢字技術難度極大,其中有字集、
字碼、字序、字體、字形等問題,尚未獲得一種完整且可行的方案。兼以更重要的字音、
字辨、字義功能,連英文系統都未能有效地解決,對資訊處理影響極大。
本系統即係針對前述各種功能,以最小的空間、最快的速度、最週全的考量所設計者。
茲將前述八種文字之功能,統一解釋如下:

一、字集:

今值資訊時代到來,設若漢字不能「全數納入」資訊體系,其後果不僅造成應用之不
便,且將令後世與傳統成斷層。果真如斯,五千年文化勢將進入博物館,與時代脫節。
所以,我等認為,過往傳統文件所載之文字,有必要全部移植於資訊系統中。同時根
據本公司長期之努力,已完成在500KB之空間內,容納近十萬漢字。然因節省操作成
本,全漢字系統宜供文獻專家使用,一般大眾尚以32000字最為理想。
32000字中,已包含國標碼各級字集,外加繁體字、港澳用字(BIG5、GB2312、
HKSCS)以及古籍用字等,足敷當前應用。其優點為每字佔二字元(十萬字集每字佔四字
元),效率較高,且擴充為全漢字亦甚容易。
因此,本公司利用空間小之特性,將全部字庫、字集設計於POWER PC之CP
U中,於茲,中文遂成為電腦內建功能,與英文具有相等、甚至更大之效率。

二、字碼:

字碼有多種性質,茲分述如下:

1,輸入碼供鍵盤輸入用
漢字輸入方案極多,但皆僅具輸入功能,極佔空間,效率不高,且用字有限。
本系統採用倉頡輸入法,碼、形、義、音一體,有效字集十萬,不佔額外空間。

2,內碼供系統內存用
本系統內碼與輸入法一體,具字母排序功能,效率與拼音文字相若。

3,交換碼供系統交換用
本系統內碼具十萬字,可作交換碼用。

4,定義碼供系統處理用
倉頡碼具「漢字基因」功能,形音義俱全,適宜中文自然語言應用。

5,圖形碼供圖形處理用
倉頡碼保留圖形編碼功能,適宜於多媒體應用。

6,傳輸碼供通訊傳輸用
倉頡碼分二字節及四字節兩種,且功能齊全,適宜於通訊傳輸用。


三、字序:

倉頡碼有中文字母25個,具有一定之順序,應用效率極高。

四、字體:
倉頡字庫係採用「中心描述法」,可作各種大小、粗細、字體變形。

五、字形:
倉頡碼係漢字基因碼,只存字形基因,以輸入順序組成字形,精簡快速。

六、字音:
漢字八成為形聲字,字音應用方便。

七、字辨:
根據字形方位,用程式辨識可還原為倉頡碼。再以形聲定義,可供語音辨識。

八、字義:
以倉頡基因定義與漢字基因合用,可得百分之九十之「漢字定義」,可理解用。
己、漢字系統之技術實踐
上述八項文字功能,本公司以「匯編語言」設計,共佔約600KB,全部納入CP
U中,功能效率遠大於英文數百萬倍(英文無概念理解功能)。

一、字集32000字(文傳碼),對照表每字二字節,共佔64KB。
字集80000字(典籍碼),對照表每字四字節,共佔320KB(專家用)。
全字集一千餘萬字(組合碼),倉頡法輸入轉成四字節,無對照表,不佔空間。

二、字碼與字庫相結合,其中:
基本字形資料210KB
匯編程式 96KB
內碼對照表 64KB(32000字)
字形緩衝區 16KB(RAM)

三、字序:於字庫中,平均每字查找指令數60個。

四、字體:基本字形為明體、黑體、圓體,已完成宋體、隸體、楷體,尚未放入CPU中。
根據CPU輸出之漢字結構,可增加王、柳、顏、歐等楷體或各種藝術字體。

五、字形:
字庫中有基本筆畫八種,基本結構96種,複合筆畫64種,特殊形500個。

六、字音:
倉頡取碼分字首、字身,字首為「形碼」,字身為「音碼」,完全遵照漢字之形聲法。

七、字辨:
根據倉頡取碼法則,視覺辨識之程式以線性追蹤法,由形得碼極為簡便。

八、字義:
漢字中有「意義」,需要理解之字不過八千,佔32KB空間。
自然語言用匯編語言設計,約佔64KB。
餘為「名稱」用字,用倉頡碼之字首分類,即可得知,不佔空間。
凡需理解之字,可用「理解基因」與自然語言結合,形成一「概念網絡」,可供實用。
庚、有關中文標準的一些建議
中文電腦發展至今,已有三十餘年,由於政府初期並未介入,故無完整之規劃,各自
分途發展。迄今各種系統雜陳,萬碼奔騰,彼此不能兼容,浪費人力資源甚鉅。更嚴重的
是,隨著應用日趨廣泛,中文資訊極有可能分裂成為各據一方的「文閥」,誤國誤民。
準此,中文標準的統一不僅是當務之急,更是千秋萬世文化統一的大業。同時要徹底
解決各種問題,且要經濟實惠、成本低、效率高、應用方便,更要避免某一商業公司獨斷
專賣。茲將各界共同關心的一些問題,提供解決方案,以作參考。

一、體系結構方面:

1,字集:文傳字集計分兩種,第一代常用字,共收31726字(詳見附錄
一);第二代為全集,已收80000字(尚在收集中,可容數百萬)。全部字集以「字母」
為序,前後一貫,不分主從。

2,字集CCG、字碼CCC、字控CCD、指令CCI、應用介面CCE,
此外,字形、字義、字音、字體亦已全部合而為一,不佔額外空間(詳見附錄),應用方便,
極易嵌入CPU中。

二、應用系統開發方面:

1,兼容現存各種字集(3210中,ISO10646尚缺375字;已於
3220中補齊),只要建一轉換表即可應用。

2,已排版之檔案,可以HTML、XML、EML等格式轉換之。可於任何
環境下使用。

3,本系統原以X86硬體所開發,將來將嵌入全美達之X86 CPU中。

4,網絡協定屬於系統功能,將設於系統介面中。


三、文字錄入方面:

1,本系統具有倉頡輸入法(不佔空間),其他輸入法皆須外建,由CCE負
責處理之。

2,本系統具有「漢字理解」功能,對同音字作70%以上之自動處理,剩餘
30%(多為外來字如「沙發、摩登」等)可建表處理。
此外其他字漢字聯想等功能,除已理解者之外,亦可建表處理之。
只是此「理解系統」涉及本公司內部問題尚多,不擬申請標準。
四、審核通過國際化標準方面:

1,本系統只申請國內標準之審核,然因本公司擁有LINUX 之「嵌入式操
作系統」MIDORI,必須向LINUX 報備在案,並由LINUX 自由基金會負責處理各種協定問
題,故曾向LINUX 組織提出申請。

2,本系統之技術因係「革命性」之大突破,數十年來,累受傳統專家學者之
輕視。為了避免懷疑及爭議,故此先自行斥資實驗,現已證明可行,特再提供我國標準化
單位參考。

3,若蒙國家採用,本公司除產品自理外,一應技術願提供國家無償使用。


...............更多內容详见:

http://www.hanculture.com/file/20040916014049_p11.pdf
回复

使用道具 举报


ADVERTISEMENT

发表于 21-9-2004 03:05 PM | 显示全部楼层
支持一下。。。。(善意的灌水
回复

使用道具 举报

发表于 1-6-2005 10:45 PM | 显示全部楼层

刚好看到,是朱邦复老先生所发明的产品。
我也来支持支持。
回复

使用道具 举报

走刀口 该用户已被删除
发表于 13-8-2005 11:24 PM | 显示全部楼层
没有他我们到现在还不知用什么输入中文。。。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

 

ADVERTISEMENT



ADVERTISEMENT



ADVERTISEMENT

ADVERTISEMENT


版权所有 © 1996-2023 Cari Internet Sdn Bhd (483575-W)|IPSERVERONE 提供云主机|广告刊登|关于我们|私隐权|免控|投诉|联络|脸书|佳礼资讯网

GMT+8, 1-11-2024 09:33 AM , Processed in 0.123965 second(s), 26 queries , Gzip On.

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表