阅读设置(推荐配合 快捷键[F11] 进入全屏沉浸式阅读)

设置X

第101部分 (4 / 5)

个提取字库的程序已经彻底完成,通过软盘贝到装有汉卡的台式机上,稍微设置了一下参数,很快便得到了想要的数据。

钱长友欣欣然之余,吴云飞则是看得有些莫名其妙。

其实,钱长友所研发的汉卡,可以称之为汉字信息处理系统,它包括编码、输入、存储、编辑、输出和传输等等诸多环节。其中编码是最关键的,只有解决了这个问题,汉字才能进入计算机。

在用户最直接感受到的输出方面。为了将汉字在显示器或打印机上显示出来,需要把汉字按图形符号设计成点阵图,比如×4等。进而得到相应的点阵代码,即字形码,全部汉字字形码地集合就叫汉字字库。

限于目前的计算机硬件水平。汉字库多数固化在一个单独地存储芯片中,形成“硬”字库的方式,然后再和其它必要的器件组成接口卡,插接在计算机上,最终成为汉卡。

钱长友如果把现在已有的汉字库借鉴过来,将会节省很多的研发时间。

另一方面,用户平常接触最多的诸如拼音、五笔之类的输入法,均会形成各自不同的汉字输入码,这些编码统统属于汉字外码。钱长友在整理完字库后,随后的任务就是完成输入法的相关编程工作。

输入法形成地汉字外码必须在计算机中转换成机内码,即汉字内码,才能进行存储和处理。汉字内码与每一个汉字或者标点符号都是一一对应的,汉

和汉字内码之间的转换有统一的标准,在国内就是一始实施地国家标准GB12——=

GB12准共收录6763个汉字,其中一级汉字3755,二级汉字个,同时,还收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682全角字符。

GB12收录的汉字已经覆盖大陆99。75%地使用频率,基本能够满足汉字的计算机处理需要,但它对于人名、古汉语等方面出现的罕用字,则无能为力,这才导致了后来GB及GB030字字符集标准的出现。

凭借钱长友的水平,完全可以克服这些弊端,但计算机作为一个产业来讲,是需要各个环节配合的。GB2312码通行于大陆,几乎所有的中文系统和国际化的软件都必须支持它,钱长友的工作也必须遵循这个准则。

有些问题,可以随着产业的进步和国家标准的出台,留到后继版本的产品中解决,

技术本事就是追求完美,但却只能无限接近而不能达到完美的。

再者说了,单方面地在产品中增添一些不常用的生僻字,在汉字库中就会加大芯片的存储容量要求,进而提高了成本。

还是一句话,技术上正确的事情,并不见得是商业上的最佳选择。

重生后的钱长友,既是商人,又是技术人,看得透侧,自然会两方面兼顾,取得一个平衡点。

钱长友现在的研发工作,思路和方向都十分明确,也就是说,他知道“怎么做”,无非就是所花费的时间多少了。

当钱长友把汉字库刚分析得有条有理的时候,范世豪风风火火地赶了过来。

钱长友心中暗自奇怪,从范世豪前前后后帮助自己这么多次中可以看出,他性情好爽不假,但做事情绝对滴水不漏,怎么现在看起来行色匆匆的?

范世豪坐下,接过钱长友递过来的茶水喝了一口,然后便兴致勃勃地问道:“这才多长时间没见,怎么房间里弄了两台电脑过来?”

钱长友解释道:“笔记本电脑是赵顺华帮着联系买的,另一台是我朝他暂时借的。”

范世豪赞许地点了点头,“倒底都是年轻人,有共同语言,这么快就熟悉得能够相互帮忙了。你电话里说的那件调研电脑市场的事情,我让范继同帮着你们找资料吧。”

上一页 目录 +书签 下一页