读《中文打印机》——一个世纪汉字突围史
文 | 懒残僧
今天给大家聊聊这本书,《中文打字机》,副标题“一个世纪汉字突围史”。我一开始以为作者要讲的是中文输入法,结果发现作者有两本书,另外一本就是讲中文输入法,而这本的的确确是在讲中文打字机。这就超出了我的认知了,从我读初中时,学校里就有打字课,还要考级,不过使用的是英文打字机。如果有中文打字机这个东西,为什么我从小到大没见过呢。
后来发现的确是我见识短,无论民国还是建国后,中文打字员都是一份很有前途的工作。只是我的成长过程伴随着电脑的普及,所以中文打字这个技能就自然而然被淘汰了,成了时代的眼泪。各种电视剧想还原这个职业也还原不了,首先是道具复原的难题,其次是,中文打字真的是一份很有技术含量的工作,剧组大约是搞不明白。而墨磊宁老师的中文打字机史,也的确是讲述了中文作为表意文字,在现代化过程中,被表音文字所包围的突围史。
2008年的北京奥运是开幕会,是见证中国辉煌崛起历程的一个新节点。在8月8日的开幕式中,首先亮相的是希腊代表团。希腊是奥运会的发源地,由希腊代表团第一个进登场是奥运会惯例。然而第二个登场的国家,却引起了全世界转播媒体的彻底宕机。1921年,国际奥林匹克委员会确定了“参赛各国按照字母顺序入场”的规则。而在1949年,修订了章程:主办国有权按照主办国语言的字母顺序组织开幕式的入场。直到1988年的汉城奥运会,这一庄严的奥林匹克传统仪式才首次采用了非西方的字母顺序。按照韩语音节,排在希腊之后的是加纳,然后是加蓬。
而在2008年的北京奥运会,当几内亚代表团跟随希腊代表团之后出场时,解说员们突然乱了阵脚。因为中文里没有字母,所以,各个国家的出场顺序会根据国名的汉字笔画数来确定。一个“A”开头的国家后面可能跟着一个“R”开头的国家,这打破了以往对于出场顺序的预期。由于不了解中文的正字法传统,一些西方电视观众转而诉诸阴谋论。
8月9日,奇客论坛上有人发表了一篇帖子《美国全国广播公司篡改了奥运开幕式吗?》,指出“美国媒体为了提高收视率,篡改现场实况”,该帖在48小时内得到了近500条回应。直到第二天,事实才得到澄清,北京奥运会向世界普及了一次方块字的知识。
显而易见,普适性的奥运会规则并不是那么“普适”。很多人视为的在语言上无分别、中立的和“普适”的系统,都需要把中文排除在外,“普适性神话”才能成立。在二十世纪的上半叶,各种信息处理技术突飞猛进。然而这些系统最初都是基于拉丁字母开发,而后逐步“拓展”至非拉丁字母,乃至非字母文字的中文。技术的传播中也出现了语言帝国主义。简单地讲,某些字母文字和音节文字比其他文字更符合现代性;所有字母文字和音节文字都可以凌驾于中文之上。就连鲁迅也说过:“汉字不灭,中国必亡。”在当时的改革者看来,废除汉字是中国走向现代化的根本举措,可以将中国从浩渺且僵固的过去中解脱出来。
最早的可批量生产的中文打字机只存在于大众的想象中。1900年1月,《旧金山观察家报》称,有一台新奇的机器。它配有一个长达约3.5米的键盘,其上有5000个按键。它如此巨大,以至于操作它的“打字员”看上去活像一位坐在高处朝下面的人发号施令的将军。这篇文章旁边还有一幅漫画:发明者坐在凳子上,手里举着一只大铁皮扩音器,对着“四个因长期敲击键盘而手指粗壮的人”喊着类似粤语发音的胡言乱语。
一年后,《圣路易斯环球民主报》也刊登了类似的图片。图中那台中文打字机,从外形上看与当时正流行的雷明顿打字机颇为相似,只是尺寸要大很多——它配置了两组台阶,样子跟北京紫禁城里的很像。而“打字员”循着键盘台阶爬上爬下,苦苦寻找着他想要的字符。这些荒谬的巨大机器其实从未真实存在过,仅存在于外国人的嘲讽中。
实际上,有关中文打字机的历史,作者是从暹罗讲起。暹罗文有44个辅音字母,32个元音字母,5个声调符号,10个数字符号和8种标点符号。当时史密斯高级打字机公司为暹罗文所制造的打印机为双键盘式,多达84个按键,却仍缺少书写完整暹罗文字母表所需的两个按键。对此,设计师做了一件非常大胆的事,弃用了暹罗文字中的两个字母。“只有进一步精简暹罗文,才能从根本上使用暹罗文打字与现在欧洲语言打字处于同一层次。”
我们注意到设计师在为这个新“问题”分配责任时的奇特角度,不是打字机无法兼容于暹罗文,而是暹罗文无法兼容于打字机。这件事更大的范畴,不仅限于暹罗文,而是更大的亚洲语系问题中的一个实例,这里的亚洲语系指的是那些拼字构件超出打字机承载限度的语言。
对于单切换键盘打字机来说,无论西班牙语、俄语、印地语、日文假名、新罗语、爪哇语,还是其他什么语言,它们之间基本没有太大区别,似乎语言本身反而成为打字机的特点或适配物。20世纪众多打字机发明者都赞成这样一则强有力的正统信条:在设法解决外国语言的打字问题时,绝不能从底层质疑单键盘打字机形式本身。然而中文书写似乎充当了一个警醒的见证者,见证了这种打字机形式的伪普适性,见证了这个假冒的超然存在。
于是,他们集结了手头一切物质资源和符号资源,对汉字展开了一场冷酷无情的全方位的围剿,一种从技术语言层面排斥中文的行为。换句话说,通过将世界上最古老、最使用最为广泛的书写系统之一驱逐出这个领域,单键盘打字最终实现了它的普适性。尽管,活字印刷是在中国发明的。
1858年,美国印刷专家姜别利来到中国,奉命主持宁波长老会传教印刷馆。姜别利和两位中国助手在大量中文文本中统计的汉字频率的数据。经过4年不懈的努力,持续不断地对《大学》、《道德经》等文本进行机械的“反阅读”,他们一共翻阅了4000多页文本,检查了大约1300000个汉字,认定了四书五经只由2426个不同汉字构成,而儒家的十三经只有6544个不同的汉字。
而随着英国特使团访问大清的小斯当东也表示,只要2000左右不同的汉字就可以打印《大清律例》。这些发现使得海外汉学圈产生了地震。这也意味着,虽然《康熙字典》收录汉字多达47,000多个,但是要对中文进行活版印刷,常用的铅字只需要缩减到5000个左右,就能够满足印刷需要。
破解中文印刷之谜的另外两种方式是拼合和代码。1845年,汉学家包铁和印刷师李昂格开创一种,以部首来拆解汉字的活字印刷法。比如“海”可以拆成“三点水”和“每”,但是更复杂的字比如“荡”就难以拆分。强行拆分的话,会破坏汉字的骨络,比例失调,缺乏美感。
另外一种方法是“代码”,也就是用摩尔斯码的方式输出中文。然而和拉丁语系可以直接从电码中读出原文不同,中文和摩尔斯码的信息对接方式,只能是先由摩尔斯码得出四位数字,再由这四位数字去检索相应的汉字。也就是说,在现有的电报加密体系下,中文是天然的加密语言,每次解码都必须依赖检索本。更麻烦的是,中文和当时的电报“明文”系统并不通用。比如1885年的电码本,“牙刷”一词就是“电报传输延迟”的意思,而“喘气”则代表“发放现有货物/抓紧配发剩余”。这种电报“明文”体系也将中文隔离在外。
在打字机问世后的10年里,经由打字机公司的推广和改造,逐步走向全球。打字机工程师和生产者始终致力于通过对原始的英文打字机进行最低限度的必要改造,以将各种文字书写形式纳入西方打字技术的范畴。尽管各种书写系统及其特点都被一一吸收——例如从右向左书写的希伯来文,有字母字形变化的阿拉伯文——但中国市场始终无法被攻克。
随着西式打印机在全球范围内推广,中国和世界其他国家一样也无法抵抗这种激情的诱惑。很多人觉得中国也需要自己的打印机,不仅作为一种商业设备,也作为现代性的一个标志。制造一台专门打字机的意义,已经不仅仅在于是中国人的办公习惯跟上时代了,更重要的是面对各方对中国的审判,这样一台机器能够成为中国符号现代性的有力证明。甚至,不少中国国内的知识分子呼吁废除中文甚至用英文取而代之。
1897年,传教士谢卫楼发布了世界上第1台中文打字机。它看上去就像一张“小圆桌”,上面密密排列着30圈汉字。谢卫楼最终采纳的汉字总数为4662个。他将这4662个汉字进一步编入4个分区,第一个分区包含726个“最常用汉字”,第二个分区包含1368个“常用汉字”,第三个分区包含2550个“次常用汉字”,第四个分区则包含162个特殊的“表外汉字”,也就是对谢卫楼及其传教工作比较重要,有时会被收入或复制到“最常用汉字”列表的汉字。
“理想情况下,如果四个分区的设置合理,那么打字时他的大部分时间都会花在“最常用字”的小块区域里,从而将双手的工作范围前所未有地缩小了。这种可在单一固定位操作的打字机标志着谢卫楼发明了一种中文技术语言机械的新形式,操作者可以稳坐不动地灵活操作。谢卫楼成为历史上首位“中文打字员”。
1916年,来自江苏无锡的周厚坤,被《纽约时报》以“中国人发明出4000字中文打字机”为题发布了报道。周厚坤的原型机有一个滚筒,长16至18英寸,直径约6英寸,在这个滚筒上有近3000个汉字,按照康熙字典的部首笔画系统排布,这个数量虽然多于董景安的“通俗教育”字数,但远低于谢卫楼筛定的汉字字数。”
在打字机的上方有一个网格化的矩形平板,所有汉字都被印在上面以帮助检字。操作者使用一根金属检字杆在检字板上查找所需汉字:当检字杆的末端移动到检字板中所需汉字的上方时,检字杆的另一端就会将滚筒上相应的汉字推至打印位。当时周厚坤已知晓谢卫楼的发明,谢卫楼的打字机以传教为目的,在常用字中加了很多诸如“狮子”“猿猴”等圣经词汇。而周厚坤的常用字选自中国学者陈鹤琴的最新字频统计研究。
1915年,留学生祁暄在纽约首次向媒体记者和他的支持者中国领事杨毓莹展示了他的中文打字机。与周厚坤的常用字打字机一样,祁喧的打字机也有一个固定在铜板上的滚筒,其上蚀刻着4200个常用汉字,而且同样也是一台“没有按键的打字机”。但二者实际上还是有一个巨大的差别。
除了滚筒上的4200个常用字外,祁喧还纳入了一套包含1327个汉字部件的铅字,打字员可以用这些额外的铅字来组装或“拼写”出一些不常用的汉字,就像用字母来拼写英文单词一样。这一设计的核心理念,就是我们在19世纪的拼合活字印刷术中所见到的对汉字的准字母式重构。和之前的包铁、李格昂等人一样,祁暄也将汉字拆分,使其适用于一种可以被称为“拼合”的手段,即仿照世界其他语言中的字母形式,将“部首”视为中国的正字法。
周厚坤和祁暄很快就引起了国内文化界的注意。时任上海商务印书馆的经理张元济,成功地将周厚坤和他的打字机请到上海,监督指导该打字机的深入研发和制造。然而,周厚坤的打字机有一个显著差异:其上的字符是完全固定的,无法根据不同的术语需要和语境调整。对于专家和学者来说,既定的2500个汉字是绝对不够的。
这就意味着周厚坤最初的无法更改字符的设计必然会限制其效能。商务印刷馆的工程师舒震东,抛弃了周厚坤最初设计的汉字滚筒,改用长方形平面字盘,字盘中的字符可以自由移动和替换。经过如此改造,这种常用字打字机所能容纳的汉字数量不变,但打字员可以根据不同的术语需要对字符进行个性化调整。有了可自由移动的铅字,操作者只需一把小镊子就可完成字符的移除和替换。
1927年的一篇文章写道:“据说最快的速度是每小时2000多字,比手写速度快3倍。”有报道特别提及了这种打字机的三大优点:第一,比手写更节省时间;第二,打出的字比手写字更清晰;第三,也是最重要的一点,它可以搭配复写纸使用,一次打出多份文件。在1917年至1934年间,商务印书馆共售出超过2000台中文打字机,相当于每年售出大约100台,远销吕宋、新加坡、爪哇、西贡、苏门答腊、暹罗和马六甲。
中文打字机的市场还带来了配套的职业,“中文打字员”的诞生。从20世纪一二十年代开始,一批配有一两间教室的私营打字学校纷纷建立,通过培训打字员盈利。在上海、北京、天津、重庆等一些大城市,培训课程通常为期一至三个月,培训费用一般不高于15元。
教学、创业、技术中心和经营部门构成了一个彼此交叠的巨大网络,将中文打字机和中文打字员源源不断地输送到全国各地的公司、学校和政府部门。毕业生纷纷进入中国的大都市和省级政府部门,包括南京检察署、福建省政府、四川省政府,以及中国的各大公司,如中国肥皂公司、澳门华人银行和浙江兴业银行。在这些学校里,学习打字技术的学生既要进行“练习分指”和“闭目默习”的训练,这种西方打字教学中也很常见的训练,还从钢琴演奏上借鉴了各种理念和手法,例如相对力度、单指灵活度的观念。中文打字员其独特的重复性训练是:首先,从常用的中文词语和名称练起;通过这些训练,学生逐步熟记了每个汉字在字盘上的准确位置;同时,容易成组出现的汉字之间的空间关系也不知不觉印入了脑海。
在1926年的费城世界博览会上,商务印刷馆制造的中文打字机就在中国厅内。为了这次世界首秀,商务印刷馆还专门为舒氏华文打印机制作了一本英文宣传册,其措辞充分考虑了国外读者的观感,回避了中文打字机自身所处的手抄和印刷环境,微妙地暗示该机器实际上与西方真正的打字机是等同的。
不过费城世博会上的荣誉并不足以平息来自海外乃至国内的批评和贬低之声。费城世博会的同一年,语言学家和坚定的汉字废除论者钱玄同再次发起诘难,矛头对准中文打字机。他巧妙地用“面积”一词作为批判的出发点,将中文打字员描述在一个由“两三千字”组成的广袤土地上迷失的灵魂。为了强调汉字在字盘上的距离感,钱玄同甚至用到了“东北角”、“西南部”的方位词,也就是所谓的奉天省和云南。
说到底,所谓的中文打字机只是一个缩小版的活字印刷机而已。以西式的视角来看,很难说和当时通用的打字机属于同一类型。那么,如何制作一台能够与西方打字机齐名的中文打字机?带着这些想法,林语堂走上了一条漫长的道路。最终在20世纪40年代,林语堂发布了历史上最广为人知的中文打字机,“明快”中文打字机。这台打字机宽约36厘米,长约46厘米,高约23厘米,一共可以打8352个汉字和字符,却只比当时常见的西式打字机略大一些。
最重要的是,明快打字机是第一台具备打字机要素——键盘——的打字机。看来,通过一台“和西方一样”的打字机,中文终于同其他语言站在了一起。
虽然看起来像一台常规打字机,但它的操作方式却会让人感到迷惑不解。键盘上有72个键,当按下其中的一个键时,机器内部的齿轮就开始转动,但纸上却不会出现任何字迹,至少不会立即出现。按下第二个键,齿轮再次转动,但纸面上仍然没有输出。不过,这时奇妙的事情发生了:8个汉字出现了,不是出现在纸上,而是在打字机上一个专门的显示框中。只有在按下第三个键,也就是8个数字键之一时,一个汉字才最终被印在纸面上。按三次键,印一个字。
到底是怎么回事?而且,所打出的汉字与之前点击的任何按键上的符号都不存在直接的一一对应关系。这到底是一台怎样的打字机,为何看起来与真正的打字机一样,但表现却如此怪异?
林语堂发明的明快打字机不仅脱离了雷明顿打字机、安德伍德打字机等的形式,而且也不同于周厚坤、舒震东、祁喧和罗伯特·麦基恩·琼斯等人提出的中文打字机制造方法。实际上,明快打字机通过将打字过程转化为搜索过程,从根本上改变了机械书写的运作方式。
可以说,它在历史上首次将“搜索”与“书写”结合起来,预告了如今中文里被称为“输入”的人机交互模式。很多人认为,个人电脑将汉字从字母文字与非字母文字之间的“鸿沟”中拯救了出来。其实,故事恰恰相反:输入法作为一种革命性人机交互新模式,奠定了中国作为这个世界上最大的信息技术市场和活跃的社交环境的基础,但其诞生却与计算机技术毫无关系。最早的输入系统正是基于林语堂发明的明快打字机。
在林语堂着手设计打印机时,他的灵感并非来自活字、电报技术或西式打印机,而是源于20世纪10至30年代发生在中国的一场名为“检字法问题”的语言改革大讨论。20世纪20年代前后,现代信息环境的一些最平常的基本要素却在中国引发了持久的焦虑:如何编制现代的中文电话簿、杂志索引、档案索引、名册及其他各种参考资料,以供人们通过汉字编码查找所需信息。就像本文开头所说的,中国字没有字母,我们需要自己的一套检字法。
一位语言改革者所说的,一个更加先进的,能使信息查询变得更加快捷的中文编排和检索系统,将为每个中国人节省两年的生命。在这种与日俱增的信息危机意识的驱动下,民国早期出现了一次实验性汉字编排法的大爆发,不少于72种实验性检索系统被提出,旨在重组中文语言信息环境,其中就有大名鼎鼎的中统陈立夫所发明的五笔捡字法。
在这场关于“检字法问题”的大讨论的参与者中,林语堂是唯一将有关检索的细致讨论导向机械书写的。在1947年5月22日,林语堂背了一身债务,耗资12万美元,终于制造出了一部符合罗伯特·麦基恩·琼斯所说的“没有中文的中文打字机”。林家人在提到明快打字机时,经常将它比喻成一个孩子,这也反映出他们在这台打字机上所倾注的心血和感情。
1947年的夏天,明快打字机开始引起轰动,各国媒体竞相报道。来自中国的文化名人、军方、政治和金融界人士,都对其表示了赞许和推荐——“这是对人类社会的最大贡献。”然而抗美援朝的爆发,给明快打字机判了死刑。世间仅有的一台明快打字机原型机,大约在20世纪60年代,被默根特勒莱诺整行铸排机公司的某位员工一声不吭地丢掉了。明快打字机始终未得到量产。
明快打字机的终结并不是中文打字的终结。新中国建立后,随着建设国家、巩固革命成果、规划经济和阶级斗争,中文打字机也被广泛地普及。作者即使在青海省泽库县这种偏远的农牧区,都找到了多份打字文件。爱国中文打字员的形象也随之出现。中文打字机经常被用来复制整本书,看这种复制书刊被称为打印本。打印本是介于手抄本与出版社印刷本中的广阔地带。
全国各个工作单位普遍展开的“学习班”,需要打印大量经济报告和用低效油印机印刷的文字材料。在当时为学习组配备的三件套——打印机、打印蜡纸和油印机,也被用来经营小规模的灰色出版页。当时面向全国发行的文学杂志《今天》被评为“1949年以来中国第1份非官方杂志”,就是用打字机加蜡纸油印的方式印刷的。
不过,中文打字机在20世纪后半叶最令人着迷的地方不在于它流行的程度或范围。在打字员忙碌的工作中,一些天才的革命性创见正在萌发。他们不再满足于遵循部首——笔画编排法,或是我们在上面所提到的由中国知识分子创造的各种实验性的汉字检索系统,而是走上了一条“彻底脱离”的道路。具体而言,为最大限度地体现书面语言中往往成组出现的汉字组合,他们创造了个性化的自然语言汉字编排方式,包括常见的二字组合,以及共产主义专有名词和专门用语,例如“革命”“社会主义”“政治”“新华社”等。
随着成组出现的汉字之间的关联得到加强,同时也由于共产主义语言的重复性特征,利用这种实验性编排方式的打字员每分钟最高可以打70个字,或至少比民国时期的打字速度快3倍还多。
对字盘上将近2500个字进行无数次编排,这就使得汉字编排带有明显的个人特质和动作习惯。这就好比智能ABC输入法的“强制记忆词条输入”。换句话说,在毛泽东时代的打字员中,我们看到了已知最早的,对当今所谓“预测文本”的信息技术开展的实验和运用,这种技术形式如今已成为中文搜索和输入法的普遍特征。如果说“输入法”已成为现代中文信息技术的一大支柱,那么第二大支柱无疑就是预测文本。想来令人吃惊,我们在数字时代里如此熟悉的一种技术竟然有着如此深厚的根源:中文的预测文本技术是在计算机时代来临之前,在机械式中文打字机的背景下发明、推广和完善的。
本书的读书笔记就写到这里,中文打字机随着改革开放后电脑的普及渐渐淡出了我们的生活。而墨磊宁先生的下一本书接续本书,讲的是中文输入法在数字时代的突围。我非常热切期待他下一本书的引入。
微信扫码关注该文公众号作者