第八章 机器翻译
相关链接
机器翻译的历史和展望
机器翻译大致可分为四个阶段。 1、设想和初探阶段(1933-1954年)。其中最早的代表人物当推法国工程师阿尔茨努尼(Artsruni, George)和前苏联的特罗绛斯基(Trojanski,P.P. )。 1933 年阿尔茨努尼设计出一种他称为“机脑”的翻译机,并获得专利证书。同年特罗绛斯基提出借助机器进行翻译的详细步骤,并于同年设计出样机。 1946 年,美国的韦弗 (Weaver, Warren) 和美国人布思(Booth,A.D.)首次提出将电脑用于机译系统。 1947 年,布思与布里顿提出用数字计算机查阅储存在电脑记忆里的词典。同年,他们编制出自动查阅字典程序。1950年,美国人E 凯弗拉提出在机译中由人工进行译前编辑和译后审校的方案。 1954 年,美国乔治敦大学与 IBM 公司联合试验使用电脑的机译系统。这标志着机器翻译进入新的发展阶段。 2、迅速发展阶段( 1954-1966 年)。美国先后出现许多研究小组;英、法、德、意等政府积极为研究项目提供资助;苏联和东欧一些国家的研究工作也很活跃。 3 、低潮阶段( 1966-1976 年)。互相竞争和封锁导致研究内容重复,耗费大量可以节省的时间和金钱。一些研究人员又遭到困难和挫折。在美国,最初人们认为机器可以完全代替人译的幻想普遍破灭,研究经费随之大幅度收缩,西欧也是如此。美国语言处理自动化咨询委员会于1966年发表了一份调查报告,她的出笼标志着机译研究低潮阶段的开始。4、复苏阶段(1976-现在)。直到1976年3月, 在弗吉尼亚的拉什陵举行了一次机译研讨会,美国的机译研究才开始复苏。展望:翻译是十分复杂的脑力劳动。让电脑做这种工作也会困难重重。目前比较一致的看法是,机译首先要解决精细的电脑程序编制和计算方法问题。这又要解决两个问题:一是电脑如何分析和综合语法现象;二是如何选择词义的问题。此外,因为语言是丰富多彩的,因此,机译系统绝对达不到尽善尽美的程度。 (靳文 《中国翻译词典》)
如今机器翻译对于许多人来说应该已经不是很陌生的的词儿了。今天我们可以在软件商店买到形形色色的 PC机译软件,各种语言对的,如英文到中文的,中文到英文的,或者日文到中文的,甚至也有英文到日文的等等,还有什么家庭版的,专业版的,配带各种不同专业词典可供选择的等等。据估计,世界上目前市场上有1000多种不同的机器翻译软件在销售,我国具有一定规模的PC机器翻译软件也有近20种。在世界范围内PC机译软件的价格都不贵,而且价格还在不断地下降。现在我们甚至可以在网上免费享用翻译系统的服务。因此现在用户已有较大的选择余地。当然一个用户在选择机译系统时,应该首先很好地弄清自己的需求。具体来说,我们有如下的建议。
第一,如果你的翻译任务是较稳定的或长期的,专业单一的,翻译结果要达到出版水平的,你可能是一个翻译公司、或一个专业情报所,那么你可以选择配有大规模相应领域的专业词典的,并且又经得起大批量、长时间翻译运行的(有的系统会死机的)系统。同时更理想的是你还可以再配备一个“翻译记忆”系统,它可以帮助你处理文本格式问题(如字体、图表、脚注等),而且可以把你经过修改的正确译文保存起来供以后翻译时再利用。
第二,如果你的翻译任务是临时性的,专业不单一,翻译质量要求无须达到出版水平的,那么你可以选择配有多个领域的专业词典的,但还是应经得起大批量、长时间翻译运行的系统。
第三,如果你是为了浏览网上信息要用到翻译,那么你一定要选择可以在网上运行的系统。如果你的外语水平还可以但词汇量有限,那么还可以选择一种只有大规模词典但可随点随译的系统。今天机器翻译比起10年前,可以说相当繁荣。但是我们愿意提醒,在这繁荣的后面,却存在着危机。前面说到那个ALPAC报告曾给机器翻译带来的创伤如今似乎已被抚平了。但实际上它的阴影始终会时不时地再出现在机译研究者的头上。如今随着有越来越多的机译系统走向市场,政府的投资者感到在这种情况下如果还要投资攻关似乎有点名不正言不顺了。而商家则只是想现在该是把现成的技术包装包装就可以赚钱的时候了。经常会听到老板们会这样问研究者,“你估计开发出产品要多长时间?你的系统正确率如何?”,大概没有一个研究者会回答说,将来“正确率大约在百分之 五十左右”的。如果果真那样回答,那么他的项目还不当场就被“枪毙”了。可是现有的机译系统(不仅是英汉或汉英,国外的其他语言对的系统)在面对真实文本时,其正确率实际上有多少呢?机译的译文质量确实还远不能令人满意。近来国外有些人挖苦地说“MT,不是 machine translation 的缩写,而是 mad translation(疯子的翻译)的缩写。他们是近乎要跟机译来番决战似的。他们劝说人们不要购买机译系统,要翻译的话应该雇翻译人员。国内也有人讽刺地说,有了机器翻译,“满篇英文难不住,满篇中文看不懂”。这些固然是比较极端的评价,但机译译文质量确实一直是个老大难问题。著名的机译评论家 Hutchins在最近的机器翻译峰会上的发言中说,机译译文质量至今并没有取得实质性的进展,很多 50 年前未解决的问题如今依然存在。还有一种更加深层的危机,那是来自研究人员自身的。他们说“在现有的技术条件下,机译译文质量也只能这样了。”说这话时似乎他们不是“现有的技术条件”的创造者。这样一来,可能出现的情况将是投资者和研制者都在以较低水平的系统忙于行销赚钱,而不再有足够的经费和技术投入。机器翻译无论在理论上或是技术上都还未成熟。现在只是由于人们对于克服语言交流的障碍有着很强烈的需求,尤其是因特网的出现这种需求更显突出,机器翻译才获得了以较低的译文质量满足这种需求的机会,并利用这一机会来求得进一步的发展。我们对这一现实要有清醒的认识。在行销上,应切忌不切实际的宣传。现在在报纸杂志上常能见到关于机器翻译系统的过度夸张的宣传。从长远看,这是“自砸牌子”的不智作为。正确的做法是把产品拿到用户那里去,老老实实地告诉他们机译系统能做什么和不能做什么,如何来利用它,利用它之所长,避它之所短。同时根据用户的需求来调试和改进系统。换句话说,多做培养用户,培养系统,培养市场的工作。近20年左右,机器翻译研究的方法真可谓花样翻新,令人目不暇接,有基于规则的、基于知识的、基于语料库的、基于统计和语料库的、基于例子的、基于对话的等等,从另一种角度,还有直接法、转换法、中间语言法等等。但其中哪一种也未能在翻译质量上取得实质性的突破。如何才能取得实质性的改进呢?我们不妨先对现有的机译和人译做一番比较。
机译:
1.一句一句处理,处理第一句时不知道第二句的内容是什么,处理第二句时,也不再去参考第一句的内容了;
2.对源语言的分析只是求解句法关系,完全不是意义上的理解;
3.它的开发者要求它几乎是万能的,它似乎什么领域都能应付,从计算机到医学,从化工到法律,似乎只要换一部专业词典就可以了;
4.它的译文转换是基于源语言的句法结构的,受源语言的句法结构的束缚;
5.它的翻译只是句法结构的和词汇的机械对应。
人译:
1.一般会先通读全文,他会前后照应;
2.对源语言是求得意义上的理解;
3.只有专业翻译人员,没有一个是可以包打天下的万能翻译人员的;
4.他的译文是基于他对源语言的理解,不受源语言的句法结构的束缚;
5.他的翻译是一个再创造的过程。
机器翻译研究归根结底是一个知识处理问题。它涉及到有关语言内的知识、语言间的知识、以及语言外的世界知识,其中包括常识和相关领域的专门知识。我认为从实用的角度看,全自动高质量的机器翻译不应该是个目标,至少不应该是近期的目标,但是从研究的角度说,全自动高质量却应该是个目标。因为这样我们不仅能够建立机译系统,而且能够探索人译的机制。近年来我在许多场合都强调机器翻译应该到了有所突破、有所创新的时候了。下个世纪的机器翻译研究应在如下三个方面有所突破:
第一,大语境,而不再是一个句子一个句子孤立地处理;
第二,基于理解,而不再是停留在句法分析的层次上;
第三,高度专业化、专门化,而不再是个“万事通,样样松”了。
在九月的峰会上几位机译权威教授都一致提出要进行深层次的基础研究,使对于源语言的分析基于理解。呼吁投资者加大对于基础研究,如大规模知识词典建设的投入。笔者经过十多年的努力建立的大型知识系统《知网》,今年已上网供研究免费使用。它引起了海内外学者的广泛注意,并已有人在它基础上开始进行新的探索,如上面介绍的基于理解的分析以及新的排除歧义的方法。请读者浏览www.how-net.com 网页。
随着因特网的普及,随着信息时代的到来,机器翻译的应用前景是广阔的。作为人类探索自己智能和操作知识的机制的窗口,机器翻译研究将更加诱人。愿 50 年来尚未解决的问题会在新世纪里得到解决。
摘自《机器翻译漫谈》
董振东(中国中文信息学会常务理事)
http://tech.sina
.com.cn 2000/07/06 新浪科技机器翻译(machine translation), 又称机译(MT),是利用计算机把一种自然语言转变成另一种自然语言的过程。用以完成这一过程的软件叫做机器翻译系统。
从30年代起,人们便产生了利用机器翻译自然语言的想法。但是直到第二次世界大战以后的数年才有适宜的发展气候。但是信息理论的兴起,先进的密码破译技术的成功以及电子计算机的发明预示着机器翻译可能成为现实。50年代有几个小组开始研究机器翻译项目,人们对这一课题的发展前景期望很大。然而,最初的结果并不令人鼓舞。翻译系统能够处理的资料种类十分有限,译文拙劣,错误百出,而且需要人工后期校订,以致证明比用人工完成整个翻译工作的成本还要高。主要原因是缺乏充分精细的语言理论来为机器翻译需要承担的任务提供一个参照系。最早的机器翻译系统所做的不过是在各语言的单词之间寻找对等的成分——实际上是在充当一部自动化的词典。到了70年代语言学和电子计算机知识和技术的重大发展,又为机器翻译的发展创造了新的机遇。 特别是进入90年代,CPU的处理速度越来越快,储存器的储存量越来越大,这在物质上为机器翻译提供良好的发展条件。机器翻译繁荣期的最重要的特点是机器翻译研究造像了实用化,出现了一大批实用化的机器翻译系统,机器翻译产品开始进入市场,变成商品,机器翻译系统的实用化引起了机器翻译系统商品化。机器翻译的繁荣期是以1976年加拿大蒙特利尔大学与加拿大联邦政府翻译局联合开发的实用机器翻译系统TAUM-METEO正式提供天气预报服务为标志的。这个翻译系统投入使用后, 每小时可翻译6万到30万个词,每天可以翻译1500到2000篇天气预报资料,并能够通过电视、报纸立即公布。TAUM-METEO系统是机器翻译发展史上的一个里程碑,它标志着机器翻译由复苏走向了繁荣。机器翻译已经不再是学者们的梦想,他已经变成了活生生的现实。
中国是世界上第五个进行机器翻译实验的国家,从一开始就得到了国家的高度重视。早在1956年它便以“机器翻译”/“自然语言的数学理论”列入了当时的《科学发展纲要》。以后则列为“六五”、“七五”,以及“863”等重大科研项目。 中国的机器翻译研究虽然也有过10年的停滞,但与国外不同,并不是由于对机器翻译研究本身的中断投资引起的。70年代中期,我国机器翻译研究从停滞走向了复苏,是协同攻关的特点体现最充分的时期。80年代中90年代初期是我国的机器翻译研究自复苏以来第二个重要时期。在这一时期里,产生过两个在中国机译史上具有重要意义的实用系统。它们分别是军事科学院研制的“KY-1”英汉机译系统,它获得了国家科技进步二等奖,后来被开发为“译星”,成为中国第一个商品化系统,另一个是中科院计算所研制的“863-IMT”英汉机译系统,它获得了国家科技进步一等奖,它的技术带来了十分可观的效益。这两个系统也是多单位、多方面人材通力合作的结果。在这一时期里还有一个机译系统是不应被遗忘的。它就是由邮电科研院研制的“MT-IR-EC”,这是一个非常实用的通讯题录系统,人们利用它翻译出版通讯题录刊物,从而使刊物的发行效率得到很大的提高,它因此成为了第一个荣获国家科技进步奖的机译系统。在这一时期里,中国参加了由日本发起的亚洲五国机器翻译研发的合作项目。国内近10个单位参加了这一长达7年的国际项目。这次的大协作对于培养人才、传播技术、积累资源(如词典等),以及使中国的机译研究走向世界,都有着深远的影响。另外,这个时期又正值“七五”,它给了更多的单位和研究人员参与机译研究的机会。在此期间,清华大学和南京大学研制了实用的日汉机译系统。中国科大在机译通用工具方面进行了富有成果的研究。北京大学研制成功了机译系统自动评估系统,这在国内外尚属首例。90年代初期至今,中国的机器翻译走入了快速发展的时期,出现了许多商品化系统。近期的机译系统大体上有这样一些特点:多数配有大规模的多种领域的专业词典,多数能在网上运行,有相当不错的方便用户的界面。新的应用领域的机器翻译研究,如对话翻译系统的研发等也已开始。中国的机译研究的水平在总体上从一开始就不低,如今在PC产品、网上系统的开发方面与世界上机译研究发达的国家相比并不逊色。
展望未来,机器翻译将随着人工智能处理技术的进步而有长足的进展,机器翻译势将打破国界和语言壁垒,使人类间的沟通更为方便更为迅速。
机器翻译从工作原理上分为两个派系:传统派和现代派。传统机器翻译从总体模式上可以分为三类:直接翻译法(Direct Translation)、中间语言法(Interlingual approach)以及转换法(Transfer approach)。
直接翻译从源语言的表层句子出发,将单词或固定词组直接置换成目标语言的对应成分。这种方法对翻译过程的认识过于简单化,基本上属于一种过时的方法。
中间语言法把源语言经过分析转换成一种对所有语言都适合的一种句法―语义表示,从这种表示可以生成任何一种目标语言。在设计多种语言互译的机器翻译系统时,这种方法在理论上是非常经济的。
转换方法采用两种内部表达并按三个阶段进行翻译,第一个阶段把源语言转换成源语言的内部表达,第二阶段把源语言的内部表达转换成目标语言的内部表达,第三阶段再根据目标语言的内部表达生成目标语言。当今许多实用的系统都采用了这样的总体结构。
从本质上讲,机器翻译系统的不同之处主要是各个系统对翻译所需要的分析(或理解)深度有不同的意见。直接翻译法认为不需要深层次的源语言分析,在源语言句法结构未知的前提下就可以翻译,转换法认为,要进行翻译,源语言的句法结构就应该提前得到,而中间语言法则认为需要更为彻底的源语言分析。实际上,即使采用同一种总体模式的不同实际系统,对分析深度的处理也是有所不同的。
现代派机器翻译是基于语料库,其工作原理是基于设置一个含有各种句型的原语言和目标语言双语对照的语料库。在翻译时,从语料库中抽取与输入句子相类似的句子,然后模仿例句来实现原语言的转换。这种研究方法的难点在于庞大语料库的构筑。“基于语料库”的方法将会使翻译质量有所提高,但建立一个完善的语料库需要投入巨大人力和物力。不过在一个受限制的领域里,这个方法是非常有效的。
不论是传统派系还是现代派系,机器翻译目前所应用的范围只限于求达意不求传情的科技文献,特别是个分门别类的专业、学科、各种说明书、使用手册等。如果让机器来进行诗歌翻译,就有些勉为其难了。
目前多数的机器翻译系统都是先用人工建立的语法分析规则,逐句分析句子的词间关系,并通过字典来确定词意,然后才能将一个句子转换成另一文种。因此,系统必须知道句子中每个单词的精确含义,才能产生出准确的译文。一旦遇到一词多意的单词,系统便无法自行做出正确选择,译文也就会出错。比如基于语法分析的机器翻译技术无法自行判断bank一词应译为“银行”还是“河岸”,cool一词应译为“冷”还是“很棒”。 此外,机器翻译系统只能通过人工建立的语法规则来分析语句,但人类的语言十分丰富灵活,语法规则不可能覆盖所有的语言现象,同时,规则越多也会使系统越复杂,最终有可能导致系统难以管理。目前典型的商用机器翻译系统仅就两种比较复杂语种之间的翻译,就要有25万到50万个词的词典,以及500到1000条的语法规则。即使规模如此,一旦遇上规则中没有定义的语言现象,系统依旧无计可施。
一个合格的翻译遇到一词多意的情况时,可以通过对上下文的理解,以及长期的知识文化积累,正确的选择词意。人工翻译时,翻译人员通常只是参考词汇译文的意义,句子的表达方式则根据具体情况十分灵活地处理。而且翻译人员还可以在译文中修正原文的拼写错误和语法错误,机器翻译系统则不具备如此的智能。这就是目前机器翻译的水平赶不人工翻译水平的主要原因。
以下是一道英文菜谱用机器翻译成中文,结果就十分好笑,如果你完全按译文执行,做出来的恐怕不是美味而是毒药:
Toss fish slices with marinade ingredients. Place fish in center of a platter. Arrange daikon and carrot shreds around fish. Scatter fresh and pickled ginger, the pickled scallions, lime leaves, chiles, green onions and cilantro over fish. Sprinkle with peanuts and sesame seeds.
Just before serving, squeeze the lime or lemon juice over all. It is customary for everyone to join in and toss the salad. Using chopsticks, each diner digs from the bottom of the salad and lifts the ingredients to mix together.
机译:用腌泡汁原料摇摆鱼片段。在一个大盘中心中的地方鱼安排在鱼周围的DAIKON和胡萝卜碎片。驱散新鲜和腌渍的姜,腌渍的青葱,石灰叶子,CHILES,绿色的洋葱和超过鱼的CILANTRO。洒花生和芝麻种子。
就在服务之前,挤榨石灰或者柠檬汁超过所有。它由每个人加入是习俗的和摇摆色拉。当使用筷子时,每一个用餐者都从色拉的底挖掘并且举起共同混合的原料。
关键的错误出在石灰一词,将石灰水加入菜中岂不是要害人。这是因为机器无法在 lime一词的多个含义“石灰”、“粘鸟胶”、“酸橙”中做出正确选择才闹出的笑话。
Prepare a saturated solution of sugar.
机译:准备一种饱和的解决办法的糖。
(多义词与不同的辞搭配具有不同的词义,原文中的 solution 有“解决办法”、“解决”、“解答”、“溶解”、“溶液”等意思,人工翻译可以根据语境来选择词义,机译尚无法达到通过对语境的分析判断来翻译的水平,计算机往往是根据该词的第一个词典词义来翻译,因此,就出现这样的错误。正确的翻译应该是:准备一份饱和糖溶液。)
Telescopes are housed in large buildings called observatories.
机译:望远镜坐落在大建筑物调用天文台。
(英语中的一词多类也常常造成机器翻译困难。如 do, have 等既可作实义动词,又可作助动词,但计算机往往都把它们当作实义动词来译。那些形式上与谓语动词相同,实际上却是作定语或状语的分词,机器翻译时也统统作为与动词处理。“调用天文台”的错误就是这样产生的。正确的翻译应该是:望远镜都是安置在高大建筑物即天文台上。)
Welcome to the world of computer telecommunications.
机译:欢迎您到该计算机的世界远程通信来。
(汉语中没有冠词,英语中的冠词常译成汉语的“这”、“那”、“该”等。但并非所有冠词都要译出来,因而,如何把握成了机器翻译的难题。译文中的错误“该计算机的世界”就是这样产生的。 正确的翻译是:欢迎到计算机电信世界来。)
Water quality has improved in many ways .
机译: 水品质有改良的在许多方面。 (“有改良的在许多方面”是不符合汉语习惯的表达,主要是状语的位置不对。计算机尚无法根据状语、定语等在句子中的修饰关系,灵活准确地处理状语、定语等在汉语中的恰当位置。正确的翻译是:水质已在许多方面得到改善。)
What's the temperature at the sun 's center ?
机译:该温度在太阳是中心是什么?
(译文表达不符合汉语习惯,计算机错把 sun's 当作sun和is的缩写。英语中名词所有格“ 's ”形式和系动词“is”的缩写“'s”相同,所以计算机在翻译时经常把两者混淆。正确的翻译是:太阳中心的温度是多少?)
张文定在福建南平工作。
机译:Zh Zh is fixed on Nan Ping of Fujian and works.
(某几个汉字的组合是人名、地名或其他词,计算机尚无法作准确判断,这是汉英机器翻译的一个难点。译文错误主要出在对“张文定”这个名字的判断上,正确的翻译应该是: Zhang Wending works in Nanping of Fujian. )
要是没有阳光照射,地球上就没有树木。
机译:If there is no sunshine to shine, there are no trees on the earth.
(根据汉语习惯可以说“阳光照射”,但英语应该说“太阳照射”,另外原文是假设,英文应该用虚拟语气表达。这些在人工翻译时,都可以根据语境来判断,而机器翻译就难以做到。正确的翻译应该是:If the sun didn't shine on the earth, there would be no trees. )
以福州菜为代表的闽菜,是全国八大名菜之一。
机译:Fujian cuisine represented by Foochow cuisine , It is one of eight major famous dish in the whole country. (每一个英语句子都有唯一的一个限定形式的谓语中心成分,汉语句子则随意得多,句子之间也没有明确的界限。汉英机器翻译时很难准确断句。另外汉语名词没有复数形式,英语有单复数之分,机器翻译时也很难判断何时该用单数,何时该用复数。正确的翻译应该是: Fujian cuisine represented by Fuzhou cuisine is one of eight famous cuisines in China. )
总之,在机器翻译中,英汉两种语言的转换和生成,还有许多难题没有解决,如单复数、时态、语态等各种形态信息的处理,尤其是在篇章中,如何处理按时间顺序、方位关系、因果关系等逻辑概念的过渡词语,如何处理通过省略、替代、照应等句法手段所表示的承接关系或通过词汇的重复、同义词、近义词、反义词的使用所表示的承接关系,都有待进一步完善。
由于计算机不断升级换代,计算机翻译的能力也随之增强。目前西方各种语言之间通过机器翻译的准确率有的已经达到 95% 。在欧、美、日本等发达地区,机器翻译已经分担了很大一部分过去由人工翻译的日常工作,而且正朝着智能声控翻译通讯技术的方向发展。近十几年来,我国也先后开发出东方快车,金山快译通、译星、通译、金桥译港世界通(www.netat.net) 翻译网站等,但由于英汉两种语言之间的差异大大超过西方各种语言之间的差异,英汉机器互译的难度仍然很大,结果也不尽人意。不过我们还是应该承认机器翻译毕竟有了很大的进步,从七、八十年代只能处理简单的句子,到现在能处理大块的文章,从一小时能翻译几千字,到现在的几十万字。而且机器翻译在处理专业性强、数量大的技术资料和论文方面,具有相当大的优势,最起码省去了大量查字典和文字输入的时间。
当我们讨论机器翻译系统和翻译工具的发展时,首先需要区分四种基本的翻译需求:第一是传统型,它要求翻译结果和人(翻译家)翻得一样好,即翻译结果达到出版水平;第二种需求对翻译质量的要求稍低一些,尤其是对文体的要求较低,用户这时最感兴趣的是了解某篇文章的基本内容,因此希望翻译速度越快越好;第三种需求是对话双方一对一的交谈(打电话或者在 Internet 聊天室里聊天)或无需写在纸上的演讲 (如外交场合的谈话);第四种需求是在信息检索、信息抽取、数据库访问等多语言系统里所需进行的翻译。
第一种机器翻译需求是为了传播思想。自机器翻译系统出现之日起,这种需求可以说在某种程度上得到了满足。然而,要想达到用户需要的质量,机器翻译输出结果常常还需要由翻译家修改或进行后续编辑。在很多情况下,这些修改都是必需的,因此机器翻译系统实际上只是产生了一个“草稿型”译文。如果要减少后续的修改,就必须在翻译前对输入文件进行规整,对所用词语和句子结构进行“限制”,使机器翻译系统不至于产生太多必须修改的错误。
第二种需求是为了了解信息而使用机器翻译系统,这一需求实际上已经作为第一种需求的副产品得到了实现。既然机器翻译系统尚不能直接产生高质量的译文,因此用户能从未经编辑的译文中找出或猜出他们需要的东西也是很有帮助的,毕竟翻译出一部分总比一点没有翻译要好。在这种情况下,尽管机器翻译的译文结果很糟糕,但随着 PC 价格越来越低廉,这类机器翻译系统的需求量也大大增加了。
第三种需求是以交流信息为目的的机器翻译。由于信息更新速度很快,不可能由人来翻译,用户需要马上得出翻译结果以便传达信息的基本内容。例如基于 Internet的在线翻译系统,它能实时进行翻译,但翻译质量难尽人意。有些机器翻译系统目前正在探索如何“自然”地扮演自己的角色。另一种用于人际交流的机器翻译系统是口语翻译系统,它可以用在电话交谈、商务会谈等场合。目前有很多专家正在研发这类系统,其难点在于语音合成和自动翻译。这一领域的研究尽管进展缓慢,但我们仍然可以希望将来在非常受限的领域里应用在线口语机器翻译系统。