经过多年的潜心研究、在大量基础性的语素收集、以及大量专业资料的实际翻译工作等基础上,爱译科技的研究团队逐渐形成了一套科学的语言翻译知识表征理论,并且在研究人脑的知识存储结构和智能翻译思维的成果上,根据神经网络原理设计了一种高度智能化的翻译知识库体系结构----博典智能翻译知识库,简称智能知识库。
该部分包括智能知识库介绍,智能知识库的作用,智能知识库的价值,智能知识库共享共建机制。
一、智能知识库介绍 (词汇、句对、句式、句型、模板、规则等的综合统一)
智能知识库,它利用人脑神经网络原理模仿人脑外语学习记忆和外语翻译知识记忆的方式和结构,包括:词库(词条)、句库(可同时包含句对、句式、句型)、以及用于关联词库与句库的、定义词法和句法的神经网络(数据/信息),句库中存储的每个句式和句型都构成了一个广义语法模式/模型,由此可实现分析、类比、推理、推测等计算机智能翻译处理,真正实现了“举一反三”。
所述句式/句型是基于实例的,它既是一个具体翻译实例,又是一个翻译模式、翻译句型,因此它既可用于基于词的精确匹配翻译,又可用于句式匹配翻译和句型匹配翻译。
智能知识库的优点是句库结构通用化、翻译知识记忆智能化。
智能知识库可以按翻译语种分类,比如:英汉、日汉、德汉、汉英、汉日、汉德等各种类型。
在一对翻译语种情况下,智能知识库又可按专业划分,比如:英汉机械智能知识库、英汉计算机智能知识库、汉英法律智能知识库等。
二、智能知识库作用 随着翻译知识的积累,智能知识库能发挥的作用越来越大。
图1示意性地描绘了智能知识库的作用。例如,某一专业智能知识库中,全部句子可归纳为1000万个句型时,随着在智能知识库中所积累的句子/句型数量S的增长,机器自动工作的时间越来越多,而人工操作的工作量越来越少。
例如,当智能知识库中所积累的句子/句型数量S为10万时,机器可自动完成20%的工作,人需要完成80%的工作。此时,节省时间为36%。
当智能知识库中所积累的句子/句型数量S为100万时,机器可自动完成50%的工作,人还需要完成另外50%的工作。此时,节省时间为60%。 当智能知识库中所积累的句子/句型数量S为800万时,机器可自动完成80%的工作,人只需完成剩下的20%工作。此时,节省时间为84%。 当智能知识库中所积累的句子/句型数量S为1000万时,机器可自动完成绝大部分工作,比如99.9%的工作,人只需进行一点点干预即可(0.1%的工作量)。此时,节省时间为99%。  图2从另一个角度说明了智能知识库的作用。其中,横坐标为智能知识库发展/积累的时间(月/年)。纵坐标表示翻译工作量和效率。
从该图中可看出,随着智能知识库的发展/积累,人工操作的工作量迅速成直线下降,而机器的自动作业则迅速地直线上升。工作效率指数地向上成倍提高。  三、智能知识库价值 智能知识库记忆标准:第一代翻译记忆标准(TMX)
第二代翻译记忆标准(ITMX);
智能知识库价值是与翻译市场(尤其是专业翻译市场)相关的。智能知识库的价值体现在它能准确翻译的比例(即翻译准确率)上,因为利用智能知识库能做好多少专业翻译工作,它就可替代人多少工作量。由于,智能知识库是逐年积累的,它能准确翻译的比例是逐步上升的。因此,专业智能知识库的市场份额是随着它能准确翻译的比例逐步上升的。
例如,某个公司、或某个行业,第二年用专业智能知识库能准确翻译的比例是全部翻译量的20%,那么,该专业智能知识库的价值就是当年专业翻译产值(比如10亿)的20%,即2亿。如果第九年利用专业智能知识库能准确翻译的比例提高到90%,那么该专业知识库的价值就是当年专业翻译产值(比如100亿)的90%,即90亿。
智能知识库也能用于大众化的翻译,一方面可产生社会效益;另一方面,也可通过各种商业模块产生巨大的经济效益。
 附:专业翻译市场简介 美国著名市场调研机构ABI的研究报告指出,预计到2008年底,世界人工翻译市场年产值将达到215亿美元。软件与网站本地化在2009年 将分别达到60亿美元和58亿美元。
我国目前注册的翻译公司有5000余家,实际上以各种形式从事翻译工作/服务的企业可以有数万个。在岗聘任的翻译专业技术人员约9万人,另有约数十万人以不同的形式从事翻译工作。
根据中国翻译协会的报告,“翻译产业”作为一个概念和产业门类,2008年中国翻译市场年产值为人民币250亿元;预计到2009年,年产值将突破人民币300亿。
四、智能知识库共建共享 爱译智能翻译技术的一个最重要的贡献是将其世界首创的智能知识库体系与Bodiansoft智能翻译产品相对分开/独立又有机结合在一起。将翻译知识的积累面向所有用户,用户可以随时创建和更新知识库,知识内容并不固化于软件中。这彻底摆脱了传统翻译软件由软件专业技术人员制定翻译规则的束缚。因此,在Bodiansoft智能翻译技术的基础上,利用其首创的智能化知识库原理和结构,所有用户可以实现智能化的知识共建共享。  如图所示,由于Bodiansoft智能翻译产品具有学习/自学习模块(功能),每个用户可以在进行翻译的同时,将其所产生的专业翻译成果积累到智能知识库中。而且每个用户都可加入到共建共享体系,将所积累的专业翻译成果与其他用户共享。反过来,又可得到其他用户的专业翻译成果。
采用Bodiansoft智能翻译技术来翻译并积累相应的翻译知识,可迅速提高准确翻译的覆盖率。但对于一个人或一个单位来说,要想积累某种翻译语言对中的所有句型,也是一项很艰巨的任务,尽管所说句型是有限的。 俗话说得好,“众人拾柴火焰高”。智能知识库共建共享的目的就是要创造一种“我为人人,人人为我的智能知识库资源共享的境界和机制”。从而,迅速解决计算机高质量自动翻译问题。
比如说,有100个用户参加某个智能知识库的共建共享,单个用户只要贡献一份智力成果就可得到其它99份智力成果。换句话说,一个人/单位需要100年才能完成的事情,通过智能知识库共建共享机制和体系,只需1年就能完成。
智能知识库共建共享机制内含以下两方面的内容: 1)翻译知识的共建共享;2)经济效益的共建共享。
在这种模式/机制中,所有参加智能化知识库共建共享的用户(个人、单位)不仅可共享到其他用户的专业翻译智力成果,还能从所述智能知识库产生的经济效益中分得应有利益。
|