爱译网logo 智能,研发,应用,推广  
           
会员名称: 会员密码: 注册
中文版
英文版
www.aitrans.net
AITRANS.NET--A HIGHWAY TO THE PALACE OF INTELLIGENCE AND WEALTH FOR TRANSLATORS AND READERS。让计算机模拟人的翻译思维,存储专业人士的高智力翻译成果,共建共享专业型智能化知识库,建立国际性智能翻译知识库标准,实现高质量的全自动机器翻译。
 
关于爱译网
客户服务
翻译论坛
下载专区
Home > 人工智能翻译 >翻译实用技术 > 术语提取
 

术语提取

    术语自动抽取是自然语言处理的一个重要问题。目的是在文本集中抽取一定意义的词语搭配。术语抽取可以应用在机器翻译、自动索引、信息检索、信息抽取、构建词汇知识库等领域。目前,国内外进行词语搭配抽取的研究方法主要是基于统计。作为一种特殊的词语搭配,术语的抽取过程一般有两个步骤: 

    1、进行术语候选抽取(Term Candidate Extraction); 
    2、在候选集中进行术语选择(Term Selection)  

    通常基于统计计算字串的内部结合强度来决定是不是候选术语,常用的方法有频率、互信息、Dic公式等。其中互信息方法在两字新词抽取方面结果较好,它的F-测量为57.82%。术语选择的方法有依据频次排序选择法,即根据候选术语在语料中出现的频次从多到少排序,按顺序选择一定数目的候选术语作为术语选择的结果;另外就是利用术语的词法、句法信息和语义信息等进行术语选择。

COPYRIGHT 2010 AITRANS, ALL RIGHTS RESERVED. 京ICP备9035536号

热线:010-82893875 邮箱:info@aitrans.net

 
 
360网站安全检测平台