在12月5日刚刚结束的第23届亚太地区语言、信息与计算(The 23rd Pacific Asia Conference on Language, Information and Computation, PACLIC)国际学术会议上,模式识别国家重点实验室博士生张家俊同学与导师宗成庆研究员共同署名的论文“A Framework for Effectively Integrating Hard and Soft Syntactic Rules into Phrase Based Translation”获得最佳论文奖。

    PACLIC是自然语言处理领域一个历史悠久、影响较大的国际学术会议,据有关会议排名网站统计,在人工智能与机器学习系列的国际会议中位列前7%。该会议每年举办一次,今年是第23届,于12月3-5日在香港成功召开。本届PACLIC大会共收到论文投稿145篇,其中,58篇被接受为会议报告,最终2篇被评为最佳论文。

    张家俊和宗成庆本次获奖的论文针对目前统计机器翻译中短语调序方法的缺陷,提出了一种高效利用句法知识指导调序的方法。其基本思想是:在翻译前首先获取句法调序知识,并用统一的格式表示人工调序规则和概率调序规则,然后将其作为一种特征融入改进后的翻译模型中,最终利用这些句法特征在翻译过程中指导调整短语的顺序。实验表明,该方法明显改善了翻译系统的译文质量。本届PACLIC论文评审委员会认为:该论文提出了一种新颖的融合句法调序规则的方法,没有采用传统的方法利用句法规则调整源语言的语序,而是将句法规则作为一种特征巧妙地融合到翻译模型中,在几乎不增加翻译时间的基础上,显著地改善了翻译性能,适合于大多数亚洲语言与欧洲语言之间的翻译。

    附件: