自然语言处理是人工智能领域研究的核心内容之一,近年来取得了快速进展和广泛应用,在学术界和企业界备受瞩目。
2019年5月10日,中科院自动化研究所自然语言处理团队负责人宗成庆研究员在智能化大厦第1会议室模式识别国家重点实验室内部交流会上作了题为“自然语言处理方法与应用”的学术报告。马颂德研究员、刘成林研究员等老师和研究所近百名学生参加了报告会。宗成庆研究员从学科产生与发展、技术挑战、基本方法、应用举例、技术现状等多个视角对自然语言处理领域进行了全面梳理,并简要介绍了其团队近年来的主要工作,以及对该学科未来发展方向的分析和展望。
讲座首先对自然语言处理的基本概念、研究内容和理论方法进行了简要的梳理,介绍了自然语言处理这一学科的产生和发展,强调了计算机理解自然语言的科学意义和应用价值。接着,对自然语言处理面临的技术挑战进行了分析,包括自然语言中大量存在的未知语言现象、歧义词汇和结构、隐喻表达、以及翻译问题中不同语言之间概念的不对等性等。宗老师认为,语义概念的表示和计算、说话人意图的理解和推理、以及语用场景的分析是当前面临的核心挑战。之后,宗老师介绍了自然语言处理的基本方法,并通过两个具体实例展示了不同方法的实现过程及其存在的问题。他认为,虽然目前NLP技术在很多领域得到了成功的应用,但远未做到自然语言的深度理解,在这一领域仍然存在大量的难题和探索的空间,如现有的机器翻译系统无法准确地处理篇章范围内的指代问题、无法区分由于细微文字或句法差异造成的句子语义反转、无法从译员的译后编辑过程中自动学习翻译知识等。最后,宗老师介绍了自然语言处理团队的研究方向及部分研发成果。
目前该团队的主要研究方向包括自然语言处理基础任务、机器翻译、知识图谱、信息抽取、问答系统、情感分类、基于多模态信息融合的自然语言处理、类脑启发的自然语言处理方法等。近年来团队在上述各方向上取得了较好的进展,产出了一批优秀成果,包括三部专著:《统计自然语言处理》、《文本数据挖掘》和《知识图谱》。在报告最后,宗老师对该学科未来发展的趋势和方向进行了简要分析和展望。
讲座现场