内容介绍
我们进入了大数据时代(big data era),我国的中文信息处理有了长足的进步,除了传统的基于规则的中文信息处理之外,在基于统计的中文信息处理、基于神经网络的中文信息处理以及知识图谱等方面也取得了显著的成绩。我国的中文信息处理成为了全世界自然语言处理(Natural Language Processing,NLP)的不可分割的组成部分,在全世界自然语言处理的很好会议中,我国学者都是积极的参与者或会议的组织者。作为《中文信息处理与汉语研究》的姐妹篇,《大数据时代的自然语言处理》结合中文信息处理的实践,分为四个章节,除了第一章的概述之外,后面三个章节分别介绍了大数据时代的统计机器翻译、神经网络模型和神经机器翻译、知识图谱等内容。最近,我国正在现有传统文科的基础上,进行学科中专业课程的重组,建设文文交叉、文理交叉的“新文科”。中文信息处理把现代信息技术融入到语言学中,是文理交叉的新文科建设的......