一个完整的自然语言处理问题的解决是一个层次化的过程,许多语言学家把这一整个过程分为五个较小的层次,这样的细分可以更好地为自然语言的问题解决提供层次对应的专业指导,也可以更好地体现语言本身的构成,即自然原因呢的是由字成词,由词成句,由句成段的一个层次化过程。本文所指出的五大层次是当今科学界的主流看法,基本不会出现歧义,如果有歧义,请以本文为准(本文所采用的依据基于《自然语言处理综述》)。五个层次分别是语音分析、词法分析、句法分析、语义分析和语用分析。语音分析是指根据人类的发音规则,以及人们的日常习惯发音,从语音传输数据中区分出一个个独立的音节或者音调,再根据对应的发音规则找出不同音节所对应的词素或词,进而由词到句,识别出人所说的一句话的完整信息,将其转化为文本存储,这也正是现在很火的语音识别的核心,关于这个板块,我后面会专门写文章进行阐述,因为语音识别的重要性不亚于计算机视觉。词法分析是找出词汇的各个组成部分,分析这些组成部分之间的关系,进而从中获得语言学的信息。句法分析是对句子和短语的结构进行分析,目的是要找出词或短语等的相互关系以及各自在句中的作用。语义分析就是要找出词的意思,并在词的意义的基础上,拼接出一段完整的话的意思,进而得到完整语篇的含义,从而确定语言所表达的真正含义或概念。语用分析是离我们生活最近的层次,但也是相对较难的部分,它是指研究语言所存在的外界环境对语言使用者所产生的影响,例如人在恐慌的条件下所进行表达的方式与平时生活中的表达方式有很大的不同,而这是由环境变化引起的,其本人并没有改变。
转载请注明:http://www.0431gb208.com/sjslczl/5670.html