编译原理

前言编译原理是很有趣的一门学科，但是相对晦涩难懂。本文的首要目的是为我自己梳理编译原理的学习笔记，也是为了能为后人有一个参考的资料。本系列文章将会有若干篇，每篇文章的基本结构将会是：术语表：用于解释本文中的各种术语主要内容，将分为不同的几个标题技巧性的知识术语表本系列文章将在每篇的开头先把本文的术语解释一下。在编译原理的学习过程中，各种奇怪的术语总是令人困扰。 Lexical Analysis 将字符串转换为 Token 串的过程 Token 词法单元, 通过词法分析得到的词法单元 Regular Expression 正则表达式、正规式：用来描述词法的工具 NFA: Non-determined Finite Automaton，非确定有限状态自动机(详细解释见下文) DFA: Determined Finite Automaton, 确定有限状态自动机词法分析的过程词法分析的目的就是将一串字符串转化为计算机可以使用的串（也即 Token 串）。执行这一过程的程序是一种 “扫描器”。按照一定方向（一般是从左到右）扫描字符串，并将得到的 Token 通过一定的方式表达出来（例如 XML ) 1 2 flowchart LR 字符串 --> id[(扫描器)] --> Token串那么如何定义某个串为一个 Token 呢？这就需要用到正则表达式。正则表达式是给人类使用的，用于定义 Token 串的工具，而计算机对于正则表达式也是束手无策。实际上扫描器是基于有限状态自动机的。正则表达式本文不详细解释正则表达式，正则表达式理论上对于能够学习编译原理的同学并不陌生。需要注意的是正则表达式有三种最重要的符号：联合，通常使用+ 或 | 表示连接，通常不使用符号表示（或者使用 $\cdot$ 表示）闭包，通常使用* 表示上述符号的优先级顺序为从上到下，优先级递增。当然除此之外还需要括号来表示运算的优先级。...

编译原理（二）：语法分析

编译原理（一）：词法分析