Árbol de análisis

Un árbol de análisis sintáctico o parsing árbol [1] o árbol de derivación o árbol de sintaxis concreta es un ordenado, arraigado árbol que representa la sintáctica estructura de una cadena de acuerdo con algún gramática libre de contexto . El término árbol de análisis sintáctico en sí se utiliza principalmente en lingüística computacional ; en la sintaxis teórica, el término árbol de sintaxis es más común.

Los árboles de sintaxis concretos reflejan la sintaxis del lenguaje de entrada, haciéndolos distintos de los árboles de sintaxis abstractos utilizados en la programación de computadoras. A diferencia de los diagramas de oraciones de Reed-Kellogg que se usan para enseñar gramática, los árboles de análisis sintáctico no usan formas de símbolos distintas para diferentes tipos de constituyentes .

Los árboles de análisis generalmente se construyen en función de la relación de constituyentes de las gramáticas de constituyentes ( gramáticas de estructura de frases ) o la relación de dependencia de las gramáticas de dependencia . Los árboles de análisis se pueden generar para oraciones en lenguajes naturales (ver procesamiento de lenguaje natural ), así como durante el procesamiento de lenguajes de computadora, como lenguajes de programación . [ cita requerida ]

Un concepto relacionado es el de marcador de frase o marcador P , tal como se utiliza en la gramática generativa transformacional . Un marcador de frase es una expresión lingüística marcada en cuanto a su estructura de frase. Esto puede presentarse en forma de árbol o como una expresión entre corchetes. Los marcadores de frase se generan aplicando reglas de estructura de frase , y ellos mismos están sujetos a reglas de transformación adicionales. [2] Un conjunto de árboles de análisis sintáctico posibles para una oración sintácticamente ambigua se denomina "bosque de análisis sintáctico". [3]

Un árbol de análisis se compone de nodos y ramas. [4] En la imagen, el árbol de análisis es la estructura completa, comenzando desde S y terminando en cada uno de los nodos de la hoja (John, ball, the, hit). En un árbol de análisis, cada nodo es un nodo raíz , un nodo de rama o un nodo de hoja . En el ejemplo anterior, S es un nodo raíz, NP y VP son nodos de rama, mientras que John, ball, the y hit son todos nodos de hoja.

Los nodos también pueden denominarse nodos principales y nodos secundarios. Un nodo padre es uno que tiene al menos otro nodo vinculado por una rama debajo de él. En el ejemplo, S es padre tanto de NP como de VP. Un nodo hijo es aquel que tiene al menos un nodo directamente encima del cual está vinculado por una rama del árbol. De nuevo en nuestro ejemplo, hit es un nodo hijo de V.


Analizar el árbol a SAAB.