Por favor, use este identificador para citar o enlazar este ítem: http://repositoriodigital.ipn.mx/handle/123456789/6880
Título : El formato de entrada y la caracterización morfológica de componentes de la base de datos con colocaciones y relaciones semánticas en español
Autor : Bolshakov, Igor A.
Miranda JIménez, Sabino
Palabras clave : Natural language processing (Computer science)
Fecha de publicación : 2003
Editorial : Instituto Politécnico Nacional. Centro de Investigación en Computación
Resumen : Existen pocos diccionarios o sistemas especializados que demuestran las combinaciones de palabras más frecuentes, son conocidos como diccionarios combinatorios y sólo existen para algunos idiomas: inglés, ruso, francés y algunos otros, pero para español no se conoce ninguno. En estos diccionarios, para una palabra consultada, se muestran los rasgos morfológicos de la palabra y las palabras con que se combina frecuentemente. La presentación de las com¬binaciones de palabras de algunos diccionarios no es muy buena ni la explicación de las relaciones sintácticas entre las palabras. Estos diccionarios son útiles para el aprendizaje del idioma y para resolver varias tareas de lingüística computacional. Para la presentación correcta de las combinaciones de palabras (colocaciones), es necesario obtener las características morfológicas de los componentes de la colocación, así como los papeles sintácticos y semánticos que los vinculan. En esta tesis se desarrollan las herramientas necesarias para la obtención de las característi¬cas morfológicas y semánticas de cada componente de la colocación; se demuestra la orga¬nización especial de las colocaciones en archivos que representan los papeles sintácticos y semánticos entre los componentes de la colocación. Además, se desarrolla el sistema que demuestra las combinaciones de palabras y los dife¬rentes papeles sintácticos y semánticos entre ellas. Una característica adicional del sistema es la capacidad de inferir colocaciones que no han sido explícitamente escritas en los archi¬vos de entrada, pero que pueden ser generadas de alguna forma lógica. // There are few dictionaries or specialized systems that demonstrate the combinations of more frequent words, exist they are known as combinatorial dictionaries and they only exist for some languages: English, Russian, French and some other ones, but for Spanish none is known. In these dictionaries, for a consulted word, the morphological features of the word and the words combines frequently are shown. The presentation of the combinations of words of some dictionaries is not good neither the explanation of the syntactic relationships among the words. These dictionaries are useful even the learning of the language and to solve sev¬eral tasks of computational linguistic. For the correct presentation of the combinations of words (collocations), it is necessary to obtain the morphological characteristics of the components of collocation, as well as the syntactic and semantic roles that link them. In this thesis the necessary tools are developed for the obtaining of the morphological and semantic characteristics of each component of collocation; the special organization of the collocations is demonstrated in files that represent the syntactic and semantic roles among the components of collocation. Also, the system is developed that demonstrates the combinations of words and the differ¬ent syntactic and semantic roles among them. An additional characteristic of the system is the capacity to infer collocations that have not been written explicitly in the entrance files, but that they can be generated in some logical way.
Descripción : Maestría en Ciencias de la Computación
URI : http://www.repositoriodigital.ipn.mx/handle/123456789/6880
Aparece en las colecciones: Maestría

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
Tesis 9151.pdf1.12 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.