Extração automática de candidatos a termos do Curso de Linguística Geral com apoio de recursos da Linguística de Corpus e do Processamento de Linguagem Natural

Autores/as

DOI:

https://doi.org/10.14393/DL18-v9n2a2015-4

Palabras clave:

Extração automática de termos, Curso de Linguística Geral, Saussure

Resumen

Este trabalho apresenta um estudo em que técnicas de Processamento de Linguagem Natural (PLN) e de Linguística de Corpus (LC) são utilizadas para extrair e estruturar termos relacionados a conceitos importantes de Saussure no texto em português do Curso de Linguística Geral (CLG). Tomando o CLG como um corpus, busca-se um método de representação automática de conteúdo através de ferramentas computacionais. Uma vez submetido ao parser PALAVRAS, um etiquetador morfossintático para a língua portuguesa, o corpus do CLG é processado pela ferramenta extratora de sintagmas nominais relevantes, denominada ExATOlp, que implementa diversas técnicas de PLN de base linguística e de base estatística. Em seguida, são geradas listas e gráficos hierarquizados dos sintagmas nominais do CLG, elencados pela ferramenta como os mais específicos/relevantes do corpus em questão. Esses resultados são comparados com dados gerados pela ferramenta AntConc, ferramenta de acesso livre bastante empregada em trabalhos de LC, aplicada ao mesmo corpus. Os resultados mostram o potencial da ferramenta ExATOlp para trabalhos em LC e para o levantamento de dados lexicais para estudos terminológicos, para a mineração de dados e para a geração de ontologias em língua portuguesa.

Descargas

Los datos de descargas todavía no están disponibles.

Métricas

Cargando métricas ...

Biografía del autor/a

Lucelene Lopes, PUCRS

PPG - FACIN/PUCRS

Maria José Bocorny Finatto, UFRGS

PPGL - Letras/UFRGS

Alena Ciulla, Universidade Federal do Rio Grande do Sul

PPG, Instituto de Letras UFRGS

Publicado

2015-12-18

Cómo citar

LOPES, L.; FINATTO, M. J. B.; CIULLA, A. Extração automática de candidatos a termos do Curso de Linguística Geral com apoio de recursos da Linguística de Corpus e do Processamento de Linguagem Natural. Domínios de Lingu@gem, Uberlândia, v. 9, n. 2, p. 40–55, 2015. DOI: 10.14393/DL18-v9n2a2015-4. Disponível em: https://seer.ufu.br/index.php/dominiosdelinguagem/article/view/31077. Acesso em: 25 nov. 2024.

Artículos más leídos del mismo autor/a

Artículos similares

También puede {advancedSearchLink} para este artículo.