Português para Fins Acadêmicos sob o aporte da Linguística de Corpus e do Processamento de Linguagem Natural
DOI:
https://doi.org/10.14393/DL29-v11n2a2017-6Palavras-chave:
Linguística de Corpus, Processamento de Linguagem Natural, Português para Fins AcadêmicosResumo
O presente artigo intenta apresentar um projeto de interface entre Linguística de Corpus e Processamento de Linguagem Natural (PLN) em andamento na Pontifícia Universidade Católica do RS. Tal projeto consiste na exploração, via corpus escrito, de teses e dissertações em Linguística oriundas do Programa de Pós-Graduação em Letras da referida instituição de ensino superior, por meio de um software chamado ExATO (LOPES, 2012). A partir dessa ferramenta produzida em PLN, podemos ter em mãos uma série de recursos linguísticos que permitem a prossecução da nossa análise, tais como, a detecção de Hierarquia de Conceitos, Listas de Termos Extraídos, Concordanciador de Termos e Nuvens de Conceitos a fim de embasarmos uma proposta de ensino de Português como Língua Adicional, com vistas à proficiência dentro do gênero acadêmico por alunos não-falantes de Língua Portuguesa. Trazemos uma série de resultados já disponibilizados pelo ExATO, os quais fomentam a discussão acerca dos temas visualizados a partir dos dados obtidos, bem como fomentam a interdisciplinaridade necessária entre Linguística e Ciência da Computação, no que concerne à descrição e explicação do viés pragmático da LP em grande escala dentro dos limites da esfera discursiva universitária.Downloads
Métricas
Referências
BAKER, P.; HARDIE, A.; MCENERY, T. A Glossary of Corpus Linguistics. Edinburgh: Edinburgh University Press, 2006. 187p.
BIBER, D.; CONRAD, S.; REPPEN, R. Corpus Linguistics: Investigating Language Structure and Use. Cambridge: Cambridge University Press, 1998. https://doi.org/10.1017/CBO9780511804489
BICK, E. The parsing system PALAVRAS: automatic grammatical analysis of Portuguese in constraint grammar framework. 2000. Ph.D. (Doctoral Thesis). Arhus University, Arhus, 2000.
DALE, R.; MOISL, H.; SOMERS, H. Handbook of Natural Language Processing (first edition). New York: Marcel Dekker, 2000.
FINATTO, M. J. B.; LOPES, L.; CIULLA, A. Processamento de Linguagem Natural, Linguística de Corpus e Estudos Linguísticos: uma parceria bem-sucedida. In: Domínios de Lingu@gem. v. 9, n. 5 (dez. 2015).
KENNEDY, G. An introduction to Corpus Linguistics. London & New York: Longman, 1998.
LOPES, L. Extração Automática de Conceitos a partir de Textos em Língua Portuguesa. 2012. Tese (Doutorado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2012.
LOPES, L.; VIEIRA, R. Processamento de Linguagem Natural e o Tratamento Computacional de Linguagens Científicas. In: Linguagens Especializadas em Corpora: modos de dizer e interfaces de pesquisa. PERNA, C.; DELGADO, H.; e FINATTO, M. (orgs.). Porto Alegre: EdiPucrs, 2010. p.183-201.
LOPES, L.; FERNANDES, P.; VIEIRA, R. ExATO - High Quality Term Extraction for Portuguese and English. In: 2016 IEEE/WIC/ACM International Conference on Web Intelligence, 2016, Omaha. Proceedings of International Conference on Web Intelligence. Omaha - Nebraska - USA, 2016. p. 1-6. https://doi.org/10.1109/WI.2016.0092
LOPES, L.; VIEIRA, R. Evaluation of cutoff policies for term extraction. Journal of the Brazilian Computer Society, v. 21(1), p. 1-9, Elsevier, 2015.
LOPES, L.; FERNANDES, P.; VIEIRA, R. Estimating term domain relevance through term frequency, disjoint corpora frequency - tf-dcf. Knowledge-Based Systems, v. 97: p. 237-249, Elsevier, 2016.
LOPES, L.; VIEIRA, R. Improving Portuguese Term Extraction. In: International Conference on Computational Processing of the Portuguese Language - PROPOR, 2012, Coimbra. Lecture Notes in Computer Science - Proceedings of PROPOR 2012. Heidelberg: Springer, 2012. v. 7243. p. 85-92. https://doi.org/10.1007/978-3-642-28885-2_9
LOPES, L.; FERNANDES, P.; VIEIRA, R.; FEDRIZZI, G. ExATOlp - An Automatic Tool for Term Extraction from Portuguese Language Corpora. In: LTC'09 - 4th Language and Technology Conference, 2009, Poznan, 2009, Poznan. Proceedings of the Fourth Language and Technology Conference. Poznan: Adam Mickiewicz University, 2009. p. 427-431.
MANNING, C. D.; SCHÜTZE, H. Foundations of Statistical Natural Language Processing. Cambridge: The MIT Press, 1999.
MITKOV, R. (ed.). The Oxford Handbook of Computational Linguistics. Oxford: Oxford University Press, 2003.
MOLSING, K. V.; PERNA, C. B. L.-P. Research and Teaching in Portuguese for Specific Purposes. BELT-Brazilian English Language Teaching Journal 5.2 (2015): 1-7. https://doi.org/10.15448/2178-3640.2014.2.19701
TEUBERT, W.; CERMÁKOVÁ, A. Corpus Linguistics. A short introduction. London: Continuum, 2007.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Autores que publicam nesta revista concordam com os seguintes termos da licença Creative Commons
CC BY-NC-ND 4.0: o artigo pode ser copiado e redistribuído em qualquer suporte ou formato; os créditos devem ser dados ao autor original e mudanças no texto devem ser indicadas; o artigo não pode ser usado para fins comerciais; caso o artigo seja remixado, transformado ou algo novo for criado a partir dele, o mesmo não pode ser distribuído.
Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.