The contributions of Corpus Linguistics and Natural Language Processing in the elaboration of the prototype of the Ideological Dictionary of Locutions

Authors

DOI:

https://doi.org/10.14393/DL52-v16n4a2022-5

Keywords:

Phraseography, Computational Linguistics, Corpus Linguistics, Natural Language Processing, Ideological Dictionary

Abstract

In this work, we seek to demonstrate how resources and tools of Corpus Linguistics and Natural Language Processing could be used in the generation of the prototype of the Ideological Dictionary of Locutions, monolingual and, at the same time, onomasiological and semasiological. This type of phraseographic repertoire is composed of three large sections in the dictionary body: the synoptic-analogical part, the analogical (both corresponding to the onomasiological part of the work) and the alphabetical (with a semasiological characteristic). In developing this project, we used the Corpus Brasileiro and the Web as corpora.    As a tool for the elaboration of the dictionary body, we used the FieldWorks Language Explore software, FLEx. In the end, it was possible to verify that these computational instruments were of fundamental relevance for the accomplishment of the research purpose.

Downloads

Download data is not yet available.

Metrics

Metrics Loading ...

Author Biography

Thyago José da Cruz, Universidade Federal de Mato Grosso do Sul

Doutor em Letras pelo Programa de Pós-graduação em Letras (CPTL/UFMS), professor da Faculdade de Educação (FAED/ UFMS).

References

BERBER SARDINHA, T. Linguística de Corpus. Barueri, SP: Manole, 2004.

BIDERMAN, M. T. C. A ciência da Lexicografia. Alfa Revista de Linguística. São Paulo, n. 28 (supl.), p. 1-26, 1984.

CARDOSO, S. A. Geolinguística: tradição e modernidade. São Paulo: Parábola Editorial, 2010.

COLSON, J-P. Corpus linguistics and phraseological statistics: a few hypotheses and examples. In: BURGER, H., HÄCHI BUHOFER, A., GRÉCIANO, G. (ed.). Flut von texten – vielfalt der kulturen. Ascona 2001 zu Methodologie und kulturspezifik der phraseologie. Baltmannsweiler: Schneider Verlag Hohengehren, p. 47-59, 2003.

DIAS-DA-SILVA, B. C. A fase tecnológica dos estudos da linguagem: o processamento automático das línguas naturais. Tese (Doutorado em Linguística e Língua Portuguesa) – Faculdade de Ciências e Letras, UNESP, Araraquara, 1996.

DOMÍNGUEZ BURGOS, A. Lingüística computacional: un esbozo. Boletín de lingüística, v. 18, p. 104-119, 2002. Disponível em: http://saber.ucv.ve/ojs/index.php/rev_bl/article/view/1437 Acesso em: 20 jan. 2022.

FERREIRA, A. B. H. Dicionário Aurélio da Língua Portuguesa. 5. ed. Rio de Janeiro: Positivo, 2010.

FINATTO, M. J. B.; LOPES, L.; CIULLA, A. Processamento de Linguagem Natural, Linguística de Corpus e Estudos Linguísticos: uma parceria bem-sucedida. Domínios de Lingu@gem. Uberlândia, MG. Vol. 9, n. 5 (dez. 2015), p. 41-59, 2015. Disponível em: https://seer.ufu.br/index.php/dominiosdelinguagem/article/view/28670/17075. Acesso em: 20 jan. 2022. DOI https://doi.org/10.14393/DLE-v9n5a2015-3

IMPACTA. Conheça tudo sobre área de Linguística Computacional! [S.l.], 2019. Disponível em: https://www.impacta.com.br/blog/conheca-tudo-area-linguistica-computacional/. Acesso em: 20 set. 2021.

KILGARRIFF, A.; GREFENSTETTE, G. Introduction to the special issue on the Web as Corpus. Computational Linguistics, 29(3), p. 333-347, 2003. DOI https://doi.org/10.1162/089120103322711569

LÜDELING, A; EVERT, S; BARONI, M. Using web data for linguistic purposes. In: HUNDT, M; NESSELHAUF, N; BIEWER, C (org.). Corpus linguistics and the web. Amsterdam: Rodopi, 2007.

OTHERO, G.A. Lingüística Computacional: uma breve introdução. Letras de hoje, v. 41, n. 2, 2006.

PENÁDEZ MARTÍNEZ, I. Para un diccionario de locuciones: de la lingüística teórica a la fraseografía práctica. Alcalá: Universidad de Alcalá, 2015. DOI https://doi.org/10.4067/S0718-93032016000100010

POERSCH, J. M. Linguística computacional: elaboração do diploma para a língua portuguesa. Letras de Hoje, v. 22, n. 1, 1987.

SOUZA, J. W. C. Me vê um texto menor, por favor? [S. l.], 2019. Disponível em: http://www.roseta.org.br/2019/07/31/me-ve-um-texto-menor-por-favor/ Acesso em: 20 set. 2021.

VALENÇA, E. M; SABINO, M. A. O uso da Web como corpus em pesquisas fraseológicas: Uma prática prejudicial ou um recurso valioso? Calidoscopio, v. 14, n. 3, p. 480-488, 2016. Disponível em: http://revistas.unisinos.br/index.php/calidoscopio/article/view/cld.2016.143.11 Acesso em: 20 jan. 2022. DOI https://doi.org/10.4013/cld.2016.143.11

VIEIRA, R. Lingüística Computacional: uma entrevista com Renata Vieira. Revista Virtual de Estudos da Linguagem - ReVEL. Vol. 2, n. 3, agosto de 2004. Disponível em: http://www.revel.inf.br/files/entrevistas/revel_3_entrevista_renata_vieira.pdf Acesso em: 20 jan. 2022.

Published

2022-09-12

How to Cite

DA CRUZ, T. J. The contributions of Corpus Linguistics and Natural Language Processing in the elaboration of the prototype of the Ideological Dictionary of Locutions. Domínios de Lingu@gem, Uberlândia, v. 16, n. 4, p. 1316–1338, 2022. DOI: 10.14393/DL52-v16n4a2022-5. Disponível em: https://seer.ufu.br/index.php/dominiosdelinguagem/article/view/62958. Acesso em: 8 nov. 2024.