Brazilian Portuguese verbal databases

Authors

DOI:

https://doi.org/10.14393/DL52-v16n4a2022-9

Keywords:

Natural Language Processing, Lexicology, Verbal databases

Abstract

This paper presents a survey and an analysis of Brazilian Portuguese lexical verbal databases, which are possible to use in Natural Language Processing (NLP) tasks. For this purpose, we considered for analysis only databases with a dimension greater than 1.000 verbal lexemes, free online access, and updated in the last 10 years. Therefore, the study fell on the critical and comparative analysis of three lexical databases: VerbNet.Br (SCARTON, 2013), Verbo-Brasil (DURAN; ALUÍSIO, 2015) and VerboWeb (CANÇADO et. al., 2018), highlighting their commonalities and divergences. It is believed that this research contributes to updating the state-of-the-art, regarding the BP lexical verbal databases of the last decade, in addition to listing future investigations to create, revise and/or extend BP descriptive linguistic resources.

Downloads

Download data is not yet available.

Metrics

Metrics Loading ...

Author Biographies

Roana Rodrigues, Universidade Federal de Sergipe

Professora Adjunta do Departamento de Letras Estrangeiras da Universidade Federal de Sergipe. Doutora em Linguística pela Universidade Federal de São Carlos. 

Marcella Lemos-Couto, Universidade Federal de São Carlos

Doutoranda do Programa de Pós-Graduação em Linguística da Universidade Federal de São Carlos. Mestra em Linguística Teórica e Descritiva pela Universidade Federal de Minas Gerais (UFMG). 

Francimeire Leme Coelho, Universidade Federal de São Carlos

Mestranda do Programa de Pós-Graduação em Linguística da Universidade Federal de São Carlos. Graduada em Linguística pela mesma universidade. 

Isaac Souza de Miranda Junior, Universidade Federal de São Carlos

Mestrando do Programa de Pós-Graduação em Linguística da Universidade Federal de São Carlos. Graduado em Linguística pela mesma universidade. 

Oto Vale, Universidade Federal de São Carlos

Professor Associado do Departamento de Letras da Universidade Federal de São Carlos. Doutor em Linguística e Língua Portuguesa pela Universidade Estadual Paulista Júlio de Mesquita Filho.

References

AFONSO, S. BICK, E.; HABER, R.; SANTOS, D. Floresta sintá(c)tica: a treebank for Portuguese. In: RODRIGUES, M. G.; ARAUJO, C. P. S. (org.). Proceedings of the Third International Conference on Language Resources and Evaluation (LREC 2002). Paris: ELRA, 2002.

AZEREDO, J. C. Gramática Houaiss da Língua Portuguesa. São Paulo: Publifolha, 2008.

BAPTISTA, J.; MAMEDE, N. Dicionário gramatical de verbos do português. Faro: Editora UAlg, 2020.

BARROS, C. D. Descrição e classificação dos predicados nominais com o verbo-suporte fazer em Português do Brasil. Tese (Doutorado) - Universidade Federal de São Carlos (UFSCar), São Carlos, 2014.

BICK, E. The parsing system palavras: Automatic grammatical analysis of Portuguese in a constraint grammar famework. Aarhus Universitetsforlag, 2000.

BORBA, F. S. (coord.). Dicionário gramatical de verbos do português contemporâneo do Brasil. São Paulo: Editora UNESP, 1990.

CANÇADO, M.; GODOY, L. Representação lexical de classes verbais do PB. Alfa, São Paulo, 56 (1), 2012. DOI https://doi.org/10.1590/S1981-57942012000100006

CANÇADO, M.; GODOY, L.; AMARAL, L. Catálogo de verbos do português brasileiro: classificação verbal segundo a decomposição de predicados. v. 1. Verbo de mudança. Belo Horizonte: Editora UFMG, 2013.

CANÇADO, M.; AMARAL, L. Introdução à Semântica Lexical. Petrópolis: Vozes, 2016.

CANÇADO, M.; AMARAL, L.; MEIRELLES, L. VerboWeb: uma proposta de classificação verbal. Revista da Anpoll, v. 1, 2018. DOI https://doi.org/10.18309/anp.v1i46.1077

CANÇADO, M.; AMARAL, L.; MEIRELLES, L. Banco de Dados Lexicais VerboWeb: classificação sintático-semântica dos verbos do português brasileiro, UFMG. Disponível em: http://www.letras.ufmg.br/verboweb/. Acesso em: 29 jun. 2021.

CUNHA, C.; CINTRA, L. Nova gramática do português contemporâneo. 5 ed. Rio de Janeiro: Lexikon, 2008 [1984].

DURAN, M. S.; ALUÍSIO, S. M. Propbank-Br: A Brazilian Portuguese corpus annotated with semantic role labels. In: Proceedings of the 8th Symposium in Information and Human Language Technology. Cuiabá, Brazil, 2011.

DURAN, M. S., ALUÍSIO, S. M. Propbank-Br: A Brazilian Treebank annotated with semantic role labels. In: Proceedings of the 8th International Conference on Language Resources and Evaluation. Istanbul, Turkey, 2012.

DURAN, M. S.; MARTINS, J. P.; ALUÍSIO, S. M. Um repositório de verbos para a anotação de papéis semânticos disponível na web. In: Proceedings of the 9th Brazilian Symposium in Information and Human Language Technology. Fortaleza, Brazil, 2013. Disponível em: https://www.aclweb.org/anthology/W13-4820.pdf. Acesso em: 29 jun. 2021.

DURAN, M. S. Guia de Anotação: Propbank-Br. 2014. Disponível em: https://docplayer.com.br/81173801-Guia-de-anotacao-propbank-br.html. Acesso em: 29 jun. 2021.

DURAN, M. S.; ALUÍSIO, S. M. Automatic Generation of a Lexical Resource to support Semantic Role Labeling in Portuguese. In: Proceedings of SEM 2015: The Fourth Joint Conference on Lexical and Computational Semantics. Colorado, US, 2015. Disponível em: https://www.aclweb.org/anthology/S15-1026.pdf. Acesso em: 29 jun. 2021.

FERNANDES, F. Dicionário de verbos e regimes. 45 ed. Porto Alegre: Globo, 2005 [1940]. DOI https://doi.org/10.22456/2177-0018.7658

GREGHI, J. G. Projeto e desenvolvimento de uma base de dados lexicais do português. Dissertação (Mestrado em Ciências da Computação e Matemática Computacional). – Universidade de São Paulo (USP), São Carlos, 2002.

LEVIN, B. English Verb Classes and Alternations: A Preliminary Investigation. Chicago: University of Chicago Press, 1993.

MCDONALD, R.; NIVRE, J.; QUIRMBACH-BRUNDAGE, Y.; GOLDBERG; Y.; DAS, D.; GANCHEV, K.; HALL, K.; PETROV, S.; ZHANG, H.; TÄCKSTRÖM, O.; BEDINI, C.; CASTELLÓ, N. B.; LEE, J. Universal dependency annotation for multilingual parsing. In: Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics. Sofia, Bulgaria, 2013. Disponível em: https://aclanthology.org/P13-2017.pdf. Acesso em: 18 set. 2021

PALMER, M.; GILDEA, D.; KINGSBURY, P. The Proposition Bank: An annotated corpus of semantic roles. Computational Linguistics, 31(1), 71–106, 2005. DOI https://doi.org/10.1162/0891201053630264

PALMER, M.; GILDEA, D.; XUE, N. Semantic role labeling. Synthesis Lectures on Human Language Technologies, v. 3, n. 1, p. 1-103, 2010. DOI https://doi.org/10.2200/S00239ED1V01Y200912HLT006

PERINI, M. A. Estudos de gramática descritiva. São Paulo: Parábola Editorial, 2008.

PERINI, M. A. Describing verb valency: practical and theoretical issues. Switzerland: Springer, 2015. DOI https://doi.org/10.1007/978-3-319-20985-2

PERINI, M. A. Construindo o dicionário de valências: problemas e resultados. Scripta (PUCMG), v. 20, 2016. DOI https://doi.org/10.5752/P.2358-3428.2016v20n38p148

PERINI, M. A. Gramática descritiva do português brasileiro. Petrópolis: Vozes, 2016.

PERINI, M. A. Thematic Relations. Switzerland: Springer, 2019. DOI https://doi.org/10.1007/978-3-030-28538-8

RASSI, A. P.; VALE, O. A. Tipologia das construções verbais em PB: uma proposta de classificação do verbo dar. Caligrama, Belo Horizonte, v. 18, n. 2, 2013. DOI https://doi.org/10.17851/2238-3824.18.2.105-130

RASSI, A. P. Descrição, classificação e processamento automático das construções com o verbo dar em português brasileiro. Tese (Doutorado) - Universidade Federal de São Carlos (UFSCar), São Carlos, 2015.

SALOMÃO, M. M. M.; TORRENT, T. T.; SAMPAIO, T. F. A Linguística Cognitiva encontra a Linguística Computacional: Notícias do Projeto FrameNet Brasil. Cadernos de Estudos Linguísticos, 55(1), 7-34, 2013. DOI https://doi.org/10.20396/cel.v55i1.8636592

SANTOS, M. C. A. Descrição e classificação dos predicados nominais com o verbo-suporte ter em Português do Brasil. Tese (Doutorado) - Universidade Federal de São Carlos (UFSCar), São Carlos, 2015.

SCARTON, C. E. VerbNet.Br: construção semiautomática de um léxico verbal online e independente de domínio para o português do Brasil. 2013. Dissertação (Mestrado em Ciências de Computação e Matemática Computacional) - Universidade de São Paulo (USP), São Carlos, 2013.

SCHULER, K. K. Verbnet: A broad coverage, comprehensive verb lexicon. Ph.D. Thesis (Philosophy) - University of Pennsylvania, 2005.

Published

2022-09-12

How to Cite

RODRIGUES, R.; LEMOS-COUTO, M.; LEME COELHO, F.; SOUZA DE MIRANDA JUNIOR, I. .; VALE, O. Brazilian Portuguese verbal databases. Domínios de Lingu@gem, Uberlândia, v. 16, n. 4, p. 1489–1516, 2022. DOI: 10.14393/DL52-v16n4a2022-9. Disponível em: https://seer.ufu.br/index.php/dominiosdelinguagem/article/view/63470. Acesso em: 21 nov. 2024.