Bases lexicais verbais do português brasileiro

Autores

Palavras-chave:

Processamento de Língua Natural, Lexicologia, Bases de dados verbais

Resumo

Este artigo apresenta o levantamento e a análise de bases lexicais verbais do português brasileiro (PB), que podem ser utilizadas em tarefas de Processamento de Língua Natural (PLN). Para tanto, considerou-se para análise apenas bases de dados com extensão superior a 1.000 lexemas verbais, disponíveis de maneira on-line e gratuita e atualizadas nos últimos 10 anos. Sendo assim, o estudo recaiu sob a análise crítica e comparada de três bases lexicais: VerbNet.Br (SCARTON, 2013), Verbo-Brasil (DURAN; ALUÍSIO, 2015) e VerboWeb (CANÇADO et al., 2018), destacando-se seus pontos comuns e divergentes. Acredita-se que esta pesquisa contribui com a atualização do estado da arte, no que se refere às bases lexicais verbais do PB da última década, além de elencar ações investigativas futuras para criação, revisão e/ou ampliação de recursos descritivos linguísticos do PB.

Downloads

Não há dados estatísticos.

Biografia do Autor

Roana Rodrigues, Universidade Federal de Sergipe

Professora Adjunta do Departamento de Letras Estrangeiras da Universidade Federal de Sergipe. Doutora em Linguística pela Universidade Federal de São Carlos. 

Marcella Lemos-Couto, Universidade Federal de São Carlos

Doutoranda do Programa de Pós-Graduação em Linguística da Universidade Federal de São Carlos. Mestra em Linguística Teórica e Descritiva pela Universidade Federal de Minas Gerais (UFMG). 

Francimeire Leme Coelho, Universidade Federal de São Carlos

Mestranda do Programa de Pós-Graduação em Linguística da Universidade Federal de São Carlos. Graduada em Linguística pela mesma universidade. 

Isaac Souza de Miranda Junior, Universidade Federal de São Carlos

Mestrando do Programa de Pós-Graduação em Linguística da Universidade Federal de São Carlos. Graduado em Linguística pela mesma universidade. 

Oto Vale, Universidade Federal de São Carlos

Professor Associado do Departamento de Letras da Universidade Federal de São Carlos. Doutor em Linguística e Língua Portuguesa pela Universidade Estadual Paulista Júlio de Mesquita Filho.

Referências

AFONSO, S. BICK, E.; HABER, R.; SANTOS, D. Floresta sintá(c)tica: a treebank for Portuguese. In: RODRIGUES, M. G.; ARAUJO, C. P. S. (org.). Proceedings of the Third International Conference on Language Resources and Evaluation (LREC 2002). Paris: ELRA, 2002.

AZEREDO, J. C. Gramática Houaiss da Língua Portuguesa. São Paulo: Publifolha, 2008.

BAPTISTA, J.; MAMEDE, N. Dicionário gramatical de verbos do português. Faro: Editora UAlg, 2020.

BARROS, C. D. Descrição e classificação dos predicados nominais com o verbo-suporte fazer em Português do Brasil. Tese (Doutorado) - Universidade Federal de São Carlos (UFSCar), São Carlos, 2014.

BICK, E. The parsing system palavras: Automatic grammatical analysis of Portuguese in a constraint grammar famework. Aarhus Universitetsforlag, 2000.

BORBA, F. S. (coord.). Dicionário gramatical de verbos do português contemporâneo do Brasil. São Paulo: Editora UNESP, 1990.

CANÇADO, M.; GODOY, L. Representação lexical de classes verbais do PB. Alfa, São Paulo, 56 (1), 2012. DOI https://doi.org/10.1590/S1981-57942012000100006

CANÇADO, M.; GODOY, L.; AMARAL, L. Catálogo de verbos do português brasileiro: classificação verbal segundo a decomposição de predicados. v. 1. Verbo de mudança. Belo Horizonte: Editora UFMG, 2013.

CANÇADO, M.; AMARAL, L. Introdução à Semântica Lexical. Petrópolis: Vozes, 2016.

CANÇADO, M.; AMARAL, L.; MEIRELLES, L. VerboWeb: uma proposta de classificação verbal. Revista da Anpoll, v. 1, 2018. DOI https://doi.org/10.18309/anp.v1i46.1077

CANÇADO, M.; AMARAL, L.; MEIRELLES, L. Banco de Dados Lexicais VerboWeb: classificação sintático-semântica dos verbos do português brasileiro, UFMG. Disponível em: http://www.letras.ufmg.br/verboweb/. Acesso em: 29 jun. 2021.

CUNHA, C.; CINTRA, L. Nova gramática do português contemporâneo. 5 ed. Rio de Janeiro: Lexikon, 2008 [1984].

DURAN, M. S.; ALUÍSIO, S. M. Propbank-Br: A Brazilian Portuguese corpus annotated with semantic role labels. In: Proceedings of the 8th Symposium in Information and Human Language Technology. Cuiabá, Brazil, 2011.

DURAN, M. S., ALUÍSIO, S. M. Propbank-Br: A Brazilian Treebank annotated with semantic role labels. In: Proceedings of the 8th International Conference on Language Resources and Evaluation. Istanbul, Turkey, 2012.

DURAN, M. S.; MARTINS, J. P.; ALUÍSIO, S. M. Um repositório de verbos para a anotação de papéis semânticos disponível na web. In: Proceedings of the 9th Brazilian Symposium in Information and Human Language Technology. Fortaleza, Brazil, 2013. Disponível em: https://www.aclweb.org/anthology/W13-4820.pdf. Acesso em: 29 jun. 2021.

DURAN, M. S. Guia de Anotação: Propbank-Br. 2014. Disponível em: https://docplayer.com.br/81173801-Guia-de-anotacao-propbank-br.html. Acesso em: 29 jun. 2021.

DURAN, M. S.; ALUÍSIO, S. M. Automatic Generation of a Lexical Resource to support Semantic Role Labeling in Portuguese. In: Proceedings of SEM 2015: The Fourth Joint Conference on Lexical and Computational Semantics. Colorado, US, 2015. Disponível em: https://www.aclweb.org/anthology/S15-1026.pdf. Acesso em: 29 jun. 2021.

FERNANDES, F. Dicionário de verbos e regimes. 45 ed. Porto Alegre: Globo, 2005 [1940]. DOI https://doi.org/10.22456/2177-0018.7658

GREGHI, J. G. Projeto e desenvolvimento de uma base de dados lexicais do português. Dissertação (Mestrado em Ciências da Computação e Matemática Computacional). – Universidade de São Paulo (USP), São Carlos, 2002.

LEVIN, B. English Verb Classes and Alternations: A Preliminary Investigation. Chicago: University of Chicago Press, 1993.

MCDONALD, R.; NIVRE, J.; QUIRMBACH-BRUNDAGE, Y.; GOLDBERG; Y.; DAS, D.; GANCHEV, K.; HALL, K.; PETROV, S.; ZHANG, H.; TÄCKSTRÖM, O.; BEDINI, C.; CASTELLÓ, N. B.; LEE, J. Universal dependency annotation for multilingual parsing. In: Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics. Sofia, Bulgaria, 2013. Disponível em: https://aclanthology.org/P13-2017.pdf. Acesso em: 18 set. 2021

PALMER, M.; GILDEA, D.; KINGSBURY, P. The Proposition Bank: An annotated corpus of semantic roles. Computational Linguistics, 31(1), 71–106, 2005. DOI https://doi.org/10.1162/0891201053630264

PALMER, M.; GILDEA, D.; XUE, N. Semantic role labeling. Synthesis Lectures on Human Language Technologies, v. 3, n. 1, p. 1-103, 2010. DOI https://doi.org/10.2200/S00239ED1V01Y200912HLT006

PERINI, M. A. Estudos de gramática descritiva. São Paulo: Parábola Editorial, 2008.

PERINI, M. A. Describing verb valency: practical and theoretical issues. Switzerland: Springer, 2015. DOI https://doi.org/10.1007/978-3-319-20985-2

PERINI, M. A. Construindo o dicionário de valências: problemas e resultados. Scripta (PUCMG), v. 20, 2016. DOI https://doi.org/10.5752/P.2358-3428.2016v20n38p148

PERINI, M. A. Gramática descritiva do português brasileiro. Petrópolis: Vozes, 2016.

PERINI, M. A. Thematic Relations. Switzerland: Springer, 2019. DOI https://doi.org/10.1007/978-3-030-28538-8

RASSI, A. P.; VALE, O. A. Tipologia das construções verbais em PB: uma proposta de classificação do verbo dar. Caligrama, Belo Horizonte, v. 18, n. 2, 2013. DOI https://doi.org/10.17851/2238-3824.18.2.105-130

RASSI, A. P. Descrição, classificação e processamento automático das construções com o verbo dar em português brasileiro. Tese (Doutorado) - Universidade Federal de São Carlos (UFSCar), São Carlos, 2015.

SALOMÃO, M. M. M.; TORRENT, T. T.; SAMPAIO, T. F. A Linguística Cognitiva encontra a Linguística Computacional: Notícias do Projeto FrameNet Brasil. Cadernos de Estudos Linguísticos, 55(1), 7-34, 2013. DOI https://doi.org/10.20396/cel.v55i1.8636592

SANTOS, M. C. A. Descrição e classificação dos predicados nominais com o verbo-suporte ter em Português do Brasil. Tese (Doutorado) - Universidade Federal de São Carlos (UFSCar), São Carlos, 2015.

SCARTON, C. E. VerbNet.Br: construção semiautomática de um léxico verbal online e independente de domínio para o português do Brasil. 2013. Dissertação (Mestrado em Ciências de Computação e Matemática Computacional) - Universidade de São Paulo (USP), São Carlos, 2013.

SCHULER, K. K. Verbnet: A broad coverage, comprehensive verb lexicon. Ph.D. Thesis (Philosophy) - University of Pennsylvania, 2005.

Downloads

Publicado

21-03-2022

Como Citar

RODRIGUES, R.; LEMOS-COUTO, M.; LEME COELHO, F.; SOUZA DE MIRANDA JUNIOR, I. .; VALE, O. Bases lexicais verbais do português brasileiro. Domínios de Lingu@gem, [S. l.], 2022. Disponível em: https://seer.ufu.br/index.php/dominiosdelinguagem/article/view/63470. Acesso em: 28 maio. 2022.

Edição

Seção

Artigos