Bases lexicais verbais do português brasileiro

Autores

DOI:

https://doi.org/10.14393/DL52-v16n4a2022-9

Palavras-chave:

Processamento de Língua Natural, Lexicologia, Bases de dados verbais

Resumo

Este artigo apresenta o levantamento e a análise de bases lexicais verbais do português brasileiro (PB), que podem ser utilizadas em tarefas de Processamento de Língua Natural (PLN). Para tanto, considerou-se para análise apenas bases de dados com extensão superior a 1.000 lexemas verbais, disponíveis de maneira on-line e gratuita e atualizadas nos últimos 10 anos. Sendo assim, o estudo recaiu sob a análise crítica e comparada de três bases lexicais: VerbNet.Br (SCARTON, 2013), Verbo-Brasil (DURAN; ALUÍSIO, 2015) e VerboWeb (CANÇADO et al., 2018), destacando-se seus pontos comuns e divergentes. Acredita-se que esta pesquisa contribui com a atualização do estado da arte, no que se refere às bases lexicais verbais do PB da última década, além de elencar ações investigativas futuras para criação, revisão e/ou ampliação de recursos descritivos linguísticos do PB.

Downloads

Os dados de download ainda não estão disponíveis.

Biografia do Autor

  • Roana Rodrigues, Universidade Federal de Sergipe

    Professora Adjunta do Departamento de Letras Estrangeiras da Universidade Federal de Sergipe. Doutora em Linguística pela Universidade Federal de São Carlos. 

  • Marcella Lemos-Couto, Universidade Federal de São Carlos

    Doutoranda do Programa de Pós-Graduação em Linguística da Universidade Federal de São Carlos. Mestra em Linguística Teórica e Descritiva pela Universidade Federal de Minas Gerais (UFMG). 

  • Francimeire Leme Coelho, Universidade Federal de São Carlos

    Mestranda do Programa de Pós-Graduação em Linguística da Universidade Federal de São Carlos. Graduada em Linguística pela mesma universidade. 

  • Isaac Souza de Miranda Junior, Universidade Federal de São Carlos

    Mestrando do Programa de Pós-Graduação em Linguística da Universidade Federal de São Carlos. Graduado em Linguística pela mesma universidade. 

  • Oto Vale, Universidade Federal de São Carlos

    Professor Associado do Departamento de Letras da Universidade Federal de São Carlos. Doutor em Linguística e Língua Portuguesa pela Universidade Estadual Paulista Júlio de Mesquita Filho.

Referências

AFONSO, S. BICK, E.; HABER, R.; SANTOS, D. Floresta sintá(c)tica: a treebank for Portuguese. In: RODRIGUES, M. G.; ARAUJO, C. P. S. (org.). Proceedings of the Third International Conference on Language Resources and Evaluation (LREC 2002). Paris: ELRA, 2002.

AZEREDO, J. C. Gramática Houaiss da Língua Portuguesa. São Paulo: Publifolha, 2008.

BAPTISTA, J.; MAMEDE, N. Dicionário gramatical de verbos do português. Faro: Editora UAlg, 2020.

BARROS, C. D. Descrição e classificação dos predicados nominais com o verbo-suporte fazer em Português do Brasil. Tese (Doutorado) - Universidade Federal de São Carlos (UFSCar), São Carlos, 2014.

BICK, E. The parsing system palavras: Automatic grammatical analysis of Portuguese in a constraint grammar famework. Aarhus Universitetsforlag, 2000.

BORBA, F. S. (coord.). Dicionário gramatical de verbos do português contemporâneo do Brasil. São Paulo: Editora UNESP, 1990.

CANÇADO, M.; GODOY, L. Representação lexical de classes verbais do PB. Alfa, São Paulo, 56 (1), 2012. DOI https://doi.org/10.1590/S1981-57942012000100006

CANÇADO, M.; GODOY, L.; AMARAL, L. Catálogo de verbos do português brasileiro: classificação verbal segundo a decomposição de predicados. v. 1. Verbo de mudança. Belo Horizonte: Editora UFMG, 2013.

CANÇADO, M.; AMARAL, L. Introdução à Semântica Lexical. Petrópolis: Vozes, 2016.

CANÇADO, M.; AMARAL, L.; MEIRELLES, L. VerboWeb: uma proposta de classificação verbal. Revista da Anpoll, v. 1, 2018. DOI https://doi.org/10.18309/anp.v1i46.1077

CANÇADO, M.; AMARAL, L.; MEIRELLES, L. Banco de Dados Lexicais VerboWeb: classificação sintático-semântica dos verbos do português brasileiro, UFMG. Disponível em: http://www.letras.ufmg.br/verboweb/. Acesso em: 29 jun. 2021.

CUNHA, C.; CINTRA, L. Nova gramática do português contemporâneo. 5 ed. Rio de Janeiro: Lexikon, 2008 [1984].

DURAN, M. S.; ALUÍSIO, S. M. Propbank-Br: A Brazilian Portuguese corpus annotated with semantic role labels. In: Proceedings of the 8th Symposium in Information and Human Language Technology. Cuiabá, Brazil, 2011.

DURAN, M. S., ALUÍSIO, S. M. Propbank-Br: A Brazilian Treebank annotated with semantic role labels. In: Proceedings of the 8th International Conference on Language Resources and Evaluation. Istanbul, Turkey, 2012.

DURAN, M. S.; MARTINS, J. P.; ALUÍSIO, S. M. Um repositório de verbos para a anotação de papéis semânticos disponível na web. In: Proceedings of the 9th Brazilian Symposium in Information and Human Language Technology. Fortaleza, Brazil, 2013. Disponível em: https://www.aclweb.org/anthology/W13-4820.pdf. Acesso em: 29 jun. 2021.

DURAN, M. S. Guia de Anotação: Propbank-Br. 2014. Disponível em: https://docplayer.com.br/81173801-Guia-de-anotacao-propbank-br.html. Acesso em: 29 jun. 2021.

DURAN, M. S.; ALUÍSIO, S. M. Automatic Generation of a Lexical Resource to support Semantic Role Labeling in Portuguese. In: Proceedings of SEM 2015: The Fourth Joint Conference on Lexical and Computational Semantics. Colorado, US, 2015. Disponível em: https://www.aclweb.org/anthology/S15-1026.pdf. Acesso em: 29 jun. 2021.

FERNANDES, F. Dicionário de verbos e regimes. 45 ed. Porto Alegre: Globo, 2005 [1940]. DOI https://doi.org/10.22456/2177-0018.7658

GREGHI, J. G. Projeto e desenvolvimento de uma base de dados lexicais do português. Dissertação (Mestrado em Ciências da Computação e Matemática Computacional). – Universidade de São Paulo (USP), São Carlos, 2002.

LEVIN, B. English Verb Classes and Alternations: A Preliminary Investigation. Chicago: University of Chicago Press, 1993.

MCDONALD, R.; NIVRE, J.; QUIRMBACH-BRUNDAGE, Y.; GOLDBERG; Y.; DAS, D.; GANCHEV, K.; HALL, K.; PETROV, S.; ZHANG, H.; TÄCKSTRÖM, O.; BEDINI, C.; CASTELLÓ, N. B.; LEE, J. Universal dependency annotation for multilingual parsing. In: Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics. Sofia, Bulgaria, 2013. Disponível em: https://aclanthology.org/P13-2017.pdf. Acesso em: 18 set. 2021

PALMER, M.; GILDEA, D.; KINGSBURY, P. The Proposition Bank: An annotated corpus of semantic roles. Computational Linguistics, 31(1), 71–106, 2005. DOI https://doi.org/10.1162/0891201053630264

PALMER, M.; GILDEA, D.; XUE, N. Semantic role labeling. Synthesis Lectures on Human Language Technologies, v. 3, n. 1, p. 1-103, 2010. DOI https://doi.org/10.2200/S00239ED1V01Y200912HLT006

PERINI, M. A. Estudos de gramática descritiva. São Paulo: Parábola Editorial, 2008.

PERINI, M. A. Describing verb valency: practical and theoretical issues. Switzerland: Springer, 2015. DOI https://doi.org/10.1007/978-3-319-20985-2

PERINI, M. A. Construindo o dicionário de valências: problemas e resultados. Scripta (PUCMG), v. 20, 2016. DOI https://doi.org/10.5752/P.2358-3428.2016v20n38p148

PERINI, M. A. Gramática descritiva do português brasileiro. Petrópolis: Vozes, 2016.

PERINI, M. A. Thematic Relations. Switzerland: Springer, 2019. DOI https://doi.org/10.1007/978-3-030-28538-8

RASSI, A. P.; VALE, O. A. Tipologia das construções verbais em PB: uma proposta de classificação do verbo dar. Caligrama, Belo Horizonte, v. 18, n. 2, 2013. DOI https://doi.org/10.17851/2238-3824.18.2.105-130

RASSI, A. P. Descrição, classificação e processamento automático das construções com o verbo dar em português brasileiro. Tese (Doutorado) - Universidade Federal de São Carlos (UFSCar), São Carlos, 2015.

SALOMÃO, M. M. M.; TORRENT, T. T.; SAMPAIO, T. F. A Linguística Cognitiva encontra a Linguística Computacional: Notícias do Projeto FrameNet Brasil. Cadernos de Estudos Linguísticos, 55(1), 7-34, 2013. DOI https://doi.org/10.20396/cel.v55i1.8636592

SANTOS, M. C. A. Descrição e classificação dos predicados nominais com o verbo-suporte ter em Português do Brasil. Tese (Doutorado) - Universidade Federal de São Carlos (UFSCar), São Carlos, 2015.

SCARTON, C. E. VerbNet.Br: construção semiautomática de um léxico verbal online e independente de domínio para o português do Brasil. 2013. Dissertação (Mestrado em Ciências de Computação e Matemática Computacional) - Universidade de São Paulo (USP), São Carlos, 2013.

SCHULER, K. K. Verbnet: A broad coverage, comprehensive verb lexicon. Ph.D. Thesis (Philosophy) - University of Pennsylvania, 2005.

Downloads

Publicado

12.09.2022

Como Citar

RODRIGUES, Roana; LEMOS-COUTO, Marcella; LEME COELHO, Francimeire; SOUZA DE MIRANDA JUNIOR, Isaac; VALE, Oto. Bases lexicais verbais do português brasileiro. Domínios de Lingu@gem, Uberlândia, v. 16, n. 4, p. 1489–1516, 2022. DOI: 10.14393/DL52-v16n4a2022-9. Disponível em: https://seer.ufu.br/index.php/dominiosdelinguagem/article/view/63470. Acesso em: 19 abr. 2025.