Bases lexicais verbais do português brasileiro
DOI:
https://doi.org/10.14393/DL52-v16n4a2022-9Palavras-chave:
Processamento de Língua Natural, Lexicologia, Bases de dados verbaisResumo
Este artigo apresenta o levantamento e a análise de bases lexicais verbais do português brasileiro (PB), que podem ser utilizadas em tarefas de Processamento de Língua Natural (PLN). Para tanto, considerou-se para análise apenas bases de dados com extensão superior a 1.000 lexemas verbais, disponíveis de maneira on-line e gratuita e atualizadas nos últimos 10 anos. Sendo assim, o estudo recaiu sob a análise crítica e comparada de três bases lexicais: VerbNet.Br (SCARTON, 2013), Verbo-Brasil (DURAN; ALUÍSIO, 2015) e VerboWeb (CANÇADO et al., 2018), destacando-se seus pontos comuns e divergentes. Acredita-se que esta pesquisa contribui com a atualização do estado da arte, no que se refere às bases lexicais verbais do PB da última década, além de elencar ações investigativas futuras para criação, revisão e/ou ampliação de recursos descritivos linguísticos do PB.
Downloads
Métricas
Referências
AFONSO, S. BICK, E.; HABER, R.; SANTOS, D. Floresta sintá(c)tica: a treebank for Portuguese. In: RODRIGUES, M. G.; ARAUJO, C. P. S. (org.). Proceedings of the Third International Conference on Language Resources and Evaluation (LREC 2002). Paris: ELRA, 2002.
AZEREDO, J. C. Gramática Houaiss da Língua Portuguesa. São Paulo: Publifolha, 2008.
BAPTISTA, J.; MAMEDE, N. Dicionário gramatical de verbos do português. Faro: Editora UAlg, 2020.
BARROS, C. D. Descrição e classificação dos predicados nominais com o verbo-suporte fazer em Português do Brasil. Tese (Doutorado) - Universidade Federal de São Carlos (UFSCar), São Carlos, 2014.
BICK, E. The parsing system palavras: Automatic grammatical analysis of Portuguese in a constraint grammar famework. Aarhus Universitetsforlag, 2000.
BORBA, F. S. (coord.). Dicionário gramatical de verbos do português contemporâneo do Brasil. São Paulo: Editora UNESP, 1990.
CANÇADO, M.; GODOY, L. Representação lexical de classes verbais do PB. Alfa, São Paulo, 56 (1), 2012. DOI https://doi.org/10.1590/S1981-57942012000100006
CANÇADO, M.; GODOY, L.; AMARAL, L. Catálogo de verbos do português brasileiro: classificação verbal segundo a decomposição de predicados. v. 1. Verbo de mudança. Belo Horizonte: Editora UFMG, 2013.
CANÇADO, M.; AMARAL, L. Introdução à Semântica Lexical. Petrópolis: Vozes, 2016.
CANÇADO, M.; AMARAL, L.; MEIRELLES, L. VerboWeb: uma proposta de classificação verbal. Revista da Anpoll, v. 1, 2018. DOI https://doi.org/10.18309/anp.v1i46.1077
CANÇADO, M.; AMARAL, L.; MEIRELLES, L. Banco de Dados Lexicais VerboWeb: classificação sintático-semântica dos verbos do português brasileiro, UFMG. Disponível em: http://www.letras.ufmg.br/verboweb/. Acesso em: 29 jun. 2021.
CUNHA, C.; CINTRA, L. Nova gramática do português contemporâneo. 5 ed. Rio de Janeiro: Lexikon, 2008 [1984].
DURAN, M. S.; ALUÍSIO, S. M. Propbank-Br: A Brazilian Portuguese corpus annotated with semantic role labels. In: Proceedings of the 8th Symposium in Information and Human Language Technology. Cuiabá, Brazil, 2011.
DURAN, M. S., ALUÍSIO, S. M. Propbank-Br: A Brazilian Treebank annotated with semantic role labels. In: Proceedings of the 8th International Conference on Language Resources and Evaluation. Istanbul, Turkey, 2012.
DURAN, M. S.; MARTINS, J. P.; ALUÍSIO, S. M. Um repositório de verbos para a anotação de papéis semânticos disponível na web. In: Proceedings of the 9th Brazilian Symposium in Information and Human Language Technology. Fortaleza, Brazil, 2013. Disponível em: https://www.aclweb.org/anthology/W13-4820.pdf. Acesso em: 29 jun. 2021.
DURAN, M. S. Guia de Anotação: Propbank-Br. 2014. Disponível em: https://docplayer.com.br/81173801-Guia-de-anotacao-propbank-br.html. Acesso em: 29 jun. 2021.
DURAN, M. S.; ALUÍSIO, S. M. Automatic Generation of a Lexical Resource to support Semantic Role Labeling in Portuguese. In: Proceedings of SEM 2015: The Fourth Joint Conference on Lexical and Computational Semantics. Colorado, US, 2015. Disponível em: https://www.aclweb.org/anthology/S15-1026.pdf. Acesso em: 29 jun. 2021.
FERNANDES, F. Dicionário de verbos e regimes. 45 ed. Porto Alegre: Globo, 2005 [1940]. DOI https://doi.org/10.22456/2177-0018.7658
GREGHI, J. G. Projeto e desenvolvimento de uma base de dados lexicais do português. Dissertação (Mestrado em Ciências da Computação e Matemática Computacional). – Universidade de São Paulo (USP), São Carlos, 2002.
LEVIN, B. English Verb Classes and Alternations: A Preliminary Investigation. Chicago: University of Chicago Press, 1993.
MCDONALD, R.; NIVRE, J.; QUIRMBACH-BRUNDAGE, Y.; GOLDBERG; Y.; DAS, D.; GANCHEV, K.; HALL, K.; PETROV, S.; ZHANG, H.; TÄCKSTRÖM, O.; BEDINI, C.; CASTELLÓ, N. B.; LEE, J. Universal dependency annotation for multilingual parsing. In: Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics. Sofia, Bulgaria, 2013. Disponível em: https://aclanthology.org/P13-2017.pdf. Acesso em: 18 set. 2021
PALMER, M.; GILDEA, D.; KINGSBURY, P. The Proposition Bank: An annotated corpus of semantic roles. Computational Linguistics, 31(1), 71–106, 2005. DOI https://doi.org/10.1162/0891201053630264
PALMER, M.; GILDEA, D.; XUE, N. Semantic role labeling. Synthesis Lectures on Human Language Technologies, v. 3, n. 1, p. 1-103, 2010. DOI https://doi.org/10.2200/S00239ED1V01Y200912HLT006
PERINI, M. A. Estudos de gramática descritiva. São Paulo: Parábola Editorial, 2008.
PERINI, M. A. Describing verb valency: practical and theoretical issues. Switzerland: Springer, 2015. DOI https://doi.org/10.1007/978-3-319-20985-2
PERINI, M. A. Construindo o dicionário de valências: problemas e resultados. Scripta (PUCMG), v. 20, 2016. DOI https://doi.org/10.5752/P.2358-3428.2016v20n38p148
PERINI, M. A. Gramática descritiva do português brasileiro. Petrópolis: Vozes, 2016.
PERINI, M. A. Thematic Relations. Switzerland: Springer, 2019. DOI https://doi.org/10.1007/978-3-030-28538-8
RASSI, A. P.; VALE, O. A. Tipologia das construções verbais em PB: uma proposta de classificação do verbo dar. Caligrama, Belo Horizonte, v. 18, n. 2, 2013. DOI https://doi.org/10.17851/2238-3824.18.2.105-130
RASSI, A. P. Descrição, classificação e processamento automático das construções com o verbo dar em português brasileiro. Tese (Doutorado) - Universidade Federal de São Carlos (UFSCar), São Carlos, 2015.
SALOMÃO, M. M. M.; TORRENT, T. T.; SAMPAIO, T. F. A Linguística Cognitiva encontra a Linguística Computacional: Notícias do Projeto FrameNet Brasil. Cadernos de Estudos Linguísticos, 55(1), 7-34, 2013. DOI https://doi.org/10.20396/cel.v55i1.8636592
SANTOS, M. C. A. Descrição e classificação dos predicados nominais com o verbo-suporte ter em Português do Brasil. Tese (Doutorado) - Universidade Federal de São Carlos (UFSCar), São Carlos, 2015.
SCARTON, C. E. VerbNet.Br: construção semiautomática de um léxico verbal online e independente de domínio para o português do Brasil. 2013. Dissertação (Mestrado em Ciências de Computação e Matemática Computacional) - Universidade de São Paulo (USP), São Carlos, 2013.
SCHULER, K. K. Verbnet: A broad coverage, comprehensive verb lexicon. Ph.D. Thesis (Philosophy) - University of Pennsylvania, 2005.
Publicado
Como Citar
Edição
Seção
Licença
Copyright (c) 2022 Roana Rodrigues, Marcella Lemos-Couto, Francimeire Leme Coelho, Isaac Souza de Miranda Junior, Oto Vale
Este trabalho está licenciado sob uma licença Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
Autores que publicam nesta revista concordam com os seguintes termos da licença Creative Commons
CC BY-NC-ND 4.0: o artigo pode ser copiado e redistribuído em qualquer suporte ou formato; os créditos devem ser dados ao autor original e mudanças no texto devem ser indicadas; o artigo não pode ser usado para fins comerciais; caso o artigo seja remixado, transformado ou algo novo for criado a partir dele, o mesmo não pode ser distribuído.
Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.