Modelação da valência verbal numa gramática computacional do português no formalismo HPSG

Autores

DOI:

https://doi.org/10.14393/DL52-v16n4a2022-6

Palavras-chave:

Linguística computacional, Engenharia da gramática, Análise sintática automática, Valência, Semântica computacional

Resumo

A HPSG é uma teoria gramatical lexicalista que propõe a formalização em paralelo das estruturas morfossintáticas e semânticas. Este trabalho descreve a implementação computacional de valências verbais numa nova gramática do português nesse formalismo. Essa gramática é relevante não somente para aplicações de compreensão textual, mas representa também uma contribuição à documentação formal das estruturas da língua, destacando-se pelo tratamento das construções de controle e alçamento. A gramática tem sido implementada incrementalmente por meio da sua aplicação a conjuntos de teste cada vez mais abrangentes. Com 278 entradas e um total de 215 lemas, o léxico verbal ainda é pequeno. No entanto, a hierarquia de tipos proposta modela as propriedades de 118 classes valenciais, das quais 57 são tipos que codificam classes de verbos. A gramática analisa 94% de um total de 581 sentenças gramaticais, apresentando, ao mesmo tempo, baixa hipergeração em um conjunto de 167 exemplos agramaticais.

Downloads

Não há dados estatísticos.

Métricas

Carregando Métricas ...

Biografia do Autor

Leonel Figueiredo de Alencar, Universidade Federal do Ceará

Professor Associado do Departamento de Letras Estrangeiras e do Programa de Pós-Graduação em Linguística da Universidade Federal do Ceará (UFC). Pesquisador colaborador do Group of Computer Networks, Software Engineering, and Systems (GREat), do Departamento de Computação da UFC. Doutor e pós-doutor em Linguística pela Universität Konstanz, Alemanha.

Alexandre Rademaker, Escola de Matemática Aplicada da FGV e IBM Research

Bacharel em Ciência da Computação pela UFRJ (2001). Mestre em Ciência da Computação pela UFF (2005) e Doutor pela PUC-Rio (2010). Em 2008, durante o doutorado, fez estágio de pesquisa na Microsooft Research e em 2009 no SRI International. Suas áreas de pesquisa abrangem: lógica, teoria da computação, métodos formais, representação do conhecimento e linguistica computacional. Membro da Global WordNet Association e atual coordenador da Comissão Especial de Processamento de Linguagem Natural da Sociedade Brasileira de Computação (CE-PLN).

Referências

ABEILLÉ, A. Control and raising. In: MÜLLER, S. et al. (ed.). Head Driven Phrase Structure Grammar: The handbook. Berlin: Language Science Press, 2021. p. 489–535.

ALENCAR, L. F. de; RADEMAKER, A. Cross-validating language resources for the development of a large-coverage computational grammar of Portuguese. Language Resources and Evaluation. Submetido à publicação.

ARRAIS, D. Você sabe a diferença entre “pedir para” e “pedir que”? 2017. Disponível em: https://exame.com/carreira/voce-sabe-a-diferenca-entre-pedir-para-e-pedir-que/. Acesso em: 21 nov. 2021.

BENDER, E. M. Reweaving a grammar for Wambaya: A case study in grammar engineering for linguistic hypothesis testing. Linguistic Issues in Language Technology, v. 3, p. 1–34, 2010. DOI https://doi.org/10.33011/lilt.v3i.1215

BENDER, E. M. et al. Grammar customization. Research on Language & Computation, v. 8, n. 1, p. 23–72, 2010. DOI https://doi.org/10.1007/s11168-010-9070-1

BENDER, E. M.; FLICKINGER, D.; OEPEN, S. The Grammar Matrix: An open-source starter-kit for the rapid development of cross-linguistically consistent broad-coverage precision grammars. In: COLING-GEE '02: Proceedings of the 2002 Workshop on Grammar Engineering and Evaluation. [S.l.]: [s.n.], 2002. p. 8–14. DOI https://doi.org/10.3115/1118783.1118785

BENDER, E. M.; FLICKINGER, D.; OEPEN, S. MRS in the LinGO Grammar Matrix: A practical user’s guide. [S.l.]: [s.n.], 2003. Disponível em: http://faculty.washington.edu/ebender/papers/userguide.pdf. Acesso em: 25 set. 2021.

BENDER, E. M.; FLICKINGER, D.; OEPEN, S. Grammar engineering and linguistic hypothesis testing: Computational support for complexity in syntactic analysis. In: BENDER, E. M.; ARNOLD, J. E. (ed.). Language from a cognitive perspective: Grammar, usage and processing. Stanford: CSLI, 2011. p. 5–29.

BIRD, S.; KLEIN, E.; LOPER, E. Natural language processing with Python: analyzing text with the Natural Language Toolkit. Sebastopol: O’Reilly, 2009.

BORBA, F. da S. (org.). Dicionário gramatical de verbos do português contemporâneo do Brasil. 2. ed. São Paulo: Editora da UNESP, 1991.

CANÇADO, M.; AMARAL, L.; MEIRELLES, L. VerboWeb: classificação sintático-semântica dos verbos do português brasileiro. Belo Horizonte: UFMG, 2017. Disponível em: http://www.letras.ufmg.br/verboweb. Acesso em: 13 dez. 2021.

CANÇADO, M. et al. Banco de dados VerboWeb: um panorama do léxico verbal do PB. In: SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), 13 , 2021. Evento Online. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2021. p. 372-380. DOI https://doi.org/10.5753/stil.2021.17817

CANÇADO, M.; GODOY, L.; AMARAL, L. Catálogo de verbos do português brasileiro: Classificação verbal segundo a decomposição de predicados. vol. 1: Verbos de mudança. Belo Horizonte: Editora da UFMG, 2013.

CARLIER, A.; GOYENS, M.; LAMIROY, B. De: A genitive marker in french? In: CARLIER, A.; VERSTRAETE, J.-C. (ed.). The genitive. Amsterdam: John Benjamins, 2013. p. 141–216. DOI https://doi.org/10.1075/cagral.5.07car

COPESTAKE, A. Implementing typed feature structure grammars. Stanford: CSLI, 2002.

COPESTAKE, A. Slacker semantics: Why superficiality, dependency and avoidance of commitment can be the right way to go. In: CONFERENCE OF THE EUROPEAN CHAPTER OF THE ACL, 12 , 2009, Athens. Proceedings [...]. Athens: Association for Computational Linguistics, 2009. p. 1–9. DOI https://doi.org/10.3115/1609067.1609167

COPESTAKE, A. et al. Minimal Recursion Semantics: An introduction. Research on language and computation, Springer, v. 3, n. 2, p. 281–332, 2005. DOI https://doi.org/10.1007/s11168-006-6327-9

COPESTAKE, A.; LASCARIDES, A.; FLICKINGER, D. An algebra for semantic construction in constraint-based grammars. In: ANNUAL MEETING OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS, 39, Toulouse. Proceedings […]. Toulouse: Association for Computational Linguistics, 2001. p. 140–147. DOI https://doi.org/10.3115/1073012.1073031

COSTA, F.; BRANCO, A. LXGram: A deep linguistic processing grammar for Portuguese. In: PARDO, T. A. S. et al. (ed.). Computational Processing of the Portuguese Language. Berlin, Heidelberg: Springer, 2010. p. 86–89. DOI https://doi.org/10.1007/978-3-642-12320-7_11

CUNHA, C.; CINTRA, L. Nova gramática do português contemporâneo. Rio de Janeiro: Nova Fronteira, 1985.

CURTIS, C. A Parametric implementation of valence-changing morphoplogy in the LinGO Grammar Matrix. Dissertação (Mestrado) — University of Washington, Seattle, 2018. Disponível em: http://hdl.handle.net/1773/41814

DRELLISHAK, S. Widespread but Not Universal: Improving the typological coverage of the Grammar Matrix. Tese (Doutorado) — University of Washington, Seattle, 2009.

DROGANOVA, K.; ZEMAN, D. Towards deep Universal Dependencies. In: INTERNATIONAL CONFERENCE ON DEPENDENCY LINGUISTICS (DepLing), 5, 2019, Paris. Proceedings [...]. Paris: Association for Computational Linguistics, 2019. p. 144–152. DOI https://doi.org/10.18653/v1/W19-7717

FALK, Y. N. Lexical-Functional Grammar: An introduction to parallel constraint-based syntax. Stanford: CSLI, 2001.

FERNANDES, F. Dicionário de verbos e regimes. 35. ed. Rio de Janeiro: Globo, 1987.

FERRUCCI, D. et al. Building Watson: An overview of the DeepQA project. AI Magazine, v. 31, n. 3, p. 59–79, 2010. DOI https://doi.org/10.1609/aimag.v31i3.2303

FLICKINGER, D. On building a more efficient grammar by exploiting types. Natural Language Engineering, Cambridge University Press, v. 6, n. 1, p. 15–28, 2000. DOI https://doi.org/10.1017/S1351324900002370

FRANCEZ, N.; WINTNER, S. Unification grammars. Cambridge: Cambridge University Press, 2012.

GABRIEL, C.; MÜLLER, N. Grundlagen der generativen Syntax: Französisch, Italienisch, Spanisch. Tübingen: Niemeyer, 2008.

GONÇALVES, A.; CARRILHO, E.; PEREIRA, S. Predicados complexos numa perspetiva comparativa. In: MARTINS, A. M.; CARRILHO, E. (ed.). Manual de linguística portuguesa. Berlin: De Gruyter, 2016. p. 523–557. DOI https://doi.org/10.1515/9783110368840-022

GOODMAN, M. W. Generation of machine-readable morphological rules with human readable input. University of Washington Working Papers in Linguistics, v. 30, p. 1–34, 2013.

MARNEFFE, M.-C. de et al. Universal Dependencies. Computational Linguistics, v. 47, n. 2, p. 255–308, 2021.

MATEUS, M. H. M. et al. Gramática da língua portuguesa. Lisboa: Caminho, 1989.

MATOS, M. J. “Pedir que” vs. “pedir para”. 2008. Disponível em: https://ciberduvidas.iscte-iul.pt/consultorio/perguntas/pedir-que-vs-pedir-para24813. Acesso em: 11 nov. 2021.

MCCORD, M. C.; MURDOCK, J. W.; BOGURAEV, B. K. Deep parsing in Watson. IBM Journal of research and development, IBM, v. 56, n. 3.4, p. 3–1, 2012. DOI https://doi.org/10.1147/JRD.2012.2185409

MIOTO, C.; SILVA, M. C. F.; LOPES, R. E. V. Novo manual de sintaxe. 2. ed. Florianópolis: Insular, 2005.

MÜLLER, S. Grammatical theory: From transformational grammar to constraint-based approaches. 4. ed. Berlin: Language Science Press, 2020.

NIVRE, J. et al. Universal dependencies v2: An evergrowing multilingual treebank collection. In: LANGUAGE RESOURCES AND EVALUATION CONFERENCE, 12, 2020, Marseille. Proceedings […]. Marseille: European Language Resources Association, 2020. p. 4034–4043. Disponível em: https://aclanthology.org/2020.lrec-1.497. Acesso em: 29 dez. 2021.

NUNES, A. L.; RADEMAKER, A.; ALENCAR, L. F. de: Utilizando um dicionário morfológico para expandir a cobertura lexical de uma gramática do português no formalismo HPSG. In: SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), 13 , 2021. Evento Online. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2021. p. 11–18. DOI https://doi.org/10.5753/stil.2021.17779

PERINI, M. Construindo o Dicionário de Valências: problemas e resultados. Scripta, Belo Horizonte, v. 20, p. 148–167, 2016. DOI https://doi.org/10.5752/P.2358-3428.2016v20n38p148

PERINI, M. A. Describing verb valency: Practical and theoretical issues. Cham: Springer, 2015. DOI https://doi.org/10.1007/978-3-319-20985-2

PERINI, M. A. et al. Valency dictionary of Brazilian Portuguese verbs. Não publicado. 2019.

POLINSKY, M. Raising and control. In: DIKKEN, M. den (ed.). The Cambridge handbook of generative syntax: Grammar and syntax. Cambridge: Cambridge University Press, 2013. p. 577–606. DOI https://doi.org/10.1017/CBO9780511804571.021

POULSON, L. Meta-modeling of tense and aspect in a cross-linguistic grammar engineering platform. University of Washington Working Papers in Linguistics, v. 28, p. 1–67, 2011.

RADEMAKER, A. et al. Universal Dependencies for Portuguese. In: INTERNATIONAL CONFERENCE ON DEPENDENCY LINGUISTICS (DepLing), 4, 2017, Pisa. Proceedings […]. Pisa: Linköping University Electronic Press, 2017. p. 197–206.

ROSÉN, V. et al. An open infrastructure for advanced treebanking. In: HAJIČ, J. META-RESEARCH Workshop on Advanced Treebanking at LREC2012. [S.l.], 2012. p. 22–29.

SAG, I. A.; WASOW, T.; BENDER, E. M. Syntactic theory: A formal introduction. 2. ed. Stanford: CSLI, 2003.

SCHUSTER, S.; MANNING, C. D. Enhanced English Universal Dependencies: An improved representation for natural language understanding tasks. In: INTERNATIONAL CONFERENCE ON LANGUAGE RESOURCES AND EVALUATION (LREC), 2016, 10, Portorož. Proceedings [...]. Portorož: European Language Resources Association, 2016.

SIEGEL, M.; BENDER, E. M.; BOND, F. Jacy: An implemented grammar of Japanese. Stanford: CSLI, 2016.

SILVA, D. G. B. da; KOMISSAROV, B. N. et al. (org.). Os diários de Langsdorff. Campinas: Associação Internacional de Estudos Langsdorff, 1997. DOI https://doi.org/10.7476/9788575412459

SILVEIRA, G. O comportamento sintático dos clíticos no português brasileiro. Dissertação (Mestrado) — Universidade Federal de Santa Catarina, Florianópolis, 1997. Disponível em: https://repositorio.ufsc.br/handle/123456789/112183

STRAKA, M.; STRAKOVÁ, J. Tokenizing, POS tagging, lemmatizing and parsing UD 2.0 with UDPipe. In: Proceedings of the CoNLL 2017 Shared Task: Multilingual parsing from raw text to Universal Dependencies. Vancouver: Association for Computational Linguistics, 2017. p. 88–99. DOI https://doi.org/10.18653/v1/K17-3009

WESTERSTÅHL, D. Generalized quantifiers. In: ZALTA, E. N. (ed.). The Stanford encyclopedia of philosophy. Stanford: Stanford University, 2019.

ZAMARAEVA, O. Assembling Syntax: Modeling constituent questions in a grammar engineering framework. Tese (Doutorado) — University of Washington, Seattle, 2021. Disponível em: http://hdl.handle.net/1773/47087

ZAMARAEVA, O.; HOWELL, K.; BENDER, E. M. Modeling clausal complementation for a grammar engineering resource. In: SOCIETY FOR COMPUTATION IN LINGUISTICS (SciL), 2019, New York. Proceedings […]. [S.l.]: [s.n.], 2019. p. 39–49.

ZARING, L. On prepositions and case-marking in French. Canadian Journal of Linguistics, v. 36, p. 363–377, 1991. DOI https://doi.org/10.1017/S000841310001450X

Downloads

Publicado

12.09.2022

Como Citar

ALENCAR, L. F. de; RADEMAKER, A. Modelação da valência verbal numa gramática computacional do português no formalismo HPSG . Domínios de Lingu@gem, Uberlândia, v. 16, n. 4, p. 1339–1400, 2022. DOI: 10.14393/DL52-v16n4a2022-6. Disponível em: https://seer.ufu.br/index.php/dominiosdelinguagem/article/view/64132. Acesso em: 26 jul. 2024.