Gramateca and Literateca as language macroscopes
DOI:
https://doi.org/10.14393/DL52-v16n4a2022-2Keywords:
Corpora, Visualization, Corpus linguistics, Literary studiesAbstract
This paper demonstrates several features of Gramateca and Literateca, which are environments for linguistic and literary research on top of being a large richly annotated corpora in Portuguese. The paper presents them and pinpoints several new functionalities; it additionally provides ten examples of research questions that demonstrate the usefulness of this kind of Web-based service, that can be conceived as language macroscopes. Examples concern semantics, morphosyntax, distant reading of literary texts, and information extraction.
Downloads
Metrics
References
BICK, E. The Parsing System "Palavras": Automatic Grammatical Analysis of Portuguese in a Constraint Grammar Framework. Dissertação (PhD), Aarhus University. Aarhus University Press, 2000.
BICK, E. Automatic Semantic Role Annotation for Portuguese. In: TIL, V Workshop em Tecnologia da Informação e da Linguagem Humana. Rio de Janeiro, RJ, 30 de junho a 6 de julho de 2007. p. 1715-1719.
BICK, E. PALAVRAS, a Constraint Grammar-based Parsing System for Portuguese. In: BERBER SARDINHA, T.; FERREIRA, T. L. S. B. (ed.). Working with Portuguese Corpora. London/New York: Bloomsbury Academic, 2014. p. 279-302.
FREITAS, C.; SANTOS, D.; GONÇALVES, A. Perguntas já respondidas sobre o AC/DC: desde como começar até uso complexo de funcionalidades poderosas. Primeira edição: 15 de Outubro de 2011. Disponível em: https://www.linguateca.pt/ACDC/
HIGUCHI, S.; SANTOS, D.; FREITAS, C.; RADEMAKER, A. Distant reading Brazilian history. In: NAVARRETA, C.; AGIRREZABAL, M.; MAEGARD, B. (ed.). Proceedings of the Digital Humanities in the Nordic Countries 4th Conference (Copenhagen, Denmark, March 5-8, 2019), 2019. p. 190-200.
LANGFELDT, M. C. Entre médicos e charlatães: A ascensão da medicina na formação da literatura brasileira. Apresentação no III Encontro Nacional de Estudos Linguísticos e Literários (ENAELL), I Encontro Internacional de Pesquisas em Letras (ENIPEL). UEMA, 25-27 de maio de 2021. Disponível em: https://www.youtube.com/watch?v=XFEVaZC_ibU
SANTOS, D. Corporizando algumas questões. In: TAGNIN, S. E. O.; VALE, O. A. (org.). Avanços da Lingüística de Corpus no Brasil. Editora Humanitas/FFLCH/USP, São Paulo, 2008. p. 41-66. Disponível em https://www.linguateca.pt/Diana/download/Santos2008livroStellaOtofinal.pdf
SANTOS, D. Corpora at Linguateca: Vision and roads taken. In: BERBER SARDINHA, T.; FERREIRA, T. L. S. B. (ed.). Working with Portuguese Corpora. London/New York: Bloomsbury Academic, 2014. p. 219-236.
SANTOS, D. Gramateca: corpus-based grammar of Portuguese. In: BAPTISTA, J.; MAMEDE, N.; CANDEIAS, S.; PARABONI, I.; PARDO, T. A.S.; NUNES, M. G. V. (ed.). Computational Processing of the Portuguese Language, 11th International Conference, PROPOR 2014, São Carlos/SP, Brazil, October 6-8, 2014, Proceedings. LNAI 8775. Heidelberg: Springer, 2014. p. 214-219.
SANTOS, D. Um novo corpo e seus desafios. In: FREITAS, C.; RADEMAKER, A. (ed.). STIL 2015: X Brazilian Symposium in Information and Human Language Technology and Collocated Events, Proceedings of the Conference, November 4 to 7, 2015. Natal, Rio Grande do Norte. p. 39-43.
SANTOS, D. José Mariano Gago ‐ O Ministro da Língua. Apresentação no Encontro Caminhos do conhecimento, Leiria, 16 de Maio de 2018. Disponível em: https://www.linguateca.pt/Diana/download/LeiriaJMG.pdf
SANTOS, D. Doctors in lusophone literature. Blog post in Digital Literary Stylistics (SIG-DLS). 2019. Acessível de: https://dls.hypotheses.org/952
SANTOS, D. Explorando o vestuário na literatura em português. TradTerm, v. 37, n. 2, p. 622-643, 2021. DOI https://doi.org/10.11606/issn.2317-9511.v37p622-643
SANTOS, D.; ALVES, D. Placing GIS and NLP in literary geography: experiments with literature in Portuguese. Em apreciação. Disponível em: https://www.linguateca.pt/Diana/download/SantosAlves2022subm.pdf
SANTOS, D.; BICK, E. Providing Internet access to Portuguese corpora: the AC/DC project. In: GAVRILIDOU, M. et al. (ed.). Proceedings of the Second International Conference on Language Resources and Evaluation, LREC 2000. Athens, 31 May-2 June 2000. p. 205-210.
SANTOS, D.; FREITAS, C. Estudando personagens na literatura lusófona. In: STIL 2019 — XII Symposium in Information and Human Language Technology and Collocates Events, October 15-18, 2019, Salvador, BA, Proceedings of conference, 2019. p. 48-52.
SANTOS, D.; FREITAS, C.; BICK, E. OBras: a fully annotated and partially human-revised corpus of Brazilian literary works in the public domain. In: OpenCor, Canela, RGS, Brasil, 24 de setembro de 2018. Disponível em: https://www.linguateca.pt/Diana/download/CorLex.pdf
SANTOS, D.; MARQUES, R.; FREITAS, C.; SIMÕES, A.; MOTA, C. Comparando anotações linguísticas na Gramateca: filosofia, ferramentas e exemplos. Domínios de Linguagem, v. 9, n. 2, abr./jun. 2015. p. 11-26. DOI https://doi.org/10.14393/DL18-v9n2a2015-2
SANTOS, D.; MOTA, C. Experiments in human-computer cooperation for the semantic annotation of Portuguese corpora. In: CALZOLARI, N.; CHOUKRI, K.; MAEGARD, B.; MARIANI, J.; ODIJK, J.; PIPERIDIS, S.; ROSNER, M.; TAPIAS, D. (ed.). Proceedings of the International Conference on Language Resources and Evaluation, LREC 2010, 17-23 May 2010, Valletta, Malta. European Language Resources Association, 2010. p. 1437-1444.
SANTOS, D.; RANCHHOD, E. Ambientes de processamento de corpora em português: Comparação entre dois sistemas. In: Actas do IV Encontro sobre o Processamento Computacional da Língua Portuguesa (Escrita e Falada), PROPOR, Évora, 20-21 de Setembro de 1999. p. 257-268.
SANTOS, D.; SIMÕES, A.; MOTA, C. Broad coverage emotion annotation. Language Resources and Evaluation, 2021. DOI https://doi.org/10.1007/s10579-021-09565-1
SIMÕES, A.; SANTOS, D. Ensinador: corpus-based Portuguese grammar exercises. Procesamiento del Lenguaje Natural, v. 47, septiembre de 2011, p. 301-309.
SIMÕES, A.; SANTOS, D. Nos bastidores da Gramateca: uma série de serviços. In: Workshop on Tools and Resources for Automatically Processing Portuguese and Spanish, at PROPOR 2014, São Carlos, Brazil, 9 de outubro de 2014. p. 97-104.
SOARES DA SILVA, A. O corpus CONDIV e o estudo da convergência e divergência entre variedades do português. In COSTA, L.; SANTOS, D.; CARDOSO, N. (org.). Perspectivas sobre a Linguateca: Actas do encontro Linguateca : 10 anos. Linguateca, 2008. p. 25-28. Disponível em: http://www.linguateca.pt/LivroL10/Cap04-Costaetal2008-Silva.pdf
Published
How to Cite
Issue
Section
License
Copyright (c) 2022 Diana Maria de Sousa Marques Pinto dos Santos
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
Authors who publish in this journal agree to the following terms:
Authors retain the copyright and waiver the journal the right of first publication, with the work simultaneously licensed under the Creative Commons Attribution License (CC BY-NC-ND 4.0), allowing the sharing of work with authorship recognition and preventing its commercial use.
Authors are authorized to take additional contracts separately, for non-exclusive distribution of the version of the work published in this journal (publish in institutional repository or as a book chapter), with acknowledgment of authorship and initial publication in this journal.