Gramateca and Literateca as language macroscopes

Authors

DOI:

https://doi.org/10.14393/DL52-v16n4a2022-2

Keywords:

Corpora, Visualization, Corpus linguistics, Literary studies

Abstract

This paper demonstrates several features of Gramateca and Literateca, which are environments for linguistic and literary research on top of being a large richly annotated corpora in Portuguese. The paper presents them and pinpoints several new functionalities; it additionally provides ten examples of research questions that demonstrate the usefulness of this kind of Web-based service, that can be conceived as language macroscopes. Examples concern semantics, morphosyntax, distant reading of literary texts, and information extraction.

Downloads

Download data is not yet available.

Metrics

Metrics Loading ...

Author Biography

Diana Maria de Sousa Marques Pinto dos Santos, Linguateca/Universidade de Oslo

Doutora, Universidade de Oslo e Linguateca.

References

BICK, E. The Parsing System "Palavras": Automatic Grammatical Analysis of Portuguese in a Constraint Grammar Framework. Dissertação (PhD), Aarhus University. Aarhus University Press, 2000.

BICK, E. Automatic Semantic Role Annotation for Portuguese. In: TIL, V Workshop em Tecnologia da Informação e da Linguagem Humana. Rio de Janeiro, RJ, 30 de junho a 6 de julho de 2007. p. 1715-1719.

BICK, E. PALAVRAS, a Constraint Grammar-based Parsing System for Portuguese. In: BERBER SARDINHA, T.; FERREIRA, T. L. S. B. (ed.). Working with Portuguese Corpora. London/New York: Bloomsbury Academic, 2014. p. 279-302.

FREITAS, C.; SANTOS, D.; GONÇALVES, A. Perguntas já respondidas sobre o AC/DC: desde como começar até uso complexo de funcionalidades poderosas. Primeira edição: 15 de Outubro de 2011. Disponível em: https://www.linguateca.pt/ACDC/

HIGUCHI, S.; SANTOS, D.; FREITAS, C.; RADEMAKER, A. Distant reading Brazilian history. In: NAVARRETA, C.; AGIRREZABAL, M.; MAEGARD, B. (ed.). Proceedings of the Digital Humanities in the Nordic Countries 4th Conference (Copenhagen, Denmark, March 5-8, 2019), 2019. p. 190-200.

LANGFELDT, M. C. Entre médicos e charlatães: A ascensão da medicina na formação da literatura brasileira. Apresentação no III Encontro Nacional de Estudos Linguísticos e Literários (ENAELL), I Encontro Internacional de Pesquisas em Letras (ENIPEL). UEMA, 25-27 de maio de 2021. Disponível em: https://www.youtube.com/watch?v=XFEVaZC_ibU

SANTOS, D. Corporizando algumas questões. In: TAGNIN, S. E. O.; VALE, O. A. (org.). Avanços da Lingüística de Corpus no Brasil. Editora Humanitas/FFLCH/USP, São Paulo, 2008. p. 41-66. Disponível em https://www.linguateca.pt/Diana/download/Santos2008livroStellaOtofinal.pdf

SANTOS, D. Corpora at Linguateca: Vision and roads taken. In: BERBER SARDINHA, T.; FERREIRA, T. L. S. B. (ed.). Working with Portuguese Corpora. London/New York: Bloomsbury Academic, 2014. p. 219-236.

SANTOS, D. Gramateca: corpus-based grammar of Portuguese. In: BAPTISTA, J.; MAMEDE, N.; CANDEIAS, S.; PARABONI, I.; PARDO, T. A.S.; NUNES, M. G. V. (ed.). Computational Processing of the Portuguese Language, 11th International Conference, PROPOR 2014, São Carlos/SP, Brazil, October 6-8, 2014, Proceedings. LNAI 8775. Heidelberg: Springer, 2014. p. 214-219.

SANTOS, D. Um novo corpo e seus desafios. In: FREITAS, C.; RADEMAKER, A. (ed.). STIL 2015: X Brazilian Symposium in Information and Human Language Technology and Collocated Events, Proceedings of the Conference, November 4 to 7, 2015. Natal, Rio Grande do Norte. p. 39-43.

SANTOS, D. José Mariano Gago ‐ O Ministro da Língua. Apresentação no Encontro Caminhos do conhecimento, Leiria, 16 de Maio de 2018. Disponível em: https://www.linguateca.pt/Diana/download/LeiriaJMG.pdf

SANTOS, D. Doctors in lusophone literature. Blog post in Digital Literary Stylistics (SIG-DLS). 2019. Acessível de: https://dls.hypotheses.org/952

SANTOS, D. Explorando o vestuário na literatura em português. TradTerm, v. 37, n. 2, p. 622-643, 2021. DOI https://doi.org/10.11606/issn.2317-9511.v37p622-643

SANTOS, D.; ALVES, D. Placing GIS and NLP in literary geography: experiments with literature in Portuguese. Em apreciação. Disponível em: https://www.linguateca.pt/Diana/download/SantosAlves2022subm.pdf

SANTOS, D.; BICK, E. Providing Internet access to Portuguese corpora: the AC/DC project. In: GAVRILIDOU, M. et al. (ed.). Proceedings of the Second International Conference on Language Resources and Evaluation, LREC 2000. Athens, 31 May-2 June 2000. p. 205-210.

SANTOS, D.; FREITAS, C. Estudando personagens na literatura lusófona. In: STIL 2019 — XII Symposium in Information and Human Language Technology and Collocates Events, October 15-18, 2019, Salvador, BA, Proceedings of conference, 2019. p. 48-52.

SANTOS, D.; FREITAS, C.; BICK, E. OBras: a fully annotated and partially human-revised corpus of Brazilian literary works in the public domain. In: OpenCor, Canela, RGS, Brasil, 24 de setembro de 2018. Disponível em: https://www.linguateca.pt/Diana/download/CorLex.pdf

SANTOS, D.; MARQUES, R.; FREITAS, C.; SIMÕES, A.; MOTA, C. Comparando anotações linguísticas na Gramateca: filosofia, ferramentas e exemplos. Domínios de Linguagem, v. 9, n. 2, abr./jun. 2015. p. 11-26. DOI https://doi.org/10.14393/DL18-v9n2a2015-2

SANTOS, D.; MOTA, C. Experiments in human-computer cooperation for the semantic annotation of Portuguese corpora. In: CALZOLARI, N.; CHOUKRI, K.; MAEGARD, B.; MARIANI, J.; ODIJK, J.; PIPERIDIS, S.; ROSNER, M.; TAPIAS, D. (ed.). Proceedings of the International Conference on Language Resources and Evaluation, LREC 2010, 17-23 May 2010, Valletta, Malta. European Language Resources Association, 2010. p. 1437-1444.

SANTOS, D.; RANCHHOD, E. Ambientes de processamento de corpora em português: Comparação entre dois sistemas. In: Actas do IV Encontro sobre o Processamento Computacional da Língua Portuguesa (Escrita e Falada), PROPOR, Évora, 20-21 de Setembro de 1999. p. 257-268.

SANTOS, D.; SIMÕES, A.; MOTA, C. Broad coverage emotion annotation. Language Resources and Evaluation, 2021. DOI https://doi.org/10.1007/s10579-021-09565-1

SIMÕES, A.; SANTOS, D. Ensinador: corpus-based Portuguese grammar exercises. Procesamiento del Lenguaje Natural, v. 47, septiembre de 2011, p. 301-309.

SIMÕES, A.; SANTOS, D. Nos bastidores da Gramateca: uma série de serviços. In: Workshop on Tools and Resources for Automatically Processing Portuguese and Spanish, at PROPOR 2014, São Carlos, Brazil, 9 de outubro de 2014. p. 97-104.

SOARES DA SILVA, A. O corpus CONDIV e o estudo da convergência e divergência entre variedades do português. In COSTA, L.; SANTOS, D.; CARDOSO, N. (org.). Perspectivas sobre a Linguateca: Actas do encontro Linguateca : 10 anos. Linguateca, 2008. p. 25-28. Disponível em: http://www.linguateca.pt/LivroL10/Cap04-Costaetal2008-Silva.pdf

Published

2022-09-12

How to Cite

SANTOS, D. M. de S. M. P. dos. Gramateca and Literateca as language macroscopes. Domínios de Lingu@gem, Uberlândia, v. 16, n. 4, p. 1242–1265, 2022. DOI: 10.14393/DL52-v16n4a2022-2. Disponível em: https://seer.ufu.br/index.php/dominiosdelinguagem/article/view/63848. Acesso em: 21 nov. 2024.