Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language Videos

Authors

  • Lucas Maciel Peixoto Universidade Federal de Uberlândia
  • Luiz Fernando Afra Brito Universidade Federal de Uberlândia

DOI:

https://doi.org/10.14393/DL19-v9n3a2015-15

Keywords:

Linguística Computacional, Linguística de Corpus, Ensino de línguas baseado em corpora, Compilação de corpus, Ferramentas de corpora on-line

Abstract

O Corpus of English Language Videos (CELV) é composto por legendas de vídeos em inglês do YouTube, e tem como objetivo servir como recurso didático para o ensino e aprendizagem da língua por meio de uma ferramenta de busca disponibilizada on-line. Este texto apresenta os procedimentos linguísticos e computacionais que foram realizados para o desenvolvimento do CELV, desde a coleta de textos até a construção da ferramenta. Buscou-se embasamento teórico-metodológico na Linguística Computacional e áreas relacionadas, como a Linguística de Corpus, o Processamento de Linguagem Natural e a Recuperação de Informação. Espera-se que a metodologia exposta no texto possua detalhes suficientes para demonstrar as etapas mais importantes na construção desse tipo de sistema, permitindo a replicação do processo por outros pesquisadores.

Downloads

Author Biographies

  • Lucas Maciel Peixoto, Universidade Federal de Uberlândia
    Estudante de mestrado em Estudos Linguísticos no PPGEL - Universidade Federal de Uberlândia. Áreas de interesse: Língua Inglesa, Ensino de Língua Estrangeira, Liguística de Corpus
  • Luiz Fernando Afra Brito, Universidade Federal de Uberlândia
    Estudante de graduação em Sistemas de Informação na Universidade Federal de Uberlândia.

Published

2015-07-31

How to Cite

PEIXOTO, Lucas Maciel; AFRA BRITO, Luiz Fernando. Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language Videos. Domínios de Lingu@gem, Uberlândia, v. 9, n. 3, p. 275–299, 2015. DOI: 10.14393/DL19-v9n3a2015-15. Disponível em: https://seer.ufu.br/index.php/dominiosdelinguagem/article/view/29266. Acesso em: 29 may. 2025.