Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language Videos

Lucas Maciel Peixoto; Luiz Fernando Afra Brito

doi:10.14393/DL19-v9n3a2015-15

Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language Videos

Authors

Lucas Maciel Peixoto Universidade Federal de Uberlândia
Luiz Fernando Afra Brito Universidade Federal de Uberlândia

DOI:

https://doi.org/10.14393/DL19-v9n3a2015-15

Keywords:

Linguística Computacional, Linguística de Corpus, Ensino de línguas baseado em corpora, Compilação de corpus, Ferramentas de corpora on-line

Abstract

O Corpus of English Language Videos (CELV) é composto por legendas de vídeos em inglês do YouTube, e tem como objetivo servir como recurso didático para o ensino e aprendizagem da língua por meio de uma ferramenta de busca disponibilizada on-line. Este texto apresenta os procedimentos linguísticos e computacionais que foram realizados para o desenvolvimento do CELV, desde a coleta de textos até a construção da ferramenta. Buscou-se embasamento teórico-metodológico na Linguística Computacional e áreas relacionadas, como a Linguística de Corpus, o Processamento de Linguagem Natural e a Recuperação de Informação. Espera-se que a metodologia exposta no texto possua detalhes suficientes para demonstrar as etapas mais importantes na construção desse tipo de sistema, permitindo a replicação do processo por outros pesquisadores.

Downloads

Download data is not yet available.

Metrics

Metrics Loading ...

Author Biographies

Lucas Maciel Peixoto, Universidade Federal de Uberlândia

Estudante de mestrado em Estudos Linguísticos no PPGEL - Universidade Federal de Uberlândia. Áreas de interesse: Língua Inglesa, Ensino de Língua Estrangeira, Liguística de Corpus

Luiz Fernando Afra Brito, Universidade Federal de Uberlândia

Estudante de graduação em Sistemas de Informação na Universidade Federal de Uberlândia.

Downloads

PDF (Português (Brasil))

Published

2015-07-31

How to Cite

PEIXOTO, L. M.; AFRA BRITO, L. F. Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language Videos. Domínios de Lingu@gem, Uberlândia, v. 9, n. 3, p. 275–299, 2015. DOI: 10.14393/DL19-v9n3a2015-15. Disponível em: https://seer.ufu.br/index.php/dominiosdelinguagem/article/view/29266. Acesso em: 22 nov. 2024.

Download Citation

Issue

Vol. 9 No. 3 (2015): Número atemático

Section

Articles

License

Authors who publish in this journal agree to the following terms:

Authors retain the copyright and waiver the journal the right of first publication, with the work simultaneously licensed under the Creative Commons Attribution License (CC BY-NC-ND 4.0), allowing the sharing of work with authorship recognition and preventing its commercial use.

Authors are authorized to take additional contracts separately, for non-exclusive distribution of the version of the work published in this journal (publish in institutional repository or as a book chapter), with acknowledgment of authorship and initial publication in this journal.