Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language Videos
DOI:
https://doi.org/10.14393/DL19-v9n3a2015-15Palabras clave:
Linguística Computacional, Linguística de Corpus, Ensino de línguas baseado em corpora, Compilação de corpus, Ferramentas de corpora on-lineResumen
O Corpus of English Language Videos (CELV) é composto por legendas de vídeos em inglês do YouTube, e tem como objetivo servir como recurso didático para o ensino e aprendizagem da língua por meio de uma ferramenta de busca disponibilizada on-line. Este texto apresenta os procedimentos linguísticos e computacionais que foram realizados para o desenvolvimento do CELV, desde a coleta de textos até a construção da ferramenta. Buscou-se embasamento teórico-metodológico na Linguística Computacional e áreas relacionadas, como a Linguística de Corpus, o Processamento de Linguagem Natural e a Recuperação de Informação. Espera-se que a metodologia exposta no texto possua detalhes suficientes para demonstrar as etapas mais importantes na construção desse tipo de sistema, permitindo a replicação do processo por outros pesquisadores.Descargas
Métricas
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Domínios de Lingu@gem utiliza la licencia Creative Commons (CC) CC BY-NC-ND 4.0, preservando así la integridad de los artículos en un ambiente de acceso abierto. La revista permite al autor conservar los derechos de publicación sin restricciones.