A construção e análise de corpora para alimentação de um banco de dados terminográfico
um exemplo
DOI:
https://doi.org/10.14393/DL3-v2n1a2008-12Palavras-chave:
Linguística de Corpus, Banco de Dados Terminográfico, Informática, Linguística, WordSmith ToolsResumo
O presente artigo pretende demonstrar a criação de corpora técnicos bilíngues (português e inglês), com a finalidade de alimentar um banco de dados de caráter terminográfico. Para tanto, foram construídos dois corpora, bilíngues nas áreas de Informática e Linguística, retirados da Internet, com aproximadamente um milhão de palavras cada um. Os corpora resultantes foram usados para levantamento de candidatos a termos nas duas áreas citadas (através do uso do software WordSmith Tools) e forneceram dados para a construção da microestrutura de verbetes técnicos, através de exemplos reais de uso de língua e dados morfo- sintático- semânticos.
Downloads
Métricas
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Copyright (c) 2008 Guilherme Fromm
Este trabalho está licenciado sob uma licença Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
Autores que publicam nesta revista concordam com os seguintes termos da licença Creative Commons
CC BY-NC-ND 4.0: o artigo pode ser copiado e redistribuído em qualquer suporte ou formato; os créditos devem ser dados ao autor original e mudanças no texto devem ser indicadas; o artigo não pode ser usado para fins comerciais; caso o artigo seja remixado, transformado ou algo novo for criado a partir dele, o mesmo não pode ser distribuído.
Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.