A construção e análise de corpora para alimentação de um banco de dados terminográfico
um exemplo
DOI:
https://doi.org/10.14393/DL3-v2n1a2008-12Keywords:
Linguística de Corpus, Banco de Dados Terminográfico, Informática, Linguística, WordSmith ToolsAbstract
O presente artigo pretende demonstrar a criação de corpora técnicos bilíngues (português e inglês), com a finalidade de alimentar um banco de dados de caráter terminográfico. Para tanto, foram construídos dois corpora, bilíngues nas áreas de Informática e Linguística, retirados da Internet, com aproximadamente um milhão de palavras cada um. Os corpora resultantes foram usados para levantamento de candidatos a termos nas duas áreas citadas (através do uso do software WordSmith Tools) e forneceram dados para a construção da microestrutura de verbetes técnicos, através de exemplos reais de uso de língua e dados morfo- sintático- semânticos.
Downloads
Metrics
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2008 Guilherme Fromm
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
Authors who publish in this journal agree to the following terms:
Authors retain the copyright and waiver the journal the right of first publication, with the work simultaneously licensed under the Creative Commons Attribution License (CC BY-NC-ND 4.0), allowing the sharing of work with authorship recognition and preventing its commercial use.
Authors are authorized to take additional contracts separately, for non-exclusive distribution of the version of the work published in this journal (publish in institutional repository or as a book chapter), with acknowledgment of authorship and initial publication in this journal.