Prática de projeto de gerenciamento de corpus e terminologia

Histórico do projeto:

A Volkswagen é uma fabricante de automóveis de renome mundial, com diversos modelos em seu portfólio. Sua demanda concentra-se principalmente nos três principais idiomas: alemão, inglês e chinês.


Requisitos do cliente:

Precisamos encontrar um fornecedor de serviços de tradução a longo prazo e esperamos que a qualidade da tradução seja estável e confiável.

Análise do projeto:

A Tang Neng Translation realizou uma análise interna com base nas necessidades do cliente e, para garantir uma qualidade de tradução estável e confiável, o corpus e a terminologia são cruciais. Embora este cliente já tenha dado grande atenção ao arquivamento de documentos (incluindo versões originais e traduzidas), ele possui o pré-requisito para um trabalho complementar de corpus. O problema atual é:
1) A maioria dos autoproclamados "corpus" dos clientes não é um "corpus" verdadeiro, mas apenas documentos bilíngues correspondentes que não podem ser efetivamente utilizados em trabalhos de tradução. O chamado "valor de referência" é apenas um desejo vago e irrealista que não pode ser realizado;
2) Uma pequena parte acumulou materiais linguísticos, mas os clientes não têm pessoal dedicado para gerenciá-los. Devido à substituição de fornecedores de tradução, os formatos dos corpora fornecidos por cada empresa são diferentes e frequentemente apresentam problemas como múltiplas traduções de uma mesma frase, múltiplas traduções de uma mesma palavra e incompatibilidade entre o conteúdo original e a tradução de destino nos corpora, o que reduz consideravelmente o valor prático de aplicação dos corpora;
3) Sem uma biblioteca terminológica unificada, é possível que vários departamentos da empresa traduzam a terminologia de acordo com suas próprias versões, o que resulta em confusão e afeta a qualidade do conteúdo produzido pela empresa.
Como resultado, a Tang Neng Translation forneceu aos clientes sugestões e ofereceu serviços de gestão de corpus e terminologia.

Pontos-chave do projeto:
Processar documentos bilíngues de corpus histórico e não histórico de acordo com diferentes situações, avaliar a qualidade dos recursos do corpus, aumentar ou diminuir os processos com base na qualidade e preencher as lacunas anteriores;

Novos projetos incrementais devem usar estritamente CAT (aplicação assistida por computador), acumular e gerenciar materiais linguísticos e terminologia, e evitar a criação de novas vulnerabilidades.

Pensamento em projetos e avaliação de eficácia:
efeito:

Em menos de 4 meses, Tang conseguiu processar documentos históricos bilíngues usando ferramentas de alinhamento e revisão manual, além de organizar partes do corpus que estavam desorganizadas. Ele concluiu um corpus com mais de 2 milhões de palavras e um banco de dados terminológico com várias centenas de entradas, estabelecendo uma base sólida para a construção da infraestrutura;

2. No novo projeto de tradução, esses corpora e termos foram utilizados imediatamente, melhorando a qualidade e a eficiência, e agregando valor;
3. O novo projeto de tradução utiliza estritamente ferramentas CAT, e o novo trabalho de gestão de corpus e terminologia continua com base nos princípios originais, visando o desenvolvimento a longo prazo.

Pensamento:

1. Ausência e estabelecimento da consciência:
Poucas empresas percebem que os materiais linguísticos também são ativos, pois não existe um departamento unificado para gestão de documentos e materiais linguísticos. Cada departamento tem suas próprias necessidades de tradução, e a seleção de fornecedores de serviços de tradução não é uniforme, resultando em um acervo linguístico da empresa não apenas carente de materiais e terminologia, mas também com problemas no arquivamento de documentos bilíngues, dispersos em vários locais e com versões confusas.
A Volkswagen possui um certo nível de consciência, portanto a preservação de documentos bilíngues é relativamente completa, devendo-se atentar para o arquivamento oportuno e o armazenamento adequado. Contudo, devido à falta de compreensão das ferramentas técnicas e de produção na indústria da tradução, e à incapacidade de compreender o significado específico de "corpus", presume-se que os documentos bilíngues possam ser usados ​​como referência, sem que haja um conceito de gestão terminológica.
O uso de ferramentas CAT tornou-se uma necessidade na produção de traduções modernas, dispensando as memórias de tradução para o texto processado. No futuro da produção de traduções, trechos duplicados poderão ser comparados automaticamente em ferramentas CAT a qualquer momento, e uma biblioteca terminológica poderá ser adicionada ao sistema CAT para detectar automaticamente inconsistências na terminologia. Percebe-se, portanto, que para a produção de traduções, as ferramentas técnicas são essenciais, assim como os materiais linguísticos e a terminologia, ambos indispensáveis. Somente complementando-os na produção é possível obter resultados da mais alta qualidade.
Portanto, o primeiro aspecto a ser abordado na gestão de materiais linguísticos e terminologia é a questão da conscientização e dos conceitos. Somente ao compreendermos plenamente sua necessidade e importância poderemos ter a motivação necessária para investir e preencher as lacunas nessa área nas empresas, transformando os recursos linguísticos em verdadeiros tesouros. Um investimento pequeno, mas com retornos enormes e de longo prazo.

2. Métodos e Execução

Com consciência, o que devemos fazer a seguir? Muitos clientes não têm a energia e as habilidades profissionais para concluir essa tarefa. Profissionais fazem coisas profissionais, e a Tang Neng Translation percebeu essa necessidade oculta dos clientes em sua longa prática de serviços de tradução, lançando o produto "Serviços de Tecnologia de Tradução", que inclui "Gestão de Corpus e Terminologia", oferecendo serviços de terceirização para que os clientes organizem e mantenham seus bancos de dados de corpora e terminologia, ajudando-os a gerenciá-los com eficácia.

O trabalho de criação de corpus e terminologia se beneficia muito mais quanto mais cedo for realizado. É uma tarefa urgente para as empresas, especialmente para documentos técnicos e de produtos, que possuem alta frequência de atualização, alto valor de reutilização e altos requisitos para a publicação unificada de terminologia.


Data da publicação: 09/08/2025