TRADUÇÃO DE ARQUIVOS PDF - José Henrique Lamensdorf - translation - tradução

Go to content

TRADUÇÃO DE ARQUIVOS PDF

PORTUGUÊS > TRADUÇÃO > ARQUIVOS PDF

TRADUÇÃO DE ARQUIVOS PDF

O padrão atual de para se distribuir as publicações mais variadas eletronicamente é o arquivo PDF. Livros, revistas, manuais, catálogos, folhetos, tudo o que anteriormente era publicado em papel, hoje é publicado em PDF, seja exclusivamente ou como complemento à publicação paralela em papel.

A grande vantagem dos arquivos PDF é que eles podem ser vistos e lidos em praticamente qualquer aparelho, não apenas computadores com qualquer sistema operacional, mas também celulares, tablets, smart TVs e outros. Não bastasse isso, eles contam com recursos de busca por palavras ou frases, e podem incluir vídeo, áudio e animações.

Evidentemente, a criação de arquivos tão versáteis e complexos exige não só técnicas e software especializados, mas também uma boa dose de arte na criação de uma aparência visualmente atraente. Todavia, quando a missão é traduzir um arquivo PDF para outro idioma, por uma lado a parte artística já está pronta, basta preservá-la; por outro, a complexidade do arquivo pode atrapalhar um pouco a tradução.

O que se segue é a explicação do conceito de tradução em arquivos PDF. Se você veio a esta página querendo ver como isso é feito na prática, clique aqui.

Recapitulando a história, o PDF – Portable Document Format – desenvolvido pela Adobe em 1993, é um formato muito prático, que realmente se tornou padrão no mercado. As principais características que o levaram a isso foram:

    • Arquivos muito mais compactos, facilitando a distribuição, seja em mídia física (discos, pen drives, cartões SD) ou via Internet.
    • O mesmo arquivo PDF pode ser visualizado ou impresso indiferentemente ao computador ou sistema operacional.
    • Há programas para visualizar/imprimir arquivos PDF para qualquer sistema operacional, e todos eles são gratuitos.
    • Qualquer programa de computador capaz de imprimir para uma impressora padrão PostScript (também desenvolvido pela Adobe) é capaz de gerar um PDF.
    • Se gerado corretamente, não requer que o computador do usuário tenha instaladas as fontes usadas originalmente no documento, para uma visualização idêntica ao original.

Em função disso, uma quantidade avassaladora de empresas passou a publicar catálogos, manuais, folhetos e outras publicações anteriormente impressas em formato PDF. Além de economizar uma quantidade incomensurável de papel, contribuindo para o meio ambiente, a atualização ficou muito mais fácil e rápida.

Mas nem tudo é tão simples. Essas publicações costumam ser geradas em programas variados de editoração eletrônica (tipicamente PageMaker, InDesign, FrameMaker, QuarkXpress e outros). À exceção de PageMaker e InDesign que são “pai e filho”, o aprendizado de cada um deles segue uma linha bem diferente; cada um é novidade para o usuário de outro. Como se isso não bastasse, os arquivos que cada um desses programas gera são exclusivos e incompatíveis com os gerados pelos outros. Nenhum dos poucos conversores que existem entre alguns deles funciona a contento. O que todos eles têm em comum é a capacidade de gerar arquivos PDF.

Aqui cabe observar que existem dois tipos de arquivos PDF, sob o ponto de vista da tradução (e outros também). Um é o “gerado”, “destilado” (como a Adobe chama) ou "vivo", que é editável, portanto traduzível. Outro é o escaneado, onde uma página impressa é transformada em um gráfico, um desenho, e que não é editável. Para deixar bem claro, a letra “O” no PDF gerado é uma letra “O”, com certas características (fonte, tamanho, negrito, itálico, sublinhado etc.). No PDF escaneado, a mesma letra O é apenas um círculo ou oval em meio a um desenho do tamanho da página inteira.

O processo convencional para traduzir essas publicações é complicado. Vamos chamar de DTPista (de DeskTop Publishing = editoração eletrônica, em inglês) ao profissional que opera o programa, e que frequentemente domina somente um idioma. Eu sou tradutor e DTPista, contudo na segunda atividade fico limitado ao PageMaker.

Em linhas gerais, o processo convencional consiste das seguintes etapas:
    • DTPista extrai o texto do arquivo original e envia ao Tradutor em forma de tabela, para saber o que corresponde ao quê.
    • Tradutor traduz em outra coluna, preservando a parte original da tabela, bem como a formatação de certas palavras, ou seja, quais deverão ficar em itálico, negrito, sublinhado, e envia a tabela ao DTPista.
    • DTPista cuidadosamente passa, um por um, cada bloco de texto traduzido para o devido lugar no arquivo original. Depois disso, se o bloco de texto tiver inchado ou encolhido na tradução, faz os ajustes necessários. Em seguida destila um PDF, que envia ao Tradutor.
    • Tradutor revisa cuidadosamente a publicação, procurando textos faltando, sobrando ou fora do devido lugar, erros de acentuação causados por fontes incompatíveis, erros na separação de sílabas e outros. Prepara uma lista de correções, seja em arquivo separado, ou em anotações no próprio PDF.
    • Inicia-se um jogo de pingue-pongue entre Tradutor (ou Revisor) e DTPista, que só termina quando a lista de correções estiver reduzida a zero.

Fica óbvio o motivo de tradutores e agências de tradução fugirem de arquivos PDF. De um modo geral, os bons DTPistas gostam de criar novas publicações, mas aceitam esses trabalhos para encher a agenda. Não deixa de ser um transtorno para todos.

Mais recentemente, surgiu um jeito moderno de traduzir PDFs. Certo dia vi um programa chamado Infix, destinado a editar os elementos dentro de um arquivo PDF. Era muito melhor do que voltar às origens e achar alguém capaz de lidar com o arquivo oringinalde DTP, feito com um programa específico. Não sei se fui o único, mas escrevi à empresa, sugerindo que adaptassem o programa para o mercado de tradução de PDFs. Foi o que fizeram.

Como ficou o fluxo de trabalho com o Infix? No meu caso, com a experiência acumulada como DTPista em PageMaker, os arquivos PDF criados com quaisquer outros programas se tornaram acessíveis; não é preciso comprar e aprender a usar InDesign, Quark, FrameMaker, e nem os de segunda linha, Microsoft Publisher, PagePlus e Scribus. As publicações mais complexas criadas em Word (e convertidas em PDF) não eram mais um desafio para se traduzir e preservar a diagramação. Então, sim, um tradutor que tenha certa prática em editoração eletrônica (algo que o Microsoft Word não faz, pois é apenas um processador de texto), já pode oferecer traduções perfeitamente diagramadas em PDF sem ter de envolver um DTPista. Afinal de contas, o tradutor não irá criar uma nova diagramação.

O processo no Infix ficou assim:
    • Analisar o documento quanto a fontes (de letras) utilizadas, e preparar-se para obtê-las ou achar equivalentes.
    • Exportar o texto do PDF para um arquivo XLIFF, XML ou TXT. Isto deixa marcas (tags) tanto no PDF como nesse arquivo para permitir importar o texto de volta preservando a formatação (fonte, tamanho, cor, negrito, itálico etc.) e a posição de cada bloco de texto.
    • Em outro programa (pode ser o Microsoft Word), traduzir o arquivo exportado, deixando as marcações intactas. Revisar ortografia, gramática etc.
    • De volta ao Infix, importar o arquivo de volta. Nesse momento, o programa irá perguntar sobre as fontes parcialmente embutidas no PDF original, que não têm os caracteres utilizados. É preciso estar preparado para substituí-las.
    • Ajustar minuciosamente toda a diagramação do PDF, bloco por bloco. Algumas tabelas, especificamente no caso de substituição de fontes, podem precisar de ajustes individuais em cada célula.
    • Verificar se há figuras com texto embutido como gráfico, traduzir e editar conforme necessário.

O PDF traduzido fica pronto, com um considerável ganho em tempo e custos. O InFix não é mais fácil de aprender do que um programa de editoração eletrônica. A grande vantagem é que ele trabalha no formato final de todos eles.


Se você tiver arquivos em PDF que precise traduzir entre inglês e português, entre em contato comigo, clicando no botão de E-mail à esquerda.


Back to content