TRADUÇÃO DE PDF COM O INFIX v7 - José Henrique Lamensdorf - translation - tradução

Go to content

TRADUÇÃO DE PDF COM O INFIX v7

PORTUGUÊS > TRADUÇÃO > ARQUIVOS PDF

TRADUÇÃO DIRETA EM ARQUIVOS PDF
COM O INFIX v7


Um bom tempo atrás, publiquei aqui um roteiro passo a passo mostrando como traduzir arquivos PDF diretamente, usando a versão 6 do programa Infix.

Esse roteiro com o Infix v6 continua no site, porém agora está oculto. Se quiser vê-lo, clique aqui. Ocorre que o Infix evoluiu muito desde então, e a sua v7 tornou o processo muito mais fácil.

Vou apresentar aqui uma visão rápida de como o processo funciona atualmente.

Para isso, achei na Internet uma manual de 562 páginas, das quais extraí 7 aleatoriamente, e juntei num PDF único (clique para ver, se tiver o Acrobat Reader), considerando-o como o "original". Cabe observar que:
      • Nunca trabalhei para a empresa que publicou esse manual.
      • Não fui contratado para traduzir nenhuma parte desse manual.
      • Não segui regras de estilo/vocabulário na tradução, e deixei algumas palavras sem traduzir propositalmente.
      • Não verifiquei a coerência nem a ortografia da tradução.
      • O objetivo é apenas demonstrar o processo de tradução de um PDF.


PRIMEIRO PASSO: FONTES (DE LETRAS)

Um  arquivo PDF costuma ter as fontes que utiliza "embutidas" dentro de si.  Como estas podem ser muitas, para economizar no tamanho do arquivo  final, somente os caracteres efetivamente utilizados de cada fonte  naquele PDF são embutidas.

Traduzir apenas com as partes das fontes que estão embutidas num PDF seria como fazê-lo com teclas faltando, diferentes em cada fonte.

Para exemplificar, se um PDF contivesse apenas a palavra republican  usando a fonte Roman Gothic, só teríamos 10 caracteres dessa fonte  embutidos. Se esta fosse uma fonte do tipo OpenType, estaríamos poupando  um bocado de espaço em disco ao deixar de incluir todas as letras  acentuadas, algarismos, sinais gráficos (@#$%, etc.) e de pontuação, e  especialmente alfabetos inteiros como cirílico, hebraico, árabe, grego e  outros que fazem parte dessas fontes.

Se fôssemos traduzir republican para português ou espanhol, bastaria acrescentar um O no final. Como esta letra não estaria embutida no PDF, esse O  seria representado por um quadradinho, um espaço, um sublinhado, um  ponto, ou qualquer outra coisa, dependendo do programa usado para  visualizar esse PDF.

No  meu caso aqui, estou traduzindo do inglês, que não usa acentos, para o  português repleto de acentos e cedilhas. É líquido e certo que as fontes  embutidas neste PDF não têm nenhum desses caracteres.

Então  o próximo passo é verificar as fontes que tenho instaladas no meu  computador, bem como as que posso obter e instalar, para completar o  conjunto de caracteres a embutir no PDF. O Infix me fornece estas informações:

O Infix me informa que este arquivo utiliza 14 fontes. À primeira vista, parece que tudo é Arial, que todos têm.

Há empresas que utilizam fontes exclusivas, para manter a identidade corporativa. Dois exemplos que me ocorrem são General Electric e Rakuten. Nestes casos será preciso obter essas fontes.

Mas vamos ver todas as fontes:
Parece que há duas fontes problemáticas aqui.

Procuramos a primeira delas, e o Infix nos mostra:
Parece ter sido um deslize do criador original da publicação. Não deveria haver problema em substituí-la por Arial.

E quanto à outra:
... aplica-se exatamente o mesmo. Foi um deslize, podemos substituir por Arial.

Suponhamos que eu não tenha a Wingdings 3, então convém verificar:
Como não vou traduzir "flechinhas", e nenhuma delas terá acentos nem cedilhas, posso tranquilamente utilizar os caracteres dessa fonte que já estão embutidos no PDF original.

Cabe observar que mostrei aqui apenas um caso de cada fonte, porém é preciso verificar todos, ainda que seja possível consertar qualquer falha na revisão.


SEGUNDO PASSO - EXPORTAÇÃO DO TEXTO

Uso a função de Exportação do Infix, para exportar todo o texto para um arquivo XML, com tags. Neste processo, o Infix aplica tags ao texto no PDF, para preservar a correspondência.

Esse arquivo é gravado, e a segmentação nesse PDF é mostrada com sombras coloridas, desta forma:
Felizmente, neste arquivo está tudo bem organizado, não há parágrafos quebrados, pedaços soltos.

Se houver, o Infix tem ferramentas para se recompor os blocos de texto indevidamente fragmentados.


TERCEIRO PASSO - TRADUÇÃO

É hora de traduzir o texto, no arquivo XML.

Eu traduzo entre português (BR como destino) e inglês (EUA como destino). Há algumas áreas específicas nas quais não traduzo material técnico. Além disso falo e entendo - mas não traduzo profissionalmente italiano, francês e espanhol.

Isso torna viável a criação de parcerias com colegas tradutores que:
a) trabalham nessas áreas específicas (medicina, biologia, contabilidade, finanças, esportes) traduzindo material técnico;
b) traduzem para português europeu ou inglês britânico;
c) traduzem entre qualquer par envolvendo inglês, português, italiano, francês ou espanhol.

O colega faz a tradução no arquivo XML, e eu cuido do DTP no PDF.

E como é feita essa tradução?

Aqui há um exemplo do arquivo XML deste exemplo sendo traduzido no WordFast Classic:

Não sei o motivo, mas o WordFast Classic - na verdade, uma macro do Microsoft Word - é muito mais rápido ao lidar com arquivos XML do que com seus formatos oficiais, DOC e DOCX.

De qualquer modo, o parceiro poderá fazer isso com qualquer CAT tool capaz de lidar com arquivos XML, provavelmente incluindo Trados, MemoQ, WordFast Pro e muitos outros.

Basta me entregar o arquivo XML traduzido, e eu poderei seguir em frente.


QUARTO PASSO - IMPORTAÇÂO

Com o XML traduzido, é hora de importar a tradução, cada bloco no seu devido lugar. É nesse momento que as tags do XML irão fazer o seu trabalho.

Evidentemente, preciso fazer as associações de fontes, com as que tenho instaladas no meu computador:
Isto é imprescindível, para que se possa puxar e embutir os caracteres faltantes (com acentos e cedilhas) no PDF traduzido.

Há mais uma peculiaridade, pelo fato de nem sempre as fontes corresponderem. Por exemplo, a fonte Verdana Bold, incluída no Microsoft Office americano, é a mesma que se chama Verdana Negrito no Microsoft Office brasileiro. Então é preciso fazer essa correspondência no início do processo de importação.

Feito isso, é hora de importar.

Vou fazer 6 substituições de fontes. Se faltar algum caractere que há na tradução, porém não está embutido no PDF, e não existe na fonte substituta, o Infix avisa e pede instruções (sobre qual fonte usar) no meio do processo.

Além disso, configurei o Infix para:
a) ajustar o tamanho da fonte ao espaço ocupado originalmente; e
b) eliminar quaisquer ajustes de espaçamento diferenciado entre letras ou palavras.

São duas das coisas que irei ajustar após a importação.

E a importação transcorre normalmente:

Se tiver o Adobe Acrobat Reader, será possível visualizar o resultado bruto da importação clicando aqui.


QUINTO PASSO - AJUSTES DE DIAGRAMAÇÃO

Evidentemente, há uma série de ajustes a fazer. Vejamos apenas dois deles.
A. ORIGINAL
A. TRADUÇÃO BRUTA IMPORTADA
A. APÓS OS AJUSTES
.

B. ORIGINAL
B. TRADUÇÃO BRUTA IMPORTADA
B. APÓS OS AJUSTES

À primeira vista, pode parecer simples, mas raramente é. Observe que não coloquei em questão a separação de sílabas, que pode ser necessária.

Além disso, tabelas podem ser complexas, e também pode haver figuras com texto incorporado, que será preciso editar em outro programa.

De qualquer modo, viabiliza uma considerável economia de tempo e custo em comparação com fazer a tradução no arquivo original de DTP (InDesign, por exemplo) e depois iniciar um ciclo de revisões, supondo que a tradução e a editoração eletrônica sejam feitas por pessoas diferentes.

Se você ou sua empresa tem arquivos em PDF para traduzir entre inglês e português, entre em contato comigo, clicando no botão de e-mail no menu à esquerda.

E se você for um colega tradutor, trabalhando em algum par de idiomas dentre EN-PT-IT-FR-ES, tiver um arquivo PDF vivo/editável para traduzir, e for daqueles que abomina DTP/editoração eletrônica, esteja convidado a montar uma parceria comigo. Você cuida apenas da tradução, eu cuido apenas do DTP. Utilize o botão de e-mail no menu à esquerda para entrar em contato.

Não faço este trabalho em outros idiomas, que não entendo, porque acho que seria improdutivo.


Back to content