segunda-feira, 20 de abril de 2009

Lost in Translation

Doubt thou the stars are fire,
Doubt that the Sun doth move,

Doubt Truth to be a liar,

But never doubt, I love.


Duvida que o sol seja a claridade,
Duvida que as estrelas sejam chama,
Suspeita da mentira na verdade,
Mas não duvida deste que te ama!
(tradução: Millôr Fernandes)

Hamlet envia a Ofélia este poema, expressando seu amor e reconhecendo "não possuir a Arte para valorizar meus resmungos" (tradução minha). Eu não gostava muito da tradução do Millôr por dois motivos: 1) ele mudou a métrica do poema de 6 para 10 sílabas; 2) por ter modificado parte do sentido original [1].

Eu o perdoei do primeiro motivo depois de tentar traduzir algumas vezes, e perceber que as palavras em português são, na média, maiores que em inglês. Isto é um pouco óbvio, mas um blogueiro de ciência deve fazer o que deve ser feito: encontrar evidências. Aqui há uma lista de tamanho médio das palavras, tendo como medida o número de caracteres por palavras na Declaração Universal dos Direitos Humanos (inglês: 5,10 c/p; português: 5,29 c/p). Contudo, isto depende também do conteúdo: poesia e diálogos usam mais palavras curtas, que em inglês podem ser de duas a três vezes menores que em línguas europeias! [2]

Ainda não contente, baixei o original de Hamlet em inglês e sua tradução no site Domínio Público, que é mantido pelo Governo Federal e reúne várias mídias em domínio público. Os resultados parecem consistentes: em inglês a razão é de 5,24 c/p , e em português de 5,80 c/p. Contudo, nem de longe os dois possuem a mesma formatação. Não estando contente com nenhum destes resultados, fui eu mesmo produzi-los, rigorosamente, usando minhas duas edições de Hamlet.

Para cada uma das seguintes cenas, escolhi aleatoriamente 3,13% das linhas [3], e em cada uma delas contei o número de palavras e caracteres. Ignorei pontuações, mas não espaços. Ignorei também as indicações de quem é a fala ("Actor: Ay, my Lord."). 82 linhas, 609 palavras e 3.257 caracteres depois, os resultados são estes:



InglêsPortuguês
Ato I
Cena IV
"Há algo de podre no Estado da Dinamarca."

4,06 c/p5,22 c/p
Ato II
Cena II
"Poderia viver recluso numa casca de noz, e me considerar rei do espaço infinito!"

5,13 c/p

5,73 c/p

Ato III
Cena I
"Ser ou não ser, eis a questão."

5,86 c/p5,37 c/p
Ato V
Cena I
"Eu amava Ofélia. Quarenta mil irmãos não poderiam, somando seu amor, equipará-lo ao meu"

5,01 c/p5,35 c/p
Total5,16 c/p5,53 c/p


LEGAL!! Então agora está mais que provado que o inglês tem palavras notadamente menores que o português, não?! Nossa, eu fui muito rigoroso e científico!! Meus valores estão próximos daqueles obtidos com as outras duas fontes!! Será que consigo publicar um artigo sobre isso?

Bom, é evidente que essa empreitada não foi um sucesso. A variação entre cenas na mesma língua é absurda, e a comparação entre as traduções também não é consistente. Acabei fornecendo um bom exemplo de como é boa parte do trabalho em ciência: coleta de dados abusiva, maçante, exaustiva e outros sinônimos, o resumo de tudo em uma única tabela ou gráfico... apenas para descobrir numa análise posterior que as informações não são razoáveis, e que mais dados são necessários.


Prometo que não descansarei (muito) enquanto não responder estas perguntas. Quanto o inglês é menor que o português? Para que estilos de texto? Isto é válido também para a língua falada? E o mais interessante: existirá uma razão para esta diferença de tamanho entre as línguas? Cenas de um próximo capítulo, que espero ter a ajuda de mãos mais profissionais. Até lá!
_____ ___ __ _ _
[1]: como vocês perceberam (ou perceberão, dependendo se você é do estilo que lê o rodapé antes de continuar), nem discuti o segundo motivo neste post, de tão animado que fiquei pelo primeiro motivo. Mais uma promessa de post!!

[2]: Fonte, tabela 2. Note que as ideias neste post já respeitam a Reforma Ortográfica.

[3]: escolhi uma fração que me permitiria pegar no máximo 20 linhas na maior cena selecionada (Ato II, Cena II, com 639 linhas), e não tão poucas na menor (Ato I, Cena IV, com 111 linhas). Acaba que mesmo isso é uma quantidade absurdamente chata de texto para processar neste computador movido a leite com granola que vos fala; o jeito foi dar parte do trabalho para o outro computador, colocar Hamlet para tocar e aproveitar para reler os dois livros aos pouquinhos =]

Nenhum comentário: