segunda-feira, 7 de março de 2011

Aula 2, parte 2


そして、町のほぼまん中には駅、ちょっとはなれたところにはかたまって、役所、警察署、消防署、学校があります。

Essa frase deu um pouco mais de trabalho. Note que, no livro original, os kanjis tinham furigana.

そして、町のほぼまん中には駅
parse to
そして、町・の・ほぼ・まん中・には・駅

そして é a conjunção e (em inglês and), indicando a continuação da idéia da frase anterior. Nesse contexto pode ser também "além disso", servindo de introdução.

町の = (algo) do vilarejo. ほぼ é quase, aproximadamente. まん中 deu trabalho para descobrir, é "no centro, no meio". Esse é um caso onde o kana atrapalhou, se estivesse direto em kanji (真中) seria mais fácil. には é uma partícula, o jeito fácil de entender é como junção de に e は, ou seja, o tópico é um lugar.

駅 é uma estação (de trem). Esse trecho fica então "Além disso, mais ou menos no centro do vilarejo tem uma estação de trem".

ちょっとはなれたところにはかたまって
parse to
ちょっと・はなれた・ところ・には・かたまって

ちょっと aqui é um pouquinho. はなれた é infinitivo passado de はなれる (ser separado de). Eu não consegui decifrar a etimologia desse verbo, pela lógica ele deveria ser o passivo de はなる, só que はなる não existe. Ao invés disso, o verbo separar é はなす. Alguma coisa aí rolou pra transformar o はなす em はなれる e eu não saquei o que foi.

ところ é lugar, e o には é a partícula de tópico/lugar. かたまって é o modo de enumeração do verbo かたまる. Esse verbo tem vários significados distintos, mas quem jogou Katamari Damacy deve lembrar que um deles é juntar / amontoar.

Interpretar aqui é meio complicado porque tem juntar e separar na mesma frase, mas eu acho que é algo assim: "Junto/perto (da estação), tem um lugar onde tem (uma lista de coisas) pertinho uma das outras" (literalmente "pouco separadas umas das outras")

O fim é a lista de coisas:

役所、警察署、消防署、学校があります。
parse to
役所、警察署、消防署、学校・が・あります。

役所 = prefeitura
警察署 = delegacia
消防署 = prédio dos bombeiros
学校 = escola

が é partícula de sujeito e あります é o verbo haver. Note que há dois verbos haver, います para seres vivos e あります para seres não-vivos.

Katamarizando tudo, ficou assim:
そして、町のほぼまん中には駅、ちょっとはなれたところにはかたまって、役所、警察署、消防署、学校があります。
"Além disso, no meio desse vilarejo tem uma estação de trem, e ali perto, bem juntinhos, ficam a prefeitura, a delegacia, o prédio de bombeiros, e uma escola."

Eu joguei fora o quase porque achei que "no meio do vilarejo" tem o mesmo significado aproximado de "quase no centro do vilarejo". 

Agora uma pausa para uma revelação: na verdade, eu não gosto de traduções literais. Meu objetivo é um BNF, então eu quero entender tudo bem o suficiente para escrever um parser, mas na hora de renderizar em português eu não me preocupo em ser literal.

Isso vem da época em que eu traduzia o Shalom. Quando eu traduzo um texto do japonês, meu objetivo é não é traduzir o que está escrito, é traduzir a imagem mental que você tem ao ler ao texto. Se o texto citar que um cara é engraçado como o Sanma, eu provavelmente vou dizer que o cara é engraçado como o Chico Anysio. A imagem mental do japonês ao ler aquilo é comparar o cara com um comediante, então a imagem mental do leitor tem que ser uma comparação com um comediante que ele conheça.

Ah, mas aí você está mudando a história! Não estou não. Tem dois casos aqui: se você não conhece o Sanma, então não vai entender a comparação mesmo, e mudar o comediante ajuda no seu entendimento. Se você conhece o Sanma, então provavelmente gosta bastante da cultura japonesa, e então pra que raios você vai ler traduzido? Aprenda japonês e leia o original, vai te dar mais prazer.

quarta-feira, 2 de março de 2011

Aula 2, parte 1

A nossa média está uma frase a cada 30 minutos mesmo.



この町は南へゆっくりさがる坂の町で、こげたパンのような色の小さな屋根がならんでいます。

Vou separar a frase em quatro blocos pra ficar mais fácil.

この町は
parse to
この・町・は

Em pt-br a gente chama as coisas da classe do この de pronomes demonstrativos, mas eu acho mais fácil parsear como adjetivo mesmo. As três variações dele mapeiam fácil em português:

この: este
その: esse
あの: aquele

Nesse ponto o jp e o pt são mais expressivos que o inglês, que tem só this e that.

町 é o vilarejo da frase anterior, e o は indica o tópico da sentença. Vale notar que o は é uma dos pouquíssimos casos onde o nihongo tem pronúncia irregular, você escreve は mas pronuncia わ. Originalmente ele era regular, você pronunciava は mesmo, mas o som mudou alguns séculos atrás.

南へゆっくりさがる坂の町で
parse to
南・へ・ゆっくり・さがる・坂・の・町・で

南 é a direção sul. へ é uma partícula de movimento / destino, note que é diferente do に que indica posição. A diferença é similar ao português, nós também falamos que estamos no Rio, mas que vamos ao Rio (no nosso caso, "em" é posição e "a" é movimento). Mas ainda tem uma pegadinha nesse へ que vai ficar clara depois.

ゆっくり é advérbio, significa devagar. O advérbio está modificando o verbo さがる, que nesse contexto é descer (em outros contextos poderia ser pendurar).

O verbo está no infinitivo porque serve de modificador pro substantivo seguinte, que é 坂, rampa / colina. Agora dá pra ver qual foi a pegadinha, o movimento de descida que está sendo citado não é um movimento físico de verdade, ao invés disso ele está falando da inclinação da colina, que é suave. "A colina que desce devagarinho ao sul" é conotação para "a colina inclinada levemente ao sul", ou seja, é como se você tivesse mudado de referencial.

(Aliás, acostume-se com mudanças de referencial, vai ficar bem mais bizarro quando aparecer algum 二時前 e eu falar que é "duas horas atrás", e não "daqui a duas horas").

Depois vem の町, o の transforma substantivo em adjetivo e o 町 é o vilarejo novamente. Mas agora 坂の町 é a colina do vilarejo ou o vilarejo da colina? O japonês é uma máquina de pilha, o modificador sempre modifica o que está na frente. Então é o vilarejo da colina, embora nesse caso esteja mais para o vilarejo com a colina ou o vilarejo que tem uma colina. (A colina inclinada para o sul é uma propriedade desse vilarejo).

で sempre me confunde, mas a melhor generalização que consegui é que で indica um pré-requisito necessário para que alguma coisa seja verdadeira. Daí, se você tem uma ação que só pode acontecer em um lugar X, então você pode usar o で no lugar no に pra indicar esse X onde ocorre a ação. Procurando por aí você vai ver que で é descrito como particula de lugar, modo ou causa, mas eu acho que todos esses encaixam na definição de pré-requisito.

Juntando tudo, esse bloco é "(algo) no vilarejo que possui uma colina levemente inclinada ao sul".

こげたパンのような色の
parse to
こげた・パン・の・よう・な・色・の

Japonês tem um monte de palavras roubadas de outra língua, e curiosamente, a primeira que aparece no livro foi roubada do português: パン, que é pão. Palavras roubadas são escritas quase sempre em katanaka.

O こげた que está na frente do pão é um verbo modificador. Mas peraí, verbos modificadores não precisam estar no infinitivo? Precisam, mas em japonês o infinitivo conjuga com o tempo verbal. No presente teríamos こげる, queimar, e no passado fica こげた, queimado. Então estamos falando de um pão queimado.

Eu coloquei の・よう・な separado mas talvez seja mais fácil entender como uma locução única, のような, que significa "parecido com". A lógica é que o の transforma o que vem antes em adjetivo, o よう é "aparência", e o な é a partícula que liga o adjetivo tipo na (então seria "(algo) tem aparência de (algo)", que é o mesmo que "parecido com").

色 é cor, の é a partícula, então juntando tudo fica "(algo) com cor de pão queimado" (será que é ocre?)

小さな屋根がならんでいます
parse to
小さな・屋根・が・ならんで・います

小さな já apareceu antes, é pequeno. 屋根 é o substantivo telhado, が indica o sujeito do verbo, e o verbo é ならんでいます. Tem duas partes nesse verbo, a raiz vem de ならぶ, alinhar / enfileirar. Mas ele está conjugado no gerúndio porque a sentença está em modo contínuo (I am doing, eu estou fazendo). Nesse caso, o correspondente do am / estou é います, e o gerúndio é ならんで.

Esse restinho de frase, então, é "(...) onde enfileiram-se telhadinhos".

Juntando a frase toda agora, temos:

この町は南へゆっくりさがる坂の町で、こげたパンのような色の小さな屋根がならんでいます。
Este vilarejo tem uma colina levemente inclinada para o sul, onde enfileiram-se telhadinhos com cor de pão queimado.

Para animar a galera, eu lembro a todos que esse é um livro infantil e as crianças de 10 anos parseiam isso em real time :)


segunda-feira, 28 de fevereiro de 2011

Aula 1

Começamos um grupo de estudos de nihongo hoje. Já fazia um tempo que eu não estudava japonês, então dessa vez resolvi que vou tentar perseguir um sonho antigo: criar um BNF do japonês gramatical.

Para chegar nesse objetivo eu vou ter que limitar as fontes. Antigamente eu traduzia muito mangá e videogame, mas essas mídias em geral tem muita gíria e linguagem coloquial. Para conseguir uma gramática mais ou menos robusta, o ideal é pegar um livro, então eu escolhi traduzir o 魔女の宅急便 (o livro que deu origem ao Kiki's Delivery Service do Miyazaki).

Como falta de prática pouca é bobagem, precisamos de uma hora para traduzir duas frases haha. A idéia é criar um parse tree completa, tentando extrair as regularidades que ficam escondidas.

Capítulo 1, título: お話のはじまり.

A primeira complicação é sempre achar onde estão as palavras, o japonês você escreve sem usar espaços entre as palavras. Se o japonês fosse como um código de Huffman não teria problema, porque os prefixos  determinam uma parse tree unicamente. Mas isso não ocorre aqui, então a melhor dica é procurar as partículas e separar nelas. Nesse caso fica assim:

お話・の・はじまり

Eu acho que o jeito mais fácil de parsear é notar que tem estruturas com valor de substantivo e estruturas com valor de verbo, e daí tem um monte de partículas e conjugações que levam de um a outro. O primeiro termo vem do verbo 話す (falar). Note que todos os verbos no infinitivo terminam em -U. Se você conjugar levando o -U em -I, o verbo fica com valor de substantivo. Por exemplo, em português nós temos correr->corrida, comer->comida, beber->bebida. 話す é falar, então はなし é o que é falado, por extensão, signfica "história, conto".

A parte curiosa é que em kanji はなし deveria ser 話し, mas por algum motivo o し no final caiu. Provavelmente isso acontece com palavras que são ao mesmo tempo muito antigas e muito frequentes.

O お na frente é um prefixo de mudança de hierarquia. Tanto お como ご são usados para deixar substantivos mais formais. É só lembrar que げんきですか? é algo do tipo "e aí, firmeza?" enquanto que おげんきですか?,  que é a mesma coisa mas com お na frente, já vira alguma coisa do tipo "Como vai o senhor?". Na hora de traduzir, entre história ou conto eu prefiro história que soa mais formal.

の é uma partícula que transforma substantivo em adjetivo. É só lembrar que 私 é "eu", enquanto que 私の é "meu". Daí, お話の é "(algo) da história".

はじまり é a versão em substantivo do verbo 始まる, começar. Daí, はじまり é começo / início, e o título é "Início da história"

Primeira frase: あるところに、深い森となだらかな草山にはさまれて、小さな町がありました。

Eu sempre penso no japonês como uma máquina de pilha, cada token é um modificador para o que vem em seguida. Se você quiser andar de lado na parse tree, precisa indicar isso explicitamente. Nessa frase tem duas estruturas grandes que estão no mesmo nível, indicadas pela posição da vírgula.

あるところに parse to ある・ところ・に

ところ é o mais fácil, substantivo que quer dizer lugar. Esse ある é um adjetivo irregular que significa "um certo, um específico". に é a partícula que indica posição, pode ser posição no espaço ou posição no tempo. Daí, esse bloco significa "em um certo lugar...".

O ある em kanji é 或, não é o mesmo ある do あります, que é 有る. Mas eu desconfio que no passado eles podem ter sido o mesmo, porque aí a frase seria "em um lugar que há / em um lugar que existe", que pra mim é bem parecido com "em um certo lugar".

深い森となだらかな草山にはさまれて
parse to
深い・森・と・なだらか・な・草山・に・はさまれて

深い é um adjetivo regular do tipo i, "profundo / denso". Modifica diretamente o substantivo seguinte, 森 que é floresta (esses kanjis do primeiro ano eu decoro usando nomes, porque sempre tem alguém famoso com um nome assim. Esse mori é o mori do fundador da Sony, Akio Morita). Daí, estamos falando de alguma coisa sobre uma floresta densa.

O とserve pra indicar que dois grupos de substantivos estão no mesmo nível da parse tree, ou seja, faz uma enumeração de substantivos como o and do inglês ("na minha mala tem um caderno e um estojo e um livro").

なだらか é um adjetivo do tipo na, logo ele obrigatoriamente vem seguido de um な e do substantivo que está sendo modificado, 草山.  なだらか  está no dicionário como gently-sloping (pouco inclinado?). O substantivo é formado de  草 que é grama e 山 que é montanha, então montanha verdejante de pouca inclinação, que eu simplifico para morro verdejante.

Uma dúvida pode ser como ele juntou 草 com 山 sem botar nenhuma partícula no meio (poderia ser 草の山, por exemplo). Nesse caso, o truque é que substantivos formados por um único kanji podem ser concatenados diretamente para virar substantivos compostos, do mesmo jeito que a gente faz couve-flor ou arco-íris.

O に é partícula de posição, nesse caso posição espacial. Falta só o verbo e aqui a coisa complica porque tem dois níveis de conjugação. O verbo no infinitivo é はさむ que é inserir. No passivo do infinitivo ele fica はさまれる, porque o passivo regular troca -u por -areru. Daí, o verbo que era inserir vira ser inserido.

Depois, ele conjuga de novo para poder enumerar. Você troca -ru por -te para colocar o verbo no mesmo nível do próximo ("eu lavei e passei e coloquei no armário"). O que era はさまれる vira はさまれて.

Esse bloco de texto então é "(algo) está inserido entre uma floresta profunda e um morro verdejante".

小さな町がありました
parse to
小さな・町・が・ありました

小さい é um adjetivo regular do tipo i, significa pequeno. Mas sei lá porque, esse adjetivo tem uma versão irregular tipo na. Deve ter alguma lógica pra escolher mas eu não sei qual é.

町 é town, alguma coisa que é menor que city mas maior que village. Sei lá como é isso em português. Vilarejo? Povoado? Cidadezinha?

O verbo é ある, ter / haver, que no presente formal seria あります, mas conjugado no passado fica ありました. Uma coisa que você não escapa de decorar é que, curiosamente, ele é intransitivo. Então ao invés de usar を pra indicar o objeto direto, você usa が pra indicar o sujeito.

Por fim, juntando tudo, a frase fica assim:

あるところに、深い森となだらかな草山にはさまれて、小さな町がありました。
Em um certo lugar, entre uma densa floresta e um morro verdejante, existia um pequeno vilarejo.