2012-03-12

komparo de tradukiloj

la enviciĝon de nia lingvo en la publika tradukilo de guglo pluraj komentis en interreto:
...

por traduko de filmdialogoj el la angla lingvo mi provis kvar retajn tradukilojn, kiuj konas esperanton.  miaj konstatoj eble interesos uzantojn aŭ kreantojn de tiaj sistemoj.

la sistemoj

komence rolas ne nur tradukkvalito, sed ankaŭ bazaj kondiĉoj de uzo, kiujn mi prezentas ĉi-sube kune kun la sistemoj mem, kvankam kreantoj eble rigardas tiujn aspektojn bagatelaj.

apertium
  • tradukis la 900-on da frazoj fulmrapide;
  • inteligente tradukis la markojn <i> per kursivigo — kio perdigis ilin, kiam mi kopiis la rezulton al redaktilo.
gramtrans
  • haltis ĉe la kvina frazo kun averto, ke „senkosta uzo estas limigita al %bytes literoj på tradukado“ (laŭvorte), kio abrupte finis la provadon.
guglo-traduko (anglalingve: google translate)
  • haltis ĉe la 460a frazo, do prilaboris ĉion per du sinsekvaj algluoj;
  • mistraktis iom la kursivigojn, spacigante "</i>" al "< /i>";
  • ŝanĝis propravole dustreketajn sagojn (-->) de tempindikoj al unustreketaj (->), kion mi devis postkorekti, por ke la subteksta dosiero restu uzebla.
traduku.net
  • malrapidis kompare kun aliaj;
  • kungluis la tutan rezulton en unu solan linion, kion mi pene postkorektis per diversaj funkcioj de redaktilo;
  • tradukis la kursivigojn "<i>" al "<mi>" kaj "</i>" al "mi>" (angla pronomo „i“ = mi, supozeble).
tradukkvalito

ĉar mi ne pretis alglui 900 frazojn laŭ kvinelementaj porcioj, mi ignoros la ne tre kunlaboreman gramtrans en la ĉi-suba kvalitokomparo.

la ekzemploj prezentiĝas laŭ jena skemo:
fraznumero
en: anglalingva vortumo
a: apertium-a traduko
g: guglo-traduka traduko
t: traduku.net-a traduko
ĝenerala kvalito

la kvalito tre malsamas laŭ frazoj.  iuj frazoj ricevas sufiĉe bonajn tradukojn en ĉiuj sistemoj, tamen kun tiu minuso ĉe traduku.net, ke ĝi prezentas nepoluritan staton, en kiu plej okulfrape multaj verboj rezignas pri finaĵoj.
578
en: if you can become pure denial, pure hate, pure insane fury...
a: se vi povas fariĝi pura neo, pura malamo, pura freneza furiozo...
g: se vi povas fariĝi pura negado, pura malamo, pura freneza furiozo...
t: se vi povas fariĝ puran neon,puran malam, pura freneza furiozo...
frazkonstruo

iuj frazkonstruoj fiaskigas ĉiujn sistemojn.  ekzemple, supoze ke la angla formo ĝustas, neniu sistemo scias diri la horon en e-o.  probable ankaŭ aliaj tielnomataj „lokaj gramatikoj“ de adresoj, de mezuraĵoj, de homnomoj kaj similaj mankas.
12
en: northern hemisphere, 73rd quadrant, 16 hours 50, universal time.
a: norda hemisfero, 73a kvadranto, 16 horoj 50, universala tempo.
g: norda hemisfero, 73rd cuadrante, 16 horoj 50, universala tempo.
t: norda hemisfero, 73rd kvadranto, 16 horoj 50, universala tempo.
ankaŭ la malsimpla esprimo, ke iu deziras, ke iu alia agu iamaniere, restas laŭvorta ĉe apertium kaj guglo-traduko.  en ĉi okazo traduku.net tre proksimas al la ĝusta solvo, bedaŭrinde ne finordigas ĝin.
36
en: your mother doesn't want us to come home right now.
a: via patrino ne deziras nin veni hejme ĝuste nun.
g: via patrino ne deziras nin veni hejmen nun.
t: via patrino ne volas, ke ni ..u reven hejmen aktuale.
eĉ la rego de akuzativo estas iafoje laŭŝanca, ne tro surprize konsiderante la statistikan funkciadon de guglo-traduko, sed pli ŝoke en apertium, kiun postmeto de „alia“ eble ŝancelis.

88
en: and i have two voices because i have practically nothing else.
a: kaj mi havas du voĉojn ĉar mi havas preskaŭ nenion alia.
g: kaj mi havas du voĉojn ĉar mi havas preskaŭ nenio alia.
t: kaj mi hav du voĉoj ĉar mi hav preskaŭ nenio alia.

senverba frazo ne nepre estas atendita.  guglo-tradukon ne ĝenas la foresto de subjekto, ĝi blinde fidas al verba „marvel“ kaj misvojiĝas, dum apertium senerare tradukas.
158
en: a little marvel, that microphone.
a: malgranda mirindaĵo, tiu mikrofono.
g: iom miras, ke mikrofono.
t: malgranda mir, tio mikrofono.

vortkonstruo


manko en ĉiuj sistemoj estas, ke ili ne transpontas la limon inter vort- kaj frazkonstruo, kiam ĝi malsamas en la fontolingvo kaj en la cellingvo.  ekzemple „go crazy“, laŭvorte „iri freneza“, laŭsence „iĝi freneza“ estas en normala esperantigo „freneziĝi“, sed tiun formon atingas neniu sistemo.  tion mi komentos pli detale ĉi-sube en rimarkoj pri stilo.
794
en: the detector dials are going crazy!
a: la detektilaj diskoj estas irantaj frenezan!
g: la detektilo dials iras freneza!
t: la detektilo diskoj estas ir freneza!
dialogo

mia provo estas iom biasa, mi konfesu, ĉar mi postulas tradukon de propraspeca teksto.  dialogoj probable ne estas la frazoj, per kiuj oni elprovas traduksistemojn.  originalaj filmdialogoj parte konsistas el koncizaj ordonoj, kelkvortaj respondoj, partaj ripetoj, do „nekompletaj“ frazoj, kaj eĉ pli filmaj subtekstoj, en kiuj ofte komenca subfrazo aperas dum la sekundoj 24 ĝis 26, kaj la sekva subfrazo daŭrigas dum la sekundoj 27 ĝis 29, do la plena frazo estas arbitre disduigita.  la tasko estas tiurilate defia.

la komencaj vortoj de telefona parolado perpleksigas ĉiujn sistemojn, kiuj ne imagas, ke ĝustas „mi vokas jaffar-on, parolas klaŭdo“.  traduku.net pli proksimas al akceptebla vortumo.
5
en: calling jaffar. claude here.
a: kriado *jaffar. klaŭdo ĉi tie.
g: nomante jaffar. claude tie.
t: vok jaffar. claude tie ĉi.
ordonojn rekonas guglo-traduko, sed ne apertium.
24
en: take this, piel.
a: prenas tion ĉi, *piel.
g: prenu ĉi tion, piel.
t: pren ĉi tiu, piel.
sekve de antaŭa diro parolanto aldonas „ankaŭ vin mi ne ŝatas“.  la fina „either“ de la angla ŝajnas neatendita por ĉiuj.
75
en: i don't like you either.
a: mi ne ŝatas vin aŭ.
g: mi ne ŝatas vin ĉu.
t: mi ne ŝat vi aŭ.
apertium ne amikas kun ŝtopvortoj, simpla „well“ por ĝi estas puto.
39
en: well, very nice.
a: puto, tre bela.
g: nu, tre agrabla.
t: bone, tre agrabla.
forto de statistika metodo

guglo-traduko uzas statistikan metodon, kiu lernas el paralelaj tekstoj.  laŭfame tiaj sistemoj kompare kun gramatikanalizaj sistemoj rapide progresas en la komenco, sed iam atingas maksimuman kvaliton, kiun ili ne transpasos.  ke ili lernas rapide kaj lernas bonajn esprimojn, montras la subaj ekzemploj.

guglo-traduko sufiĉe bone redonas „go on board“ (sed ne akuzativigas), dum apertium konfuziĝas pro miskompreno de „go on“ kiel „daŭrigi“ — verdire, apertium eble tro provis lerti...

277
en: we have to go on board ship in less than an hour.
a: ni devi daŭrigi tabulan ŝipon en malpli ol horo.
g: ni devas iri sur la ŝipo en malpli ol unu horo.
t: ni devas surir ŝipo en malpli ol horo.

ankaŭ en komunuza esprimo, kiun ĉiuj sistemoj ĝuste tradukas, guglo-traduko proponas la plej fluan, filmotaŭgan formon.
688
en: - is everything all right? - yes.
a: - estas ĉio bone? - jes.
g: - ĉu ĉio en ordo? - jes
t: - ĉu ĉio estas en ordo? - jes.
malforto de statistika metodo

tamen la statistika metodo dependas de la kvalitoj de paralelaj tekstoj provizitaj por lernado.  ŝajnas, ke kelkaj x-literumaj esperantaj tekstoj rolas en la afero...
222
en: is there a strawberry near where you are?
a: estas tie frago proksime al kie vi estas?
g: cxu ekzistas frago proksime kie vi estas?
t: estas frago apud kie vi estas?
sintaksaj eraroj de homaj redaktantoj, interalie la ofta misakuzativigo de la subjekto de „ekzisti“, eble kontaĝis la statistikan maŝinon.
579
en: then there's a chance... a slim chance...
a: tiam tie estas ŝanco... svelta ŝanco...
g: tiam ekzistas ŝancon... maldika ŝancon...
t: cetere, estas ŝanco... malgranda ŝanco...

kaj estas malklare, ĉu enŝteliĝis alilingvaj teksteroj en la lerno-tekstaro aŭ ĉu la sistemo okaze ŝaltiĝas al pontolingvo, kies vortoj postflosas en la frazoj.  „bucaneros“ pli similas al hispana vorto, ol al esperanta.
767
en: those buccaneers, with their secret weapon...
a: tiuj marrabistoj, kun ilia sekreta armilo...
g: tiuj bucaneros, per sia sekreta armilo...
t: tiuj marrabistoj, kun ilia sekreta armilo...

stilo

ne estas abrupta limo inter informaj kaj beletraj tekstoj, kaj tial tradukiloj nek absolute kapablas nek absolute malkapablas por bona stilo.  estas klare tamen, ke ili tro paŭsas la esprimmanierojn de la fontolingvo.  tio kaŭzas parte gramatikajn, parte stilajn misojn.

ĉi-sube „atakis nin senaverte“ estus bona esprimo, al traduku.net mankas nur elbako de la frazo.  apertium kaj guglo-traduko konfuziĝas pro la „by“ de „by surprise“.  kiel mi menciis supre pri vortkonstrua problemo, mankas ĉi tie kapablo por pli ampleksa fraztransformo: „suprizatakis nin“ estus bona solvo.
13
en: jaffar, they attacked us by surprise. it was horrible.
a: jaffar, ili atakis nin de surprizo. ĝi estis horora.
g: jaffar, ili atakis nin per surprizo. estis terure.
t: jaffar, ili atak ni senaverte. estis horora.
mi mem hezitis pri ĝusta traduko de la sekva frazo.  hazarde aŭ nehazarde traduku.net pli bone gvidis min al mia solvo: „la celo de la vojaĝo al vi neniom gravas“ (fakte „gravis“ laŭ la franca originalo de la filmo).  la senco de „destination“ komprenble dependas de la kunteksto, sed apertium kaj guglo-traduko ĉiuokaze ne bone elturniĝis pri „make a difference to someone“ kiun laŭvorta „fari diferencon al iu“ nebule redonas.
112
en: your destination makes no difference to you.
a: via celloko faras neniun diferencon al vi.
g: via destino faras ne diferenco al vi.
t: via celloko ŝanĝ nenion al vi.
konsciigis min pri la influo de la fontolingvo (fakte pontolingvo, ĉar mi petis tradukon de angla tradukaĵo) ankaŭ la fina kontrolo per aŭskultado de la originala franca filmo.  „vi stulta!“ aŭ „vi idiota!“ tradukas la sistemoj laŭvorte laŭ la angla „you idiot!“.  sed en la franca aŭdiĝas „kompatinda idioto!“.  kio estas normala en e-o?  mi fine elektis „- kia idioto!“, sed el tiu hezito konservas timon, ke la parolmaniero en tiuj dialogoj iom influiĝis de la angla.
41
en: - you idiot.
a: - vi stulta.
g: - vi idioto.
t: - vi idioto.
elekto

kompreneble la supraj ekzemploj ne montras ĉiujn problemojn kaj surprizojn de aŭtomata traduko.  eĉ la klasigo de la problemoj estas per si mem ne evidenta.

por interesataj homoj mi provizas srt-dosieron, kiu apudmetas por ĉiu frazo la anglan frazon, la tradukojn de la tri sistemoj, kaj mian tradukon.  memoru tamen, ke mia traduko dependas ankaŭ de finkontrolo per la franca voĉa dialogo, do ne konformas al la angla, kiam ĝi mem disiĝis de la franca (ekzemple la du kantoj de la filmo ricevas en la angla lingvo adaptojn senrilatajn al la originalo).  la menciita kompar-dosiero estas atingebla tra mia hejmpaĝo en la ĉapitro „tradukoj“, aŭ rekte ĉe les-maitres-du-temps-la-sinjoroj-de-la-tempo-komparo-2012.srt.  ĝi restas uzebla kun la filmo, sed praktike la kvinoblaj frazoj tro rapide pasus por legado kaj komparado.

kiel mi elektis?  mi fine laboris surbaze de la gugla traduko.  mi ne elnombris precize, sed ŝajnas al mi, ke la ĝustaj aŭ preskaŭ ĝustaj frazoj iom pli multas en ĝi.  se tio veras, tiun staton de la afero probable kaŭzas la aparta naturo de la tradukata teksto: subtekstoj.  fronte al tiaj dishakitaj dialogoj, la statistika sistemo montriĝas pli eltenema, ol sistemoj baze aranĝitaj por plenaj frazoj.  mian elekton oni do ne komprenu kiel definitivan oran medalon al guglo-traduko.

notoj:
  1. (pardonu, mi ne detenis min.)

2 commentaires:

Luis Guillermo RESTREPO RIVAS a dit…

Trankviliĝu ! kara, Ja, mi revas.

ĵeromo a dit…

mi ĝojas pri tio. nur se oni prirevis ion, oni povas ĝin atingi.