{"id":193,"date":"2009-06-15T20:55:22","date_gmt":"2009-06-15T18:55:22","guid":{"rendered":"http:\/\/hell.pl\/wasaty\/blog\/?p=193"},"modified":"2009-06-15T20:55:22","modified_gmt":"2009-06-15T18:55:22","slug":"google-pograzy-tlumaczy","status":"publish","type":"post","link":"https:\/\/wasaty.pl\/blog\/2009\/06\/15\/google-pograzy-tlumaczy\/","title":{"rendered":"Google pogr\u0105\u017cy t\u0142umaczy?"},"content":{"rendered":"<div style=\"float: right; margin-left: 10px;\"><a href=\"https:\/\/twitter.com\/share\" class=\"twitter-share-button\" data-via=\"Wasaty\" data-count=\"vertical\" data-url=\"https:\/\/wasaty.pl\/blog\/2009\/06\/15\/google-pograzy-tlumaczy\/\">Tweet<\/a><\/div>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"alignleft size-full wp-image-199\" title=\"google1\" src=\"http:\/\/hell.pl\/wasaty\/blog\/wp-content\/uploads\/2009\/06\/google1.png\" alt=\"google1\" width=\"80\" height=\"80\" \/>Firma Google od dawna udost\u0119pnia u\u017cytkownikom maszynowe t\u0142umaczenie na liczne j\u0119zyki, mi\u0119dzy innymi na polski. Cho\u0107 Google dysponuje olbrzymi\u0105 baz\u0105 t\u0142umacze\u0144, oferowana przez firm\u0119 us\u0142uga nie odbiega znacz\u0105co jako\u015bci\u0105 od konkurencji. Tekst po maszynowym t\u0142umaczeniu przewa\u017cnie jest zrozumia\u0142y i to jedyne, co mo\u017cna o nim powiedzie\u0107 dobrego. Czasami, przy prostszym tek\u015bcie \u017ar\u00f3d\u0142owym, mo\u017ce by\u0107 nawet ca\u0142kiem zno\u015bny. Jednak w zesz\u0142ym tygodniu firma Google udost\u0119pni\u0142a now\u0105 us\u0142ug\u0119 &#8211; Google Translator Toolkit.<\/p>\n<p><!--more-->Wiadomo\u015b\u0107 o us\u0142udze wywo\u0142a\u0142a spore poruszenie w \u015bwiatku t\u0142umaczy. Jedni uwa\u017caj\u0105, \u017ce stanowi ona zagro\u017cenie dla profesjonalnych t\u0142umaczy, inni widz\u0105 w niej raczej koniec producent\u00f3w oprogramowania CAT, takich jak SDL czy Atril. Czym w og\u00f3le jest Google Translator Toolkit i na ile umotywowane s\u0105 te stwierdzenia?<\/p>\n<p>Oto prezentacja idei serwisu:<\/p>\n<p>\u00a0<object width=\"560\" height=\"340\" data=\"http:\/\/www.youtube.com\/v\/C7W2NJFdoIg&amp;hl=pl&amp;fs=1&amp;\" type=\"application\/x-shockwave-flash\"><param name=\"allowFullScreen\" value=\"true\" \/><param name=\"allowscriptaccess\" value=\"always\" \/><param name=\"src\" value=\"http:\/\/www.youtube.com\/v\/C7W2NJFdoIg&amp;hl=pl&amp;fs=1&amp;\" \/><param name=\"allowfullscreen\" value=\"true\" \/><\/object><\/p>\n<p>Jak wida\u0107, <a href=\"http:\/\/translate.google.com\/toolkit\">Google translator toolkit<\/a> (w skr\u00f3cie: GTK) to w zasadzie us\u0142uga maszynowego t\u0142umaczenia z dwoma usprawnieniami. Po pierwsze, mo\u017cliwa jest edycja i poprawienie wyniku t\u0142maczenia maszynowego. Po drugie, istnieje mo\u017cliwo\u015b\u0107 importowania w\u0142asnych pami\u0119ci t\u0142umaczeniowych i glosariuszy. Przynajmniej teoretycznie.<\/p>\n<p>Jak wida\u0107 na filmie, edycja t\u0142umaczenia odbywa si\u0119 w do\u015b\u0107 przyjazny i wygodny spos\u00f3b, z widokiem t\u0142umaczenia i \u017ar\u00f3d\u0142a w s\u0105siednich panelach i wyr\u00f3\u017cnieniem oryginalnego segmentu. W segmencie edytowanym zamieszczane s\u0105 znaczniki tag\u00f3w formatuj\u0105cych. Proste, intuicyjne i do\u015b\u0107 wygodne. T\u0142umaczenia z Wikipedii mog\u0105 by\u0107 automatycznie umieszczane na w\u0142a\u015bciwych wersjach j\u0119zykowych serwisu.<\/p>\n<p>Druga istotna cecha serwisu (czy te\u017c us\u0142ugi) to mo\u017cliwo\u015b\u0107 u\u017cycia do t\u0142umaczenia w\u0142asnych pami\u0119ci t\u0142umaczeniowych i glosariuszy. Mo\u017cliwe jest zaimportowanie plik\u00f3w TMX o \u0142\u0105cznej wielko\u015bci do 50 MB. Co wi\u0119cej, pami\u0119ci te mo\u017cna udost\u0119pni\u0107 wszystkim, nikomu lub wybranym osobom, wybieraj\u0105c poziom dost\u0119pu. Podobnie jest zreszt\u0105 z t\u0142umaczonymi plikami. I wszystko pi\u0119knie, tylko&#8230; nie do ko\u0144ca.<\/p>\n<p>Czemu? Po pierwsze, za\u0142adowanie do serwisu w\u0142asnych tre\u015bci jest r\u00f3wnoznaczne z udzieleniem firmie prawa do wykorzystania ich do \u201epromocji, usprawnienia lub oferowania us\u0142ug\u201d. Ilu zawodowych t\u0142umaczy b\u0119dzie sk\u0142onnych odda\u0107 owoce swojej pracy za darmo? Pomijaj\u0105c ju\u017c kwestie praw klient\u00f3w do t\u0142umaczonych tre\u015bci. Drugi, znacznie powa\u017cniejszy problem polega na tym, \u017ce GTK nie bardzo potrafi korzysta\u0107 z dostarczonych TM. Za\u0142adowa\u0142em do GTK kawa\u0142ek tekstu, nad kt\u00f3rym w\u0142a\u015bnie pracuj\u0119 wraz z robocz\u0105 TM zawieraj\u0105c\u0105 6,5 tys. segment\u00f3w. Tekst by\u0142 cz\u0119\u015bciowo bez pokrycia w TM (no match), ale spor\u0105 cz\u0119\u015b\u0107 stanowi\u0142y segmenty w zakresie podobie\u0144stw od 84% do 100%. I zupe\u0142nie tego nie wida\u0107 w gotowym t\u0142umaczeniu. Tekst jest mocno techniczny i t\u0142umaczenie maszynowe segment\u00f3w bez pokrycia jest absolutnie do niczego (Zaprojektowany z rutynowych bada\u0144 i wnioski na uwadze,\u00a0XXX Simultaneous Thermal Analyzer porady zbocze czujnik technologii wy\u017csze dok\u0142adno\u015bci i jako\u015bci wynik\u00f3w).\u00a0Jak zazwyczaj w przypadku t\u0142umacze\u0144 maszynowych tego typu tekst\u00f3w, nawet nie ma czego poprawia\u0107, trzeba pisa\u0107 od zera. Gorzej, \u017ce w zupe\u0142nie losowy spos\u00f3b zosta\u0142y wykorzystane podstawienia z dostarczonej TM. Niekt\u00f3re owszem, zosta\u0142y podstawione. Inne nie. I to trafienia 100%. Bez \u017cadnej logiki.\u00a0Co wi\u0119cej, brak jakichkolwiek informacji na temat ewentualnych podstawie\u0144, tj. czy dany segment zosta\u0142 podstawiony z TM, czy przet\u0142umaczony maszynowo. Brak informacji o ew. wprowadzonych zmianach. Moim zdaniem te cechy ca\u0142kowicie dyskwalifikuj\u0105 GTK jako powa\u017cne narz\u0119dzie do t\u0142umacze\u0144 (pomijaj\u0105c ju\u017c fakt, \u017ce obj\u0119to\u015b\u0107 plik\u00f3w do t\u0142umaczenia nie mo\u017ce przekroczy\u0107 1 MB).<\/p>\n<p>Chwilowo ani t\u0142umacze, ani firmy produkuj\u0105ce narz\u0119dzia CAT nie maj\u0105 si\u0119 czego obawia\u0107. GTK stanowi przydatne narz\u0119dzie do hobbystycznego t\u0142umaczenia artyku\u0142\u00f3w w Wiki, ale nie zagra\u017ca profesjonalnym t\u0142umaczom. Cho\u0107 stanowi krok w interesuj\u0105cym kierunku, zw\u0142aszcza bior\u0105c pod uwag\u0119 inicjatywy w rodzaju <a href=\"http:\/\/www.globalwatchtower.com\/2009\/06\/05\/taus-tda-v1\/\">TAUS<\/a>. Zdecydowanie zamierzam obserwowa\u0107 rozw\u00f3j us\u0142ugi.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Firma Google od dawna udost\u0119pnia u\u017cytkownikom maszynowe t\u0142umaczenie na liczne j\u0119zyki, mi\u0119dzy innymi na polski. Cho\u0107 Google dysponuje olbrzymi\u0105 baz\u0105 t\u0142umacze\u0144, oferowana przez firm\u0119 us\u0142uga nie odbiega znacz\u0105co jako\u015bci\u0105 od konkurencji. Tekst po maszynowym t\u0142umaczeniu przewa\u017cnie jest zrozumia\u0142y i to jedyne, co mo\u017cna o nim powiedzie\u0107 dobrego. Czasami, przy prostszym tek\u015bcie \u017ar\u00f3d\u0142owym, mo\u017ce by\u0107 nawet ca\u0142kiem zno\u015bny. Jednak w zesz\u0142ym tygodniu firma Google udost\u0119pni\u0142a now\u0105 us\u0142ug\u0119 &#8211; Google Translator Toolkit.<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[3,4],"tags":[13,47,48,49],"_links":{"self":[{"href":"https:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/posts\/193"}],"collection":[{"href":"https:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/comments?post=193"}],"version-history":[{"count":0,"href":"https:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/posts\/193\/revisions"}],"wp:attachment":[{"href":"https:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/media?parent=193"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/categories?post=193"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/tags?post=193"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}