Jun 15

Google pogrąży tłumaczy?

google1Firma Google od dawna udostępnia użytkownikom maszynowe tłumaczenie na liczne języki, między innymi na polski. Choć Google dysponuje olbrzymią bazą tłumaczeń, oferowana przez firmę usługa nie odbiega znacząco jakością od konkurencji. Tekst po maszynowym tłumaczeniu przeważnie jest zrozumiały i to jedyne, co można o nim powiedzieć dobrego. Czasami, przy prostszym tekście źródłowym, może być nawet całkiem znośny. Jednak w zeszłym tygodniu firma Google udostępniła nową usługę – Google Translator Toolkit.

Wiadomość o usłudze wywołała spore poruszenie w światku tłumaczy. Jedni uważają, że stanowi ona zagrożenie dla profesjonalnych tłumaczy, inni widzą w niej raczej koniec producentów oprogramowania CAT, takich jak SDL czy Atril. Czym w ogóle jest Google Translator Toolkit i na ile umotywowane są te stwierdzenia?

Oto prezentacja idei serwisu:

 

Jak widać, Google translator toolkit (w skrócie: GTK) to w zasadzie usługa maszynowego tłumaczenia z dwoma usprawnieniami. Po pierwsze, możliwa jest edycja i poprawienie wyniku tłmaczenia maszynowego. Po drugie, istnieje możliwość importowania własnych pamięci tłumaczeniowych i glosariuszy. Przynajmniej teoretycznie.

Jak widać na filmie, edycja tłumaczenia odbywa się w dość przyjazny i wygodny sposób, z widokiem tłumaczenia i źródła w sąsiednich panelach i wyróżnieniem oryginalnego segmentu. W segmencie edytowanym zamieszczane są znaczniki tagów formatujących. Proste, intuicyjne i dość wygodne. Tłumaczenia z Wikipedii mogą być automatycznie umieszczane na właściwych wersjach językowych serwisu.

Druga istotna cecha serwisu (czy też usługi) to możliwość użycia do tłumaczenia własnych pamięci tłumaczeniowych i glosariuszy. Możliwe jest zaimportowanie plików TMX o łącznej wielkości do 50 MB. Co więcej, pamięci te można udostępnić wszystkim, nikomu lub wybranym osobom, wybierając poziom dostępu. Podobnie jest zresztą z tłumaczonymi plikami. I wszystko pięknie, tylko… nie do końca.

Czemu? Po pierwsze, załadowanie do serwisu własnych treści jest równoznaczne z udzieleniem firmie prawa do wykorzystania ich do „promocji, usprawnienia lub oferowania usług”. Ilu zawodowych tłumaczy będzie skłonnych oddać owoce swojej pracy za darmo? Pomijając już kwestie praw klientów do tłumaczonych treści. Drugi, znacznie poważniejszy problem polega na tym, że GTK nie bardzo potrafi korzystać z dostarczonych TM. Załadowałem do GTK kawałek tekstu, nad którym właśnie pracuję wraz z roboczą TM zawierającą 6,5 tys. segmentów. Tekst był częściowo bez pokrycia w TM (no match), ale sporą część stanowiły segmenty w zakresie podobieństw od 84% do 100%. I zupełnie tego nie widać w gotowym tłumaczeniu. Tekst jest mocno techniczny i tłumaczenie maszynowe segmentów bez pokrycia jest absolutnie do niczego (Zaprojektowany z rutynowych badań i wnioski na uwadze, XXX Simultaneous Thermal Analyzer porady zbocze czujnik technologii wyższe dokładności i jakości wyników). Jak zazwyczaj w przypadku tłumaczeń maszynowych tego typu tekstów, nawet nie ma czego poprawiać, trzeba pisać od zera. Gorzej, że w zupełnie losowy sposób zostały wykorzystane podstawienia z dostarczonej TM. Niektóre owszem, zostały podstawione. Inne nie. I to trafienia 100%. Bez żadnej logiki. Co więcej, brak jakichkolwiek informacji na temat ewentualnych podstawień, tj. czy dany segment został podstawiony z TM, czy przetłumaczony maszynowo. Brak informacji o ew. wprowadzonych zmianach. Moim zdaniem te cechy całkowicie dyskwalifikują GTK jako poważne narzędzie do tłumaczeń (pomijając już fakt, że objętość plików do tłumaczenia nie może przekroczyć 1 MB).

Chwilowo ani tłumacze, ani firmy produkujące narzędzia CAT nie mają się czego obawiać. GTK stanowi przydatne narzędzie do hobbystycznego tłumaczenia artykułów w Wiki, ale nie zagraża profesjonalnym tłumaczom. Choć stanowi krok w interesującym kierunku, zwłaszcza biorąc pod uwagę inicjatywy w rodzaju TAUS. Zdecydowanie zamierzam obserwować rozwój usługi.

Leave a Reply

Your email address will not be published.