Apr 24

Korpus legislacji unijnej w TMX

euJednym z miłych aspektów powstania Unii Europejskiej jest wymóg ujednolicenia przepisów obowiązujących w poszczególnych krajach Unii oraz obowiązek tłumaczenia dyrektyw unijnych na języki wszystkich państw członkowskich. Jest to korzystne zarówno dla obywateli, bo mogą zapoznać się z aktami prawnymi Unii, jak i dla nas, tłumaczy, bo możemy na tym skorzystać. Niektórzy wprost, tłumacząc, inni korzystając z efektów pracy tych pierwszych. Jak?

Po pierwsze, możemy przeglądać ustawodawstwo unijne on-line w dowolnym języku, na jaki dany akt prawny został przetłumaczony.  Na stronie http://eur-lex.europa.eu/ możemy wyszukiwać i czytać dyrektywy unijne, a dzięki otwarciu tego samego aktu w dwóch językach poznać tłumaczenie poszczególnych akapitów, zwrotów i terminów. Taki sposób wyszukiwania tłumaczeń jest jednak dość praco- i czasochłonny. Na szczęście dostępny jest jeszcze jeden, znacznie wygodniejszy.

Generalny Dyrektoriat Tłumaczeń Unii Europejskiej (Directoriate-General for Translation, DGT) od listopada 2007 roku udostępnia bazę tłumaczeń wszystkich aktów prawnych dla 22 oficjalnych języków Unii w formacie TMX, czyli uniwersalnym formacie wymiany pamięci tłumaczeniowych. Szczegółowe informacje na temat pamięci (włącznie z warunkami korzystania) dostępne są na stronie Dyrektoriatu. Same pliki baz danych dostępne są tu. Ale uwaga – konieczne jest ściągnięcie wszystkich 12 plików, o łącznej objętości ponad 1,2 GB. Następnie trzeba ściągnąć program w wersji pod Windows wraz z odpowiednią biblioteką, lub wersję programu napisaną w Javie, pracującą w trybie wiersza poleceń (np. w systemie Linux lub MacOS). Program umożliwia stworzenie na podstawie bazy danych pliku TMX dla określonej pary językowej.

Jeśli nie chcesz męczyć się ze ściąganiem, na własne potrzeby przygotowałem plik TMX dla pary językowej angielski-polski, który w formie skompresowanej ma „tylko” 97 MB. Zawiera on ponad milion jednostek tłumaczeniowych, choć część to duplikaty, więc po imporcie do TM zyskujemy nieco ponad 730 000 TU (sugeruję zapoznanie się z warunkami korzystania z bazy zamieszczonymi na stronie dyrektoriatu). Plik można zaimportować do ulubionego programu CAT, albo przeszukiwać go za pomocą bezpłatnego programu Xbench.

Plik został przygotowany na początku marca 2009 roku – zawartość oryginalnych baz jest stale aktualizowana, jeśli więc w chwili gdy czytasz te słowa upłynęło od tej daty więcej czasu, może warto samemu przygotować sobie bardziej aktualną wersję pamięci.

Zaznaczam, że w żaden sposób nie jestem odpowiedzialny za zawartość ani jakość tłumaczeń w pliku. Niestety sporo z nich jest niskiej jakości a nawet zawiera błędy (przynajmniej w zakresie, który jestem w stanie zweryfikować, czyli przepisów dotyczących medycyny, chemii i produktów leczniczych). Ale w sytuacji, gdy tłumaczenie odbywa się na zasadzie przetargu, w którym warunkiem rozstrzygającym jest cena oferty, trudno o zapewnienie właściwego poziomu merytorycznego tłumaczeń.

Leave a Reply

Your email address will not be published.