May 18

Gdzie znaleźć terminologię

dictionaryWywołano mnie do tablicy pytając listownie o dwu- lub wielojęzyczne glosariusze dostępne w Internecie, najlepiej w formacie XLS lub CSV. To bardzo ciekawe pytanie, ponieważ dotyczy jednego z najważniejszych aspektów pracy tłumacza – terminologii. Skąd „brać” terminologię do tłumaczeń, zwłaszcza dotyczących specjalistycznych dziedzin?

Oczywiście pierwszym źródłem terminologii są publikowane przez różne wydawnictwa słowniki. Mają tę zaletę, że ktoś się pod nimi podpisuje, zazwyczaj mają też redaktorów, recenzentów i przechodzą cały proces weryfikacji. Z drugiej strony procedury te sprawiają, że wydanie słownika jest kosztowne, a więc raczej trudno będzie znaleźć słownik z bardzo wąskiej dziedziny (choć zdarzają się wyjątki, np. Słownik terminów krystalograficznych, obecnie dostępny bezpłatnie online, przed laty do kupienia w formacie Worda). Główną wadą drukowanych słowników jest fakt, że szybko się starzeją, papier ma długi czas dostępu i – mimo wszystko – też mogą zawierać błędy.

Drugim dobrym źródłem są słowniki online publikowane przez organizacje godne zaufania. Przykłady:

  • Terminologia elektrotechniczna: bardzo obszerna baza terminologii zarządzana przez IEC (International Electrotechnical Comission). Źródło w zasadzie normatywne.
  • Terminologia Unii Europejskiej (po raz pierwszy): baza zarządzana przez Biuro Publikacji Unii Europejskiej.
  • Terminologia Unii Europejskiej (po raz drugi): baza zarządzana przez Ośrodek Tłumaczeń Komisji Europejskiej. (Na ile mogę stwierdzić, zawartość powyższych baz się pokrywa).
  • Glosariusz terminów statystycznych: zarządzany przez International Statistical Institute. Doskonałe źródło terminologii matematycznej z naciskiem na statystykę w każdej postaci.
  • Terminologia chemiczna: baza zarządzana przez Ośrodek Tłumaczeń KE z ramienia ECHA (Europejskiej Agencji Chemikaliów).
  • Standardowa terminologia farmaceutyczna: baza normatywna w zakresie produktów leczniczych (dostęp płatny), publikacja European Directorate for the Quality of Medicines & HealthCare.
  • Terminologia Microsoftu: nazwa mówi sama za siebie. Oficjalny słownik można pobrać w formacie TBX, ale strona internetowa oferuje więcej trafień ze stringów różnych wersji oprogramowania.

Podkreślam, że są to bazy przykładowe, więcej można znaleźć np. w grupie tłumaczy na Facebooku. Wadą wszystkich powyższych jest konieczność korzystania z przeglądarki internetowej, przynajmniej formalnie. Tylko baza ECHA oferuje możliwość pobrania terminologii w formacie Excel lub CSV. Ponadto nie wiemy, jak często są aktualizowane. Np. baza ECHA zawiera sporo tłumaczeń nieaktualnych (co wynika z tego, że osoby tłumaczące rozporządzenia unijne często nie trzymają się istniejącej terminologii, tylko stosują własną). Z drugiej strony, przy odrobinie wysiłku chyba każdą z nich można pobrać na dysk i przerobić na bazę terminologii ulubionego programu CAT (zazwyczaj wystarczy wget, prosty skrypt i trochę sprawności w obsłudze funkcji Znajdź i zamień). Można też oszczędzić sobie pracy i skorzystać ze zunifikowanego wyszukiwania – ale o tym za chwilę.

W przypadku tematyki obejmowanej przez dyrektywy i rozporządzenia unijne niezwykle cennym źródłem jest oczywiście serwis EurLex. Zapisanie na dysku dwujęzycznych wersji dokumentów umożliwia łatwe stworzenie z nich korpusów lub referencyjnych pamięci tłumaczeń, bądź wykorzystanie ich do ekstrakcji terminologii.

Co jednak robić, gdy interesującej nas terminologii nie ma w żadnym z powyższych (lub podobnych) źródeł? Można skorzystać ze zbiorowej mądrości innych tłumaczy, zwracając się do nich bezpośrednio, np. dzięki portalowi Proz.com, lub przeglądając owoce ich pracy w formie pamięci tłumaczeń (serwisy http://MyMemory.net i http://www.TAUSdata.org) albo korpusów dwujęzycznych (http://www.linguee.pl/).

Serwisy z pamięciami tłumaczeń stanowią interesującą opcję: MyMemory jest otwarty dla każdego, można korzystać z niego nawet wprost z poziomu programów do tłumaczenia: dostępne są wtyczki dla memoQ i Trados Studio i paru innych CATów, co może nawet stanowić namiastkę współdzielonej pamięci serwerowej dla małej grupy tłumaczy. Niestety ta otwartość jest też wadą serwisu – z moich doświadczeń wynika, że jakość dostępnych tam tłumaczeń jest bardzo nierówna. Oprócz tłumaczeń dobrych i bardzo dobrych są też fatalne, dlatego zalecałbym daleko idącą ostrożność i weryfikację terminologii pochodzącej z tego źródła. Nieco pewniejszym źródłem jest serwis TAUS, ponieważ zamieszczone tam pamięci tłumaczeń zamieszczone są przez firmy (w większości duże), więc jakość jest nieco lepsza. Z drugiej strony prowadzi to do nieco mniejszej różnorodności tematycznej dostępnych pamięci (nadreprezentowana jest tematyka informatyczna).

Źródłem, które zasługuje na szczególną uwagę jest serwis Linguee.pl. Jest to połączenie słownika z korpusem wielojęzycznym (dostępnych par językowych jest naprawdę dużo). Z serwisu korzystam chyba od jesieni ubiegłego roku i stał się dla mnie bezcennym narzędziem do wyszukiwania terminologii, a wręcz pierwszą instancją w przypadku szukania tłumaczenia nieznanego terminu. Wpisanie szukanej frazy w okno wyszukiwania powoduje wyświetlenie tłumaczeń słownikowych – jeśli dostępne (jeszcze nie trafiłem) – oraz trafień z korpusów zawierających wyszukiwaną frazę. Wyświetlany jest cały segment źródłowy i dopasowany segment z tłumaczeniem, co zapewnia informacje kontekstowe o terminie i często pozwala się zorientować odnośnie do ogólnej jakości tłumaczenia. Serwis dysponuje naprawdę imponującym korpusem z bardzo różnorodnych dziedzin i rzadko się zdarza, by nie zawierał choć jednego segmentu z interesującym mnie terminem. Niestety tak duży korpus oznacza, że dopasowanie tekstów (zaczerpniętych np. ze stron internetowych różnych firm) zostało wykonane automatycznie i nie zawsze jest poprawne. Czasami trafiają się też kiepskie tłumaczenia. W takich sytuacjach możemy oznaczyć segment jako błędny. W każdym segmencie źródłowym i docelowym z trafieniem wyświetlane są też łącza do tekstów źródłowych, najczęściej w formacie PDF, dzięki czemu na pierwszy rzut oka widać, skąd pochodzi dany tekst i możliwe jest wyświetlenie całego dokumentu źródłowego i/lub docelowego, co bywa przydatne np. w sytuacji, gdy segmenty zostały nieprawidłowo dopasowane. Po otwarciu całości tekstów zazwyczaj nie trudno zidentyfikować właściwy segment docelowy z interesującym nas terminem. Zdecydowanie polecam wszystkim tłumaczom.

Na koniec jeszcze jedna wskazówka: program memoQ oferuje funkcję Web search (Szukaj w Internecie), która umożliwia wyszukiwanie terminów lub fraz w wielu źródłach internetowych równocześnie. Wystarczy zaznaczyć interesujący nas tekst i wcisnąć kombinację klawiszową (domyślnie Ctrl-F3), a program memoQ wyświetli okno przeglądarki z kartami wszystkich zdefiniowanych źródeł, przesyłając do nich od razu zapytanie o zaznaczony tekst. Dzięki temu możemy błyskawicznie wyszukiwać terminologię nie tracąc czasu na wielokrotne wpisywanie tego samego terminu w kolejne okienka wyszukiwarek. memoQ domyślnie zawiera sporą kolekcję „silników” i źródeł wyszukiwania, w wielu wypadkach wystarczy uzupełnić je o język docelowy.

 webSearch

Jeśli ktoś jest zainteresowany moimi ustawieniami wyszukiwania, plik można pobrać stąd. Przy okazji – wywołanie zmapowałem sobie na Ctrl-; – bliżej Ctrl-K, a funkcja podobna.

Oczywiście, pomijając korzystanie ze źródeł normatywnych, ostatnim etapem i tak będzie weryfikacja poprawności znalezionego tłumaczenia – ale tutaj już przeważnie wystarczy stary dobry wujek Gugiel z wyszukiwaniem jednojęzycznym w języku docelowym.

 

Leave a Reply

Your email address will not be published.