«

»

Jun 08

Tłumaczenie WordFasta w memoQ

memoq-wfWordFast w wersji dodatku do edytora Word (obecnie wersja Classic) zawsze miał wielu fanów – program był tani, prosty w obsłudze i w pełni zgodny z Tradosem. W zeszłym roku producent wypuścił jednak zupełnie nową wersję – WordFast Pro został napisany od podstaw w języku Java, dzięki czemu można go używać na dowolnym systemie operacyjnym (Windows, Linux, MacOS). Program pracuje w typowym dla wszystkich nowszych programów układzie tabelkowym i jest dość… swoisty. Ma swoich zwolenników, niestety mnie zdecydowanie się nie podoba (zwłaszcza koszmarnie niewygodny sposób pracy ze znacznikami). Na szczęście plików .txml wcale nie musimy tłumaczyć w WordFaście. Można do tego użyć memoQ. Poniżej przedstawiam całą procedurę krok po kroku.

Ostatnio tak się złożyło, że otrzymałem sporo zleceń na tłumaczenia w WordFaście Pro. Pierwsze z nich zrobiłem używając wersji demo programu i bardzo nie spodobał mi się sposób pracy, kiedy więc przyszły kolejne, poszukałem sposobu na pracę w znacznie wygodniejszym programie, jakim jest memoQ. Okazało się, że wcale nie jest to takie trudne.

Czego potrzebujemy:

  • WordFast Pro wersja demo (nie jest konieczny, ale zalecany)
  • Excel
  • memoQ
  • Word (opcjonalnie)

Samą procedurę należy rozbić na dwie części: przygotowanie pliku i pamięci (TM).

Zacznijmy od przygotowania pliku. Jeśli nie mamy WordFasta, należy ściągnąć wersję trial stąd i zainstalować.

  1. Otwieramy plik do tłumaczenia (.txml) w programie WordFast.
  2. Okno programu WordFast Pro. W celu skopiowania tekstu z segmentów źródłowych do docelowych należy użyć kombinacji kalwiszy Ctrl-Alt-Ins.

    Okno programu WordFast Pro. W celu skopiowania tekstu z segmentów źródłowych do docelowych należy użyć kombinacji kalwiszy Ctrl-Alt-Ins.

  3. Używając kombinacji klawiszy Ctrl-Alt-Ins kopiujemy zawartość wszystkich segmentów źródłowych do segmentów docelowych.
  4. Zapisujemy plik, zamykamy program WordFast (ew. powtarzamy dla wymaganej liczby plików).
    Jeśli z jakiegoś powodu nie chcemy lub nie możemy użyć wersji demo programu WordFast, możliwe jest skorzystanie z procedury z użyciem funkcji znajdź i zamień, opisanej tutaj (po angielsku).
  5. Ściągamy ten plik filtra i zapisujemy go na dysku.
  6. Uruchamiamy program memoQ.
  7. Z menu Tools wybieramy polecenie Resource console, następnie Filter configurations z paska po lewej i polecenie Import new. Wskazujemy plik pobrany w kroku 4.
  8. Tworzymy nowy projekt, na etapie dodawania plików wybieramy Add document as. Konieczne będzie przełączenie filtra typów plików u dołu okna z All supported files na All files (*.*). Wskazujemy plik(i) txml zapisane w kroku 3.
  9. W oknie Document import settings klikamy żółtą ikonkę z folderem (Load filter configuration) i wybieramy filtr WordFast zaimportowany w kroku 6.
    Filtr ukrywa oryginalne segmenty źródłowe (<source>) i wyświetla do edycji segmenty docelowe (<target>), oraz definiuje znaczniki (tagi) WordFasta. Prezentuje to ilustracja poniżej. 

    Dokument txml po zaimporotwaniu do memoQ. Segmenty źródłowe (<source>), widoczne w podglądzie na dole okna są ukryte, tłumaczymy wyłącznie segmenty <target>.

    Dokument txml po zaimporotwaniu do memoQ. Segmenty źródłowe (<source>), widoczne w podglądzie na dole okna są ukryte, tłumaczymy wyłącznie segmenty <target>.

    Praktyczna wskazówka – znaczniki, wyświetlane w WordFaście w postaci kolejnych numerów w nawiasach klamrowych – {1} – przez program memoQ traktowane są jako znaczniki tzw. „inline”. Domyślnie wstawia się je za pomocą klawisza F9, sugerowałbym jednak zmienić to ustawienie na coś wygodniejszego, np. tradosowe Ctrl-Alt-Strzałka w dół. Modyfikacji skrótów klawiszowych dokonuje się przez Tools > Resource console > Keyboard shortcuts > Clone (dla Default) > Edit.

  10. Po zakończeniu tłumaczenia zapisujemy gotowy plik korzystając z polecenia Export. Miłą cechą memoQ jest funkcja kontroli jakości, która nie pozwoli nam na wyeksportowanie plików w przypadku niezgodności znaczników (ale też pokaże segmenty, w których występują niezgodności).
  11. Dla spokoju ducha można jeszcze sprawdzić wygląd tłumaczenia w programie WordFast.
Gotowe tłumaczenie w programie WordFast. Widoczne oznaczenia procentowego podobieństwa podstawień z pamięci.

Gotowe tłumaczenie w programie WordFast. Widoczne oznaczenia procentowego podobieństwa podstawień z pamięci.

Procedura może wydawać się złożona, zwłaszcza za pierwszym razem, ale gdy mamy już skonfigurowany program, przygotowanie i wczytanie plików nie zajmuje wiele więcej czasu, niż w przypadku dowolnego innego formatu.

Sytuacja komplikuje się nieco, gdy oprócz pliku .txml dostajemy od klienta pamięć, która w przypadku WordFasta ma postać pliku .txt strukturze kolumn rozdzielanych tabulatorami. Żeby móc z niej skorzystać w memoQ musimy ją sobie odpowiednio przygotować, usuwając niepotrzebne informacje oraz znaczniki.

  1. Otworzyć plik TM w programie Word (opcjonalnie).
    Znaczniki w pamięci WF zapisywane są w postaci &tA;, &tB;, &tC; itd. Korzystając z Worda możemy je usunąć hurtem, wszystkie na raz. W tym celu otwieramy okno Znajdowanie i zamienianie (Ctrl-H), klikamy przycisk Więcej >> i zaznaczamy pole wyboru Użyj symboli wieloznacznych. Następnie w polu Znajdź wpisujemy formułę &t[A-Z];. Pole Zastąp zostawiamy puste. Klikamy Zamień wszystko.  Następnie odznaczamy opcję Użyj symboli wieloznacznych i zastępujemy ciąg &’A9; symbolem ©, oraz ciąg &’AE; symbolem ® (oczywiście, jeśli występują w TM). Zapisujemy plik z powrotem jako plik tekstowy, wybierając kodowanie UTF-8.
  2. Uruchamiamy program Excel, importujemy plik TM wybierając menu Dane > Dane zewnętrzne > Z tekstu. Jako separator kolumn wybieramy Tabulator, koniecznie zaznaczamy import pierwszego wiersza.

    Położenie polecenia umożliwiającego poprawny import pliku tekstowego.

    Położenie polecenia umożliwiającego poprawny import pliku tekstowego.

  3. Usuwamy wszystkie kolumny oprócz tych z tekstem źródłowym i tłumaczeniem. W przykładzie ponżej usuwamy kolumny A, B, C, D, F, H i I, zostawiając tylko E i G. Alternatywnie można zachować kolumnę B, zawierającą ID autora tłumaczenia.

    Pamięć WordFasta poprawnie zaimportowana do Excela.

    Pamięć WordFasta poprawnie zaimportowana do Excela.

  4. W pierwszych wierszach kolumn z tekstem źródłowym i tłumaczeniem wpisujemy identyfikatory języków. W razie potrzeby dodajemy kolumny z dodatkowymi informacjami, np. autorem tłumaczenia, domeną, klientem itp.

    Plik z usuniętymi zbędnymi kolumnami, wprowadzonymi nagłówkami kolumn i uzupełniony o kolumnę z autorem tłumaczeń w TM (w tym wypadku - nazwą biura).

    Plik z usuniętymi zbędnymi kolumnami, wprowadzonymi nagłówkami kolumn i uzupełniony o kolumnę z autorem tłumaczeń w TM (w tym wypadku - nazwą biura).

  5. Jeśli pominęliśmy krok 1, należy usunąć znaczniki – niestety w Excelu trzeba usuwać je „pojedynczo”, tj. wpisując do wyszukiwania kolejno wszystkie możliwe kombinacje liter (patrz krok 1). Zapisujemy plik przez naciśnięcie okrągłego przycisku office > Zapisz jako > Inne formaty > Tekst Unicode. Zamykamy program Excel.
  6. W memoQ wybieramy istniejącą pamięć lub tworzymy nową.  Następnie wybieramy polecenie Import from TMX/CSV. Wybieramy plik zapisany w kroku 5.
  7. W oknie Translation memory CSV import settings wybieramy odpowiednie ustawienia:
    • File encoding – UTF-8
    • Delimiter – Tab
    • First row is header

    Przypisujemy właściwe pola do Import as source segment (w tym przypadku  EN-US) i Import as target segment (w tym przypadku PL). Jeśli mamy dodatkowe pola do zaimportowania, zaznaczamy je i wybieramy odpowiednią opcję w polu Import as other field.

    Ustawienia importu pliku CSV do pamięci tłumaczeń w memoQ.

    Ustawienia importu pliku CSV do pamięci tłumaczeń w memoQ.

  8. Gotowe.

Jeśli w TM znajduje się dużo segmentów ze znacznikami, w memoQ uzyskamy kilka procent niższy poziom dopasowania niż w WordFaście, ale i tak zyskamy pracując w wygodniejszym środowisku, bez konieczności kupowania kolejnego programu CAT.

Warto wiedzieć, że podobnej procedury można użyć do tłumaczenia plików txml w programie Trados Studio – tam również można zdefiniować filtr importu plików xml.

2 comments

1 ping

  1. Maciej Kosmowski

    Tutaj mała uwaga.Eksport do pliku csv w Excellu 2003 może zniszczyć kodowanie.Spróbujcie otworzyć plik csv a następnie zapisać go w excellu :).Zdziwienie będzie spore gdy sprawdzicie kodowanie.
    Excell 2003 zapisuje w ansi i na to radzę uważać.
    Open Office sprawdzi się w podanym tutorialu równie dobrze.
    Ostatnio gdzieś natknąłem się na http://txml.sourceforge.net/
    jednak nie mam pewności czy struktura obu tych dokumentów jest podobna.

  2. Rafal

    Zwykły Notatnik w XP ma możliwość zmiany kodowania z ANSI na UTF-8 i vice versa.

  1. Wąsaty tłumacz » memoQ 5.0 – co nowego

    […] TXML. Nie trzeba już korzystać z mojego filtra importu plików WordFast Pro – ten działa nieco bardziej elegancko i nie wymaga kopiowania […]

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>