May 29

Automatyka w memoQ, czyli auto-translatables

Program memoQ jest szybki, wygodny i bardzo prosty w obsłudze. W domyślnej konfiguracji ma jednak dwie irytujące cechy: po pierwsze – moduł QA bardzo często zgłasza ostrzeżenia dotyczące wartości liczbowych (w przypadku niestandardowych formatów liczb w tekście źródłowym), a po drugie – nie pozwala na kopiowanie ciągów cyfr z tekstu źródłowego za pomocą skrótu klawiaturowego, jak np. w programie Trados.  Oba te problemy można jednak w znacznym stopniu wyelimować za pomocą prostej operacji: włączenia list elementów tłumaczonych automatycznie (auto-translatables).

Zacznijmy od włączenia automatycznego podstawiania wartości liczbowych. Polega to na tym, że program memoQ wykrywa w tekście źródłowym wartości liczbowe i jeśli są one w określonym formacie, zgodnym z regułami stosowanymi w danym języku, umieszcza na liście podstawień te same wartości liczbowe ale zmodyfikowane zgodnie ze standardowym sposobem pisania stosowanym w języku docelowym. Zmieniane są separatory tysięcy oraz separator dziesiętny, więc np. angielska liczba “10,189.53” zostanie zamieniona na “10 189,53“. Wartości te można następnie wstawiać w tekst tak jak wszystkie pozycje listy podstawień, np. wpisując Ctrl-numer podstawienia z listy.

Procedura będzie inna w przypadku, gdy chcemy włączyć auto-translatables dla bieżącego projektu (i tylko dla niego), oraz w przypadku, gdy planujemy włączyć je dla wszystkich nowych projektów.

Zacznijmy od włączenia automatycznego “tłumaczenia” wartości liczbowych dla bieżącego projektu — choćby w celu sprawdzenia, jak to działa.

  1. Otworzyć projekt.
  2. W panelu Settings (Ustawienia) projektu wybrać Auto-translation rules (Reguły automatycznego tłumaczenia). Zostanie wyświetlona lista narodowych standardów znanych programowi. Niestety, brak ustawień dla języka polskiego – jednak nie jest to problemem, ponieważ możemy skorzystać z ustawień dla języka węgierskiego, identycznych jak w języku polskim. Możemy pójść na łatwiznę i po prostu zaznaczyć ustawienia węgierskie (Numbers-Hungarian group), albo skopiować je, zmieniając nazwę na polskie. W tym celu należy kliknąć ustawienia węgierskie, a następnie kliknąć polecenie “Clone/use new” (Klonuj/użyj nowych) w prawym dolnym rogu okna i wpisać stosowną nazwę (np. Numbers-Polish group).

Klonowanie ustawień automatycznego tłumaczenia wartości liczbowych.

3. Zaznaczyć nową grupę reguł. Nazwy reguł aktywnych w projekcie wyświetlane są pogrubioną czcionką, tak jak w przypadku pamięci TM i glosariuszy. Poniżej prezentuję przykład wartości liczbowych rozpoznawanych przez domyślne reguły auto-translacji.

Przykładowe wartości liczbowe rozpoznawane przez domyślne reguły automatycznego tłumaczenia. Wartości rozdzielane kreskami rozpoznawane są indywidualnie.

Zdecydowanie ułatwia nam to pracę z tekstami, w których występuje dużo cyfr, zwłaszcza jeśli są to „standardowe” wartosci liczbowe. Gorzej, gdy tekst, z którym mamy do czynienia zawiera np. dużo numerów katalogowych w formacie łączącym tekst z liczbami, w formacie cyfr łączonych kreskami (dywizy lub półpałzy) bądź odwołania do podpunktów przepisów/dokumentacji albo informacje o numerach wersji oprogramowania. Jak widać na przykładzie powyżej, nie wszystkie zostaną rozpoznane.

Na szczęście reguły automatycznego tłumaczenia można sobie definiować samodzielnie za pomocą wyrażeń regularnych. Aby ułatwić sobie życie, zdefiniowałem własną grupę czterech reguł służących do rozpoznawania niestandardowych wartości liczbowych:

  1. Tekst z wartościami liczbowymi. Przykłady: N665, Alfa9beta
  2. Tekst z wartościami liczbowymi oddzielanymi kreską (dowolna liczba grup cyfr). Przykłady: IEC6001-11-1, CAP1283-34
  3. Grupy cyfr oddzielanych przynajmniej dwiema kropkami. Przykłady: 654.123.456, 84.12.79.1
  4. Grupy cyfr oddzielanych przynajmniej dwiema kreskami. Przykłady: 6-234-957, 543-21-8

Aby skorzystać z moich reguł należy pobrać ten plik, a następnie w ustawieniach automatycznego tłumaczenia (patrz punkt 2) użyć polecenia Import new (Importuj nowe) i wskazać pobrany plik (Non-standard numbers.mqres). Przykłady formatów rozpoznawanych przez reguły przedstawia ilustracja poniżej:

Grupy liczb rozpoznawane przez reguły „Non-standard numbers”.

Grupy cyfr z jedną kropką nie są rozpoznawane, by uniknąć konfliktu z regułami standardowymi, a grupy oddzielane jedną kreską nie są rozpoznawane, ponieważ w tłumaczeniu zazwyczaj dywiz powinen być zamieniany na półpauzę ze spacjami (tj. 45-69 -> 45 – 69). Ale nie zawsze. Włączenie obu reguł zapewni następujący wynik:

Aktywne reguły „Numbers-PolishGroup” i „Non-standard numbers”.

W przypadku indywidualnych potrzeb z niestandardowymi formatami liczbowymi można sobie samemu zmodyfikować/dodać reguły przydatne w szczególnych przypadkach.

 

Jeżeli reguły spełniają nasze oczekiwania, można je uaktywnić dla wszystkich nowo tworzonych projektów. W tym celu należy:

  1. Z menu Tools (Narzędzia) wybrać polecenie Options (Opcje). Pierwsza aktywna karta to Default resources (Zasoby domyślne).
  2. Z listy w panelu Default resources (Zasoby domyślne) wybrać Auto-translation rules (Reguły automatycznego tłumaczenia). Zaznaczyć reguły, które mają być aktywne w nowych projektach. W tym wypadku będą to Numbers-PolishGroup oraz (opcjonalnie) Non-standard numbers.
  3. Kliknąć OK.

Warto wiedzieć, że auto-translatables można wykorzystywać w bardzo elastyczny sposób. Np. jeśli w tłumaczonym pliku Worda lub Excela pojawiają się tagi HTML, możemy je wykrywać w segmentach źródłowych i wstawiać skrótem klawiszowym do tłumaczenia. W tym wypadku należy w edytorze reguł w polu Auto-translation rules (Reguły automatycznego tłumaczenia) wpisać ciąg „(\<.+?\>)” (bez cudzysłowów), a w polu Replace order rules wartość „$1”. Podobne reguły można tworzyć np. w przypadku spójnie oznaczanych stringów tekstowych, które mają pozostać nieprzetłumaczone. Reguły auto-translation można zastosować także mn. do automatycznego przeliczania jednostek. Więcej informacji na ten temat zawiera pomoc programu.

No dobrze, użycie automatycznego tłumaczenia wartości liczbowych ułatwia nam pracę, ale nie zmniejsza liczby fałszywych alarmów o niezgodności liczb. Jak sobie poradzić z tym problemem?

Dla bieżącego projektu:

  1. W panelu Settings (Ustawienia) projektu wybrać QA settings (Ustawienia kontroli jakości). Ponieważ domyślnych ustawień nie można modyfikować, należy je sklonować, używając polecenia Clone/use new (Klonuj/użyj nowych). Wpisać nazwę, która będzie dotyczyła wprowadzonych zmian, np. Default-poprawne liczby.
  2. Zaznaczyć nowe reguły QA, kliknąć polecenie Edit (Edytuj) u dołu okna.
  3. W oknie Edit QA settings (Edytuj ustawienia kontroli jakości) zaznaczyć opcję Check auto-translatables (Sprawdzaj automatyczne tłumaczenia).
  4. Kliknąć kartę Numbers (Liczby) okna Edit QA settings (Edytuj ustawienia kontroli jakości).
  5. Odznaczyć wszystkie opcje sprawdzania.

Przy takich ustawieniach program przestanie weryfikować wartości liczbowe z użyciem wbudowanych reguł, na które nie mamy żadnego wpływu, za to weryfikacja elementów tłumaczonych automatycznie niedopuści do przeoczenia błędnej wartości liczbowej w tekście docelowym. W zależności od rodzaju tekstu, z jakim mamy do czynienia, możemy w ten sposób drastycznie zmniejszyć liczbę ostrzeżeń o „nieznanym formacie”. Należy jednak pamiętać, że nie zostaną one wyeliminowane całkowicie: jeśli w tekście źródłowym pojawi się „punkt 6.8” albo „wersja 12.1”, oczywiście wstawimy te wartości w niezmienionej postaci, co doprowadzi do ostrzeżenia o błędzie, ponieważ program uzna, że powinniśmy zmienić kropkę na przecinek.

Aby wprowadzić opisaną powyżej zmianę ustawień QA dla wszystkich nowych projektów:

  1. Z menu Tools (Narzędzia) wybrać polecenie Options (Opcje). Pierwsza aktywna karta to Default resources (Zasoby domyślne).
  2. Z listy w panelu Default resources (Zasoby domyślne) wybrać QA settings (Ustawienia kontroli jakości).
  3. Zaznaczyć zmodyfikowane ustawienia kontroli jakości (w przykładzie – Default-poprawne liczby).
  4. Kliknąć OK.

Zmienione ustawienia będą obowiązywały jako domyślne dla wszystkich nowych projektów programu memoQ.

UWAGA:

Patrz uzupełnienie tutaj.

Leave a Reply

Your email address will not be published.