Jun 06

Auto-translatables w memoQ – uzupełnienie

Pisałem ostatnio o automatycznym wykrywaniu i konwersji wartości liczbowych w memoQ. Niestety, reguły stworzone do wykrywania liczb z konieczności nie są doskonałe – ponieważ przygotowano je z uwzględnieniem pięciu różnych formatów zapisów cyfr w tekstach źródłowych, szczególne przypadki mogą powodować błędy. Na przykład, dla tekstu w języku angielskim program proponuje zamianę liczby „0.018” na „0018”, zamiast „0,018”. Wynika to z faktu, że w różnych językach stosowane są różne separatory dziesiętne i różne separatory grup cyfr. W związku z tym przygotowałem na własne potrzeby zmodyfikowany zestaw reguł auto-translatables dla pary językowe agielski-polski. Jego zastosowanie eliminuje błędy w rodzaju powyższego, ale też nie zadziała prawidłowo dla innego języka źródłowego (np. niemieckiego czy francuskiego). Jeśli ktoś jest zainteresowany plikiem, można go pobrać stąd. Następnie należy go zaimportować do memoQ zgodnie z opisem w artykule wspomnianym na początku.

Dla zainteresowanych – z reguł zostały usunięte alternatywne separatory grup liczbowych i separatory dziesiętne, pozostały tylko te, których używa się w języku angielskim. Umożliwiło to wyeliminowanie dwóch „przypadków szczególnych” dla grup trzech cyfr znaczących po przecinku i uproszczenie reguł. Ponadto zmieniłem kolejność reguł w pliku w celu zwiększenia czytelności i usunąłem nadmiarowe oznaczenia z regexpów.

Leave a Reply

Your email address will not be published.