Oct 20

Literary translations with CAT tools

What are CAT tools

If you deal with literary and creative translation only, you have probably never used any special translation-related software other than dictionaries (and a word processor), but you may have heard of “Computer Assisted Translation” tools or CATs for short. These were developed with technical translation in mind, and their main premise is to “never translate the same sentence twice”, which makes a lot of sense in the world of repetitive instruction manuals, but can this be useful in literary translation? Let’s see, but please note that this text does not touch the subject of machine translation (MT).

Continue reading

Oct 20

Programy CAT w tłumaczeniach literackich

Czym są programy CAT

Jeśli zajmujecie się wyłącznie tłumaczeniami literackimi i kreatywnymi, mogliście nigdy nie używać żadnego specjalnego oprogramowania do tłumaczenia poza słownikami i edytorem tekstu, ale mogliście słyszeć o programach do „komputerowego wspomagania tłumaczeń” (Computer Assisted Translation, CAT). Stworzono je z myślą o tłumaczeniach technicznych a ich głównym założeniem jest idea, że „nigdy nie trzeba dwa razy tłumaczyć takiego samego zdania”, co ma mnóstwo sensu w świecie powtarzalnych tekstów komunikacji technicznej (np. instrukcji obsługi), ale czy takie oprogramowanie może się do czegoś przydać w tłumaczeniach literackich? Zaznaczam, że tekst w najmniejszym stopniu nie dotyczy tłumaczeń maszynowych (Machine Translation, MT). Zapraszam do lektury.

Continue reading

Jan 30

Memsource files in memoQ

When it comes to online CAT-tools I personally consider Memsource as one of the better ones – it’s reasonably fast, offers decent functionality and usability. It’s even better with local (but not offline) client, which can undock some windows, so you can have concordance and TM matches on screen at the same time. Still, it’s not the same as memoQ when it comes to comfort and features, so whenever possible, I process Memsource files in memoQ – that is, if PM allows to download .mxliff files for work with local tool.

Continue reading

Oct 29

Terminology mining from Eur-Lex corpora

euThe conference #TranslatingEurope Forum 2016 was held on October 27-28 in Brussels. Besides presentations, the conference included two sessions of mini-workshops: the idea was to present some practical aspect of translation in small group – three people at a time. The workshops included my submission on terminology mining. I realized from the start that participants won’t be able to remember anything from 15-minute session with three different software tools, I have prepared handouts with some background information I had no time to introduce and description of all steps presented in the procedure. Since the workshop was quite popular (all groups were far larger than 3), I’m publishing somewhat extended version of the handout, which is available here:  Terminology_mining.pdf.

You can use the text freely, but if you use it for any derivative work, please credit the author.

Mar 13

Tłumaczenia kart charakterystyk – przydatne materiały

MSDSZamieszczone tu materiały stanowią uzupełnienie mojej prezentacji na Konferencji Tłumaczy z dnia 13 marca 2015 r. i w dużej części stanowią przywołanie materiałów zamieszczanych na blogu już wcześniej. Dla zainteresowanych dostępna jest też prezentacja w formacie PowerPoint z pełnym tekstem wykładu.


  • Serwis Eur-lex: akty prawne Unii Europejskiej. W pisać słowa kluczowe w polu wyszukiwania lub wpisać rok i numer szukanego dokumentu (np. 1907/2006).
  • Agencja ECHA: poradniki dotyczące sporządzania dokumentów związanych z kartami charakterystyk i przykładowe dokumenty. Część dostępna tylko po angielsku, część również w innych językach, również po polsku.
  • Baza terminologii ECHA: ponad tysiąc trzysta terminów z legislacji dotyczących chemikaliów, z definicjami i źródłami. Możliwość pobrania całości lub wybranych działów i języków.
  • Baza terminologii IATE: Interactive Terminology for Europe, terminologia Unii Europejskiej z całego zakresu dziedzin, również związanych z REACH i CLP.
  • Linguee: serwis oferujący wyszukiwanie w korpusach wielojęzycznych. Dzięki dużej bazie dopasowanych dokumentów świetne miejsce wyjścia do wyszukiwania terminologii/tłumaczeń dokumentów unijnych – ale zawsze należy sprawdzać, skąd pochodzi znalezione tłumaczenie.
  • Glosariusz akronimów: opracowany i utrzymywany przeze mnie glosariusz akronimów spotykanych w kartach charakterystyk. Korzystanie na własną odpowiedzialność.
  • Zestawienie zwrotów H i P: w artykule dostępne łącza do zestawienia wszystkich zwrotów w oryginalnej postaci dla wszystkich oficjalnych języków UE oraz rozbudowane zestawienie dla pary angielski-polski.
  • Zestawienie zwrotów R i S: formalnie nieaktualne, w tłumaczeniach będą występować jeszcze przez wiele lat.
  • Zestawienie nazw ONZ substancji niebezpiecznych z ustaw ADR/ADN/RID, z roku 2015: arkusz pobrany w listopadzie 2015 r. ze stron Ministerstwa Infrastruktury i Rozwoju, Departament Transportu Drogowego. Korzystanie na własną odpowiedzialność.

Tutaj dostępna jest prezentacja na temat tłumaczeń chemicznych, którą przedstawiłem na konferencji.

Mar 10

Crash course in regular expressions

regexI was invited to write a guest post on regular expressions in FrameMaker at Adobe blog platform. While it is written with FrameMaker in mind, I think the text can help anyone grasp basics of regex for any applications, including translation tools like memoQ or Trados Studio.

Nov 15

memoQ auto-translatables for numbers

new_memoQmemoQ is an excellent CAT/TEnT tool which offers plenty of advanced productivity features out of the box, but with little tinkering can be made even more useful. One of the advanced memoQ features is Auto-translatables: using regular expressions you can define how certain source text should be modified in target language. The rules can be quite advanced, e.g. for date format conversion from English “Monday, January 3rd, 2106” to Polish “Poniedziałek, 3 stycznia 2016 r.”. One of the most frequent uses for auto-translatables is the conversion of numeric strings according to target language rules. It used to be the most basic auto-translatable application – it’s not needed so much now, since memoQ offers automatic, out-of-box number format conversion: if your source segment contains numbers formatted according to source language rules,  just press Ctrl and from the displayed list select value formatted according to target language rules. The thing is, source format not always follows the rules (defined in Microsoft libraries used by memoQ).

Continue reading

Nov 07

Importing Studio TM and TB into memoQ

new_memoQmemoQ is great tool with many interoperability features, including easy SDLXLIFF file import/export, ability to import Studio packages and generating Studio return packages. And while packages are imported with translation memories and term bases, strangely the ability to import stand-alone Studio TMs (SDLTM) and TBs (SDLTB) is nowhere to be found in the UI. And this can be a seroius problem if a client sends you SDLXLIFF and SDLTM files instead of proper package (happens often enough). And while there is a solution to this problem, I’m offering a relatively simple alternative.

Continue reading

Oct 27

Angielsko-polski glosariusz zwrotów H i P

MSDSJak dobrze wie (albo powinien wiedzieć) każdy, kto ma styczność z tłumaczeniem kart charakterystyki (Safety Data Sheets, SDS), mogą one zawierać zwroty określające zagrożenia (Hazard, H-phrases) i zwroty określające środki ostrożności (Precautions, P-phrases). Treść tych zwrotów została opublikowana w rozporządzeniu Parlamentu Europejskiego i Rady (WE) nr 1272/2008 (CLP). Dokument ten był wielokrotnie korygowany kolejnymi rozporządzeniami, które modyfikowały również treść zwrotów H i P. W czerwcu tego roku został opublikowany tekst ujednolicony rozporządzenia, dostępny w serwisie Eur-Lex. Ponieważ w tekście dokumentu zamieszczone są zwroty H i P we wszystkich językach Unii, prosta obróbka umożliwiła mi stworzenie zestawienia wszystkich zwrotów we wszystkich językach w formie pozwalającej na łatwe zaimportowanie ich do bazy terminologii dowolnego programu CAT.

Continue reading

Oct 23

Amended H and P phrases

MSDSLast December I’ve created and published here a spreadsheet with H and P phrases plus S and R statements from CLP regulations.  Time goes by and the EU regulations get updated. On July 1st a unified text of EC Regulation 1272/2008 (CLP) was published, which includes all amendments introduced by regulations: 790/2009/EC, 286/2011/EU, 618/2012/EU, 487/2013/EU, 517/2013/EU, 758/2013/EU, 944/2013/EU 605/2014/EU, 1297/2014/EU and Corrigendums OJ L 016 and OJ L 138. I have created a new spreadsheet with H and P phrases, but without R and S statements fom CHIP regulation, since they are not valid anymore as of June 1st, 2015.

The document is available as Excel file or tab-delimited text file (CSV).

* * *

Dislclaimer: While I have prepared the file with due diligence by extracting text from regulation published by Eur-Lex service, if you are using the file, you are responsible for validation of it’s contents.