{"id":270,"date":"2010-05-29T22:14:44","date_gmt":"2010-05-29T20:14:44","guid":{"rendered":"http:\/\/hell.pl\/wasaty\/blog\/?p=270"},"modified":"2011-06-04T15:01:49","modified_gmt":"2011-06-04T14:01:49","slug":"multiterm-importowanie-glosariuszy","status":"publish","type":"post","link":"http:\/\/wasaty.pl\/blog\/2010\/05\/29\/multiterm-importowanie-glosariuszy\/","title":{"rendered":"MultiTerm &#8211; importowanie glosariuszy"},"content":{"rendered":"<div style=\"float: right; margin-left: 10px;\"><a href=\"https:\/\/twitter.com\/share\" class=\"twitter-share-button\" data-via=\"Wasaty\" data-count=\"vertical\" data-url=\"http:\/\/wasaty.pl\/blog\/2010\/05\/29\/multiterm-importowanie-glosariuszy\/\">Tweet<\/a><\/div>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"alignleft size-full wp-image-374\" title=\"MultiTerm_logo\" src=\"http:\/\/hell.pl\/wasaty\/blog\/wp-content\/uploads\/2010\/05\/MultiTerm_logo.png\" alt=\"MultiTerm_logo\" width=\"80\" height=\"80\" \/>Multiterm. Program o pot\u0119\u017cnych mo\u017cliwo\u015bciach, lecz pisany przez osoby o sposobie my\u015blenia kompletnie nieprzystaj\u0105cym do wi\u0119kszo\u015bci populacji. Osoby, kt\u00f3re zacz\u0119\u0142y prac\u0119 z CAT od Tradosa rzadko ceni\u0105 sobie glosariusze, poniewa\u017c Trados nie wymusza ich stosowania, a tworzenie i &#8220;konserwacja&#8221; glosariuszy w MultiTermie (MT) jest &#8211; delikatnie ujmuj\u0105c &#8211; niezbyt \u0142atwa. Nawet z pozoru tak banalne zadanie jak przygotowanie bazy w MT z otrzymanego glosariusza w Excelu mo\u017ce by\u0107 drog\u0105 przez m\u0119k\u0119. Jak to zrobi\u0107 szybko i bezstresowo? Zapraszam do lektury.<\/p>\n<p><!--more-->Disclaimer: tekst w pierwotnej postaci napisa\u0142em na jednym z for\u00f3w internetowych ponad p\u00f3\u0142 roku temu, ale poniewa\u017c w\u0142a\u015bnie kto\u015b znowu mia\u0142 problem z MT, postanowi\u0142em go uzupe\u0142ni\u0107 i umie\u015bci\u0107 w miejscu, gdzie \u0142atwiej b\u0119dzie go znale\u017a\u0107.<\/p>\n<p>Generalnie import danych naj\u0142atwiej wykona\u0107 z arkusza Excela lub pliku tekstowego z separatorami (.csv), przy czym z moich do\u015bwiadcze\u0144 wynika, \u017ce MultiTerm Convert czasem nie chce przetwarza\u0107 ca\u0142kowicie poprawnego .xls, a po\u0142yka plik tekstowy. Przed rozpocz\u0119ciem importu nale\u017cy te\u017c zamkn\u0105\u0107 program Excel. Tekst do importu musi si\u0119 znajdowa\u0107 w postaci kolumn, tj. has\u0142a w r\u00f3\u017cnych j\u0119zykach musz\u0105 by\u0107 w jednym rz\u0119dzie. Nie ma znaczenia liczba kolumn oraz zawarto\u015b\u0107 kolumn dodatkowych (np. z komentarzem czy wymow\u0105). Kolejno\u015b\u0107 kolumn te\u017c nie jest istotna &#8211; mo\u017cemy mie\u0107 np. arkusz, w kt\u00f3rym znajduj\u0105 si\u0119 kolejno: has\u0142o \u017ar\u00f3d\u0142owe, definicja, informacje o kontek\u015bcie, \u017ar\u00f3d\u0142o, t\u0142umaczenie, informacje pomocnicze itd. Natomiast <strong>niezwykle wa\u017cne jest<\/strong>, by w pierwszym wierszu kolumn z znajdowa\u0142y si\u0119 ich opisy, w szczeg\u00f3lno\u015bci okre\u015blenia j\u0119zyka (np. English, Polski). Uwaga &#8211; je\u017celi chcemy do jednej bazy MT importowa\u0107 glosariusze z r\u00f3\u017cnych \u017ar\u00f3de\u0142, czyli np. zaimportowa\u0107 dwa glosariusze do jednej bazy MultiTerma, konieczne jest u\u017cycie w obu wypadkach identycznego opisu j\u0119zyka (np. dwa razy EN, dwa razy EN-US, albo dwa razy English). Je\u015bli nag\u0142\u00f3wek w jednym z plik\u00f3w b\u0119dzie inny ni\u017c w drugim, taki import mo\u017ce si\u0119 uda\u0107, ale p\u00f3\u017aniej b\u0119dzie mn\u00f3stwo problem\u00f3w z uzyskan\u0105 baz\u0105 (np. brak mo\u017cliwo\u015bci eksportu, brak mo\u017cliwo\u015bci wyszukiwania cz\u0119\u015bci termin\u00f3w).<\/p>\n<p>Procedura wygl\u0105da nast\u0119puj\u0105co:<\/p>\n<p>1. Zapisa\u0107 arkusz Excela jako plik tekstowy Unicode (inaczej stracimy pliterki). W Excelu 2007: okr\u0105g\u0142y przycisk Office &gt; Zapisz jako &gt; Inne formaty &gt; Tekst Unicode (*.txt). Poszczeg\u00f3lne kolumny w wierszu b\u0119d\u0105 oddzielone tabulatorami. W przyk\u0142adzie poni\u017cej mamy do czynienia z najprostszym rodzajem pliku, zawieraj\u0105cym wy\u0142\u0105cznie terminy w dw\u00f3ch j\u0119zykach, bez \u017cadnych p\u00f3l opisowych czy pomocniczych.<br \/>\n2. Uruchomi\u0107 program MultiTerm Convert.<br \/>\n3. Wybra\u0107 now\u0105 sesj\u0119 konwersji &gt; &#8220;Spreadsheet or database exchange format&#8221;.<br \/>\n4. Wskaza\u0107 wej\u015bciowy plik .txt, wybra\u0107 w\u0142a\u015bciw\u0105 liczb\u0119 kolumn, upewni\u0107 si\u0119, \u017ce wszystko wygl\u0105da OK.<\/p>\n<div id=\"attachment_369\" style=\"width: 540px\" class=\"wp-caption aligncenter\"><a href=\"http:\/\/hell.pl\/wasaty\/blog\/wp-content\/uploads\/2010\/05\/Multiterm1.png\"><img aria-describedby=\"caption-attachment-369\" decoding=\"async\" loading=\"lazy\" class=\"size-large wp-image-369\" title=\"Multiterm1\" src=\"http:\/\/hell.pl\/wasaty\/blog\/wp-content\/uploads\/2010\/05\/Multiterm1-580x410.png\" alt=\"Wyb\u00f3r separatora danych w importowanym pliku (zazwyczaj tabulator), mo\u017cliwo\u015b\u0107 wybrania liczby kolumn do importu (tutaj dwie). Podgl\u0105d w dolnej cz\u0119\u015bci okna u\u0142atwia wybranie w\u0142a\u015bciwych ustawie\u0144.\" width=\"540\" height=\"410\" \/><\/a><p id=\"caption-attachment-369\" class=\"wp-caption-text\">Wyb\u00f3r separatora danych w importowanym pliku (zazwyczaj tabulator), mo\u017cliwo\u015b\u0107 wybrania liczby kolumn do importu (tutaj dwie). Podgl\u0105d w dolnej cz\u0119\u015bci okna u\u0142atwia wybranie w\u0142a\u015bciwych ustawie\u0144.<\/p><\/div>\n<p>5. W oknie &#8220;Available column header fields&#8221; wybra\u0107 nag\u0142\u00f3wki j\u0119zyk\u00f3w, kolejno oba zaznaczaj\u0105c jako &#8220;Index field&#8221; z przypisanym w\u0142a\u015bciwym j\u0119zykiem.<\/p>\n<div id=\"attachment_370\" style=\"width: 540px\" class=\"wp-caption aligncenter\"><a href=\"http:\/\/hell.pl\/wasaty\/blog\/wp-content\/uploads\/2010\/05\/Multiterm2.png\"><img aria-describedby=\"caption-attachment-370\" decoding=\"async\" loading=\"lazy\" class=\"size-large wp-image-370\" title=\"Multiterm2\" src=\"http:\/\/hell.pl\/wasaty\/blog\/wp-content\/uploads\/2010\/05\/Multiterm2-580x407.png\" alt=\"Bardzo wa\u017cny krok - nale\u017cy wybra\u0107, kt\u00f3re pola (kolumny) b\u0119d\u0105 indeksowane, czyli kt\u00f3re zawieraj\u0105 terminy do wyszukiwania. Zwr\u00f3ci\u0107 uwag\u0119 na w\u0142a\u015bciwy wyb\u00f3r j\u0119zyka z listy rozwijanej po prawej dla ka\u017cdego j\u0119zyka w polu po lewej. Je\u015bli w importowanym pliku mamy dodatkowe pola, oznaczamy je jako &quot;Descriptive&quot;.\" width=\"540\" height=\"407\" \/><\/a><p id=\"caption-attachment-370\" class=\"wp-caption-text\">Bardzo wa\u017cny krok - nale\u017cy wybra\u0107, kt\u00f3re pola (kolumny) b\u0119d\u0105 indeksowane, czyli kt\u00f3re zawieraj\u0105 terminy do wyszukiwania. Zwr\u00f3ci\u0107 uwag\u0119 na w\u0142a\u015bciwy wyb\u00f3r j\u0119zyka z listy rozwijanej po prawej dla ka\u017cdego j\u0119zyka w polu po lewej. Je\u015bli w importowanym pliku mamy dodatkowe pola, oznaczamy je jako &quot;Descriptive&quot;.<\/p><\/div>\n<p>6. Je\u015bli wszystko zosta\u0142o wykonane prawid\u0142owo, powinni\u015bmy dosta\u0107 drzewko z &#8220;Entry level&#8221; na g\u00f3rze, pod kt\u00f3rym mamy dwa (lub wi\u0119cej) j\u0119zyk\u00f3w z przypisanym do ka\u017cdego polem &#8220;Term&#8221;. Je\u015bli mamy pola dodatkowe (opis, wymowa itp.), dodajemy je w odpowiednim miejscu struktury. Po zako\u0144czeniu klikamy &#8220;Next&#8221; a\u017c do skutku.<\/p>\n<div id=\"attachment_371\" style=\"width: 540px\" class=\"wp-caption aligncenter\"><a href=\"http:\/\/hell.pl\/wasaty\/blog\/wp-content\/uploads\/2010\/05\/Multiterm3.png\"><img aria-describedby=\"caption-attachment-371\" decoding=\"async\" loading=\"lazy\" class=\"size-large wp-image-371\" title=\"Multiterm3\" src=\"http:\/\/hell.pl\/wasaty\/blog\/wp-content\/uploads\/2010\/05\/Multiterm3-580x408.png\" alt=\"Drzewko terminu z dwoma j\u0119zykami, bez \u017cadnych p\u00f3l dodatkowych. Je\u015bli mamy pola opisowe (Descriptive), mo\u017cemy je umie\u015bci\u0107 we w\u0142a\u015bciwym miejscu struktury, przypisuj\u0105c je do poziomu terminu albo konkretnego j\u0119zyka (np. mo\u017cemy mie\u0107 og\u00f3ln\u0105 definicj\u0119, przypisan\u0105 na poziomie terminu, albo osobne definicje po polsku i po angielsku, wtedy obie definicje nale\u017cy przypisa\u0107 do poziomu w\u0142a\u015bciwego j\u0119zyka).\" width=\"540\" height=\"408\" \/><\/a><p id=\"caption-attachment-371\" class=\"wp-caption-text\">Drzewko terminu z dwoma j\u0119zykami, bez \u017cadnych p\u00f3l dodatkowych. Je\u015bli mamy pola opisowe (Descriptive), mo\u017cemy je umie\u015bci\u0107 we w\u0142a\u015bciwym miejscu struktury, przypisuj\u0105c je do poziomu terminu albo konkretnego j\u0119zyka (np. mo\u017cemy mie\u0107 og\u00f3ln\u0105 definicj\u0119, przypisan\u0105 na poziomie terminu, albo osobne definicje po polsku i po angielsku, wtedy obie definicje nale\u017cy przypisa\u0107 do poziomu w\u0142a\u015bciwego j\u0119zyka).<\/p><\/div>\n<p>7. Uruchamiamy MultiTerma. W menu Termbase wybieramy &#8220;Create TermBase&#8221;.<br \/>\n8. W kreatorze wpisujemy nazw\u0119 i w kolejnym oknie wybieramy &#8220;Load existing termbase definition file&#8221;. Wskazujemy plik .xdt wygenerowany w trakcie importu. Jedziemy do ko\u0144ca nie zmieniaj\u0105c \u017cadnych istotnych parametr\u00f3w. Chyba, \u017ce bardzo chcemy &#8211; patrz ilustracja poni\u017cej.<\/p>\n<div id=\"attachment_372\" style=\"width: 540px\" class=\"wp-caption aligncenter\"><a href=\"http:\/\/hell.pl\/wasaty\/blog\/wp-content\/uploads\/2010\/05\/Multiterm4.png\"><img aria-describedby=\"caption-attachment-372\" decoding=\"async\" loading=\"lazy\" class=\"size-large wp-image-372\" title=\"Multiterm4\" src=\"http:\/\/hell.pl\/wasaty\/blog\/wp-content\/uploads\/2010\/05\/Multiterm4-580x373.png\" alt=\"Tworzenie bazy terminologii na podstawie importowanej definicji. W tym wypadku dodano dodatkowe pole &quot;Source&quot; na poziomie t\u0142umaczenia terminu. Termin angielski mo\u017ce mie\u0107 wi\u0119cej ni\u017c jedno t\u0142umaczenie, chc\u0119 mie\u0107 mo\u017cliwo\u015b\u0107 zanotowania, sk\u0105d pochodzi konkretne t\u0142umaczenie terminu \u017ar\u00f3d\u0142owego.\" width=\"540\" height=\"373\" \/><\/a><p id=\"caption-attachment-372\" class=\"wp-caption-text\">Tworzenie bazy terminologii na podstawie importowanej definicji. W tym wypadku dodano dodatkowe pole &quot;Source&quot; na poziomie t\u0142umaczenia terminu. Termin angielski mo\u017ce mie\u0107 wi\u0119cej ni\u017c jedno t\u0142umaczenie, chc\u0119 mie\u0107 mo\u017cliwo\u015b\u0107 zanotowania, sk\u0105d pochodzi konkretne t\u0142umaczenie terminu \u017ar\u00f3d\u0142owego.<\/p><\/div>\n<p>W ten spos\u00f3b stworzyli\u015bmy baz\u0119 MuliTerma, ale to nie koniec &#8211; nale\u017cy jeszcze osobno zaimportowa\u0107 do niej wpisy.<\/p>\n<p>9. W zale\u017cno\u015bci od wersji Multiterma:<\/p>\n<p>a) wersje starsze &#8211; &#8220;Termbase &gt; Import entries &gt; Process&#8221; i wybieramy plik .xml stworzony przez Converta.<br \/>\nb) wersja 2009 &#8211; zak\u0142adka Catalog &gt; Import &gt; Default import definition, klikamy prawym przyciskiem myszy, wybieramy polecenie &#8220;Process&#8221; i wskazujemy plik .xml stworzony przez Converta (nie pytajcie mnie, kto wymy\u015bli\u0142 t\u0119 niezwykle intuicyjn\u0105 sekwencj\u0119).<\/p>\n<div id=\"attachment_373\" style=\"width: 540px\" class=\"wp-caption aligncenter\"><a href=\"http:\/\/hell.pl\/wasaty\/blog\/wp-content\/uploads\/2010\/05\/Multiterm5.png\"><img aria-describedby=\"caption-attachment-373\" decoding=\"async\" loading=\"lazy\" class=\"size-large wp-image-373\" title=\"Multiterm5\" src=\"http:\/\/hell.pl\/wasaty\/blog\/wp-content\/uploads\/2010\/05\/Multiterm5-580x320.png\" alt=\"Miejsce, w kt\u00f3rym znajduje si\u0119 polecenie &quot;Process&quot; s\u0142u\u017c\u0105ce do importu terminologii do stworzonej bazy.\" width=\"540\" height=\"320\" \/><\/a><p id=\"caption-attachment-373\" class=\"wp-caption-text\">Miejsce, w kt\u00f3rym znajduje si\u0119 polecenie &quot;Process&quot; s\u0142u\u017c\u0105ce do importu terminologii do stworzonej bazy.<\/p><\/div>\n<p>W razie problem\u00f3w zawsze mo\u017cna sobie obejrze\u0107 za pomoc\u0105 edytora tekstowego plik .xml tworzony przez MultiTerm Convert i sprawdzi\u0107, czy ma logiczn\u0105 struktur\u0119 (wbrew pozorom jest do\u015b\u0107 przejrzysta). Cz\u0119sto umo\u017cliwia to stwierdzenie, co w\u0142a\u015bciwie jest nie tak z naszym importem i naprawienie b\u0142\u0119d\u00f3w (np. zdefiniowano dwa razy ten sam j\u0119zyk).<\/p>\n<p>Jeszcze jedna porada &#8211; co zrobi\u0107 z glosariuszem w postaci tabeli .html? Wystarczy otworzy\u0107 taki plik w Wordzie, zaznaczy\u0107 w nim tabelk\u0119, skopiowa\u0107 i wklei\u0107 do arkusza Excela. Dalej &#8211; patrz punkt 1.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Multiterm. Program o pot\u0119\u017cnych mo\u017cliwo\u015bciach, lecz pisany przez osoby o sposobie my\u015blenia kompletnie nieprzystaj\u0105cym do wi\u0119kszo\u015bci populacji. Osoby, kt\u00f3re zacz\u0119\u0142y prac\u0119 z CAT od Tradosa rzadko ceni\u0105 sobie glosariusze, poniewa\u017c Trados nie wymusza ich stosowania, a tworzenie i &#8220;konserwacja&#8221; glosariuszy w MultiTermie (MT) jest &#8211; delikatnie ujmuj\u0105c &#8211; niezbyt \u0142atwa. Nawet z pozoru tak banalne zadanie jak przygotowanie bazy w MT z otrzymanego glosariusza w Excelu mo\u017ce by\u0107 drog\u0105 przez m\u0119k\u0119. Jak to zrobi\u0107 szybko i bezstresowo? Zapraszam do lektury.<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[3,6],"tags":[47,24,31,50],"_links":{"self":[{"href":"http:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/posts\/270"}],"collection":[{"href":"http:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"http:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/comments?post=270"}],"version-history":[{"count":3,"href":"http:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/posts\/270\/revisions"}],"predecessor-version":[{"id":528,"href":"http:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/posts\/270\/revisions\/528"}],"wp:attachment":[{"href":"http:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/media?parent=270"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/categories?post=270"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/tags?post=270"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}