{"id":356,"date":"2010-05-25T19:45:18","date_gmt":"2010-05-25T17:45:18","guid":{"rendered":"http:\/\/hell.pl\/wasaty\/blog\/?p=356"},"modified":"2011-06-04T15:07:21","modified_gmt":"2011-06-04T14:07:21","slug":"codezapper-lekarstwo-na-nadmiar-znacznikow","status":"publish","type":"post","link":"https:\/\/wasaty.pl\/blog\/2010\/05\/25\/codezapper-lekarstwo-na-nadmiar-znacznikow\/","title":{"rendered":"CodeZapper &#8211; lekarstwo na nadmiar znacznik\u00f3w"},"content":{"rendered":"<div style=\"float: right; margin-left: 10px;\"><a href=\"https:\/\/twitter.com\/share\" class=\"twitter-share-button\" data-via=\"Wasaty\" data-count=\"vertical\" data-url=\"https:\/\/wasaty.pl\/blog\/2010\/05\/25\/codezapper-lekarstwo-na-nadmiar-znacznikow\/\">Tweet<\/a><\/div>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"alignleft size-full wp-image-360\" title=\"Tagi_logo\" src=\"http:\/\/hell.pl\/wasaty\/blog\/wp-content\/uploads\/2010\/05\/Tagi_logo.png\" alt=\"Tagi_logo\" width=\"80\" height=\"80\" \/>Pliki PDF. Wszyscy je kochamy, zw\u0142aszcza t\u0142umaczy\u0107. Na szcz\u0119\u015bcie s\u0105 programy, kt\u00f3re umo\u017cliwiaj\u0105 wydostanie z PDFa tekstu w formie w du\u017cym stopniu zgodnej z uk\u0142adem orygina\u0142u: z zachowaniem czcionek, ich atrybut\u00f3w (pogrubienie, kursywa), podzia\u0142u na akapity, wypunktowania itp. Niestety, ma to swoj\u0105 cen\u0119. Zazwyczaj o ile taki tekst po konwersji do .doc \u201ena oko\u201d wygl\u0105da dobrze, to zawiera mn\u00f3stwo znacznik\u00f3w\/tag\u00f3w, steruj\u0105cych wygl\u0105dem tekstu, kt\u00f3re mog\u0105 nam bardzo utrudni\u0107 \u017cycie. Jednak istnieje na to spos\u00f3b.<\/p>\n<p><!--more--><\/p>\n<p>Zacznijmy od ilustracji, na wypadek, gdyby kto\u015b mia\u0142 w\u0105tpliwo\u015bci, na czym polega problem ze znacznikami. Poni\u017cej zamieszczam obrazek przedstawiaj\u0105cy wygl\u0105d tekstu zaimportowanego do <a href=\"http:\/\/hell.pl\/wasaty\/blog\/2010\/03\/21\/nowa-nadzieja-memoq-czyli-wschodzaca-gwiazda-catow\/\">memoQ<\/a> po eksporcie z programu <a href=\"http:\/\/www.nitropdf.com\/index.asp\">Nitro PDF Professional<\/a>. Zaznaczam, \u017ce jest to wygl\u0105d przy ustawieniu wzgl\u0119dnie konserwatywnym. Przy wybraniu opcji maksymalnego podobie\u0144stwa pliku .doc do \u017ar\u00f3d\u0142a w .pdf, znacznik\u00f3w jest <strong>du\u017co<\/strong> wi\u0119cej.<\/p>\n<div id=\"attachment_357\" style=\"width: 464px\" class=\"wp-caption aligncenter\"><img aria-describedby=\"caption-attachment-357\" decoding=\"async\" loading=\"lazy\" class=\"size-full wp-image-357\" title=\"CodeZapper1_before\" src=\"http:\/\/hell.pl\/wasaty\/blog\/wp-content\/uploads\/2010\/05\/CodeZapper1_before.png\" alt=\"Tekst zaimportowany do memoQ po ekstrakcji tekstu z pliku w formacie PDF.\" width=\"464\" height=\"537\" srcset=\"https:\/\/wasaty.pl\/blog\/wp-content\/uploads\/2010\/05\/CodeZapper1_before.png 464w, https:\/\/wasaty.pl\/blog\/wp-content\/uploads\/2010\/05\/CodeZapper1_before-259x300.png 259w\" sizes=\"(max-width: 464px) 100vw, 464px\" \/><p id=\"caption-attachment-357\" class=\"wp-caption-text\">Tekst zaimportowany do memoQ po ekstrakcji tekstu z pliku w formacie PDF.<\/p><\/div>\n<p>Do niedawna moim podstawowym programem CAT by\u0142 <a href=\"http:\/\/hell.pl\/wasaty\/blog\/tag\/trados\/\">Trados<\/a>, i cho\u0107 do wersji 2007 wola\u0142em pracowa\u0107 w TagEditorze, w przypadku pracy z plikami skonwertowanymi z PDF mia\u0142em dwie opcje &#8211; albo wyczy\u015bci\u0107 formatowanie i budowa\u0107 ca\u0142\u0105 struktur\u0119 pliku od nowa &#8211; co przy wi\u0119kszym dokumencie wymaga mn\u00f3stwa pracy i czasu &#8211; albo pracowa\u0107 w Wordzie, gdzie tych znacznik\u00f3w po prostu nie wida\u0107. Co nie znaczy, \u017ce ich nie ma &#8211; program mo\u017ce mie\u0107 du\u017ce problemy z sugerowaniem podstawie\u0144 z TM, poniewa\u017c obecno\u015b\u0107 znacznik\u00f3w znacz\u0105co wp\u0142ywa na procentowe podobie\u0144stwo segment\u00f3w. Od czasu Trados Studio to rozwi\u0105zanie przesta\u0142o by\u0107 opcj\u0105 &#8211; w TS taki tekst b\u0119dzie wygl\u0105da\u0142 identycznie jak na ilustracji powy\u017cej, tylko oznaczenia tag\u00f3w b\u0119d\u0105 inne.<\/p>\n<p>Na szcz\u0119\u015bcie znalaz\u0142em rozwi\u0105zanie tego problemu. <a href=\"http:\/\/asap-traduction.com\/\">David Turner<\/a>, t\u0142umacz pracuj\u0105cy do niedawna w programie DejaVu, stworzy\u0142 zestaw makr do Worda, znanych jako \u201eCodeZapper\u201d, umo\u017cliwiaj\u0105cych pozbycie si\u0119 niepotrzebnych kod\u00f3w. Oraz par\u0119 innych przydatnych rzeczy.<\/p>\n<p>CodeZapper dost\u0119pny jest w formie pliku .dot, kt\u00f3ry trzeba \u201ezainstalowa\u0107\u201d w systemie. Mamy tu do wyboru dwie mo\u017cliwo\u015bci &#8211; je\u015bli chcemy, by makra dost\u0119pne by\u0142y przy ka\u017cdym uruchomieniu Worda, wystarczy plik .dot wrzuci\u0107 do folderu autostartu (w Windows XP, dla Word 2007: CDocuments and Settings[nazwa u\u017cytkownika]Dane aplikacjiMicrosoftWordStartup).\u00a0 Z drugiej strony, tego rodzaju makra nie s\u0105 raczej u\u017cywane codziennie, mo\u017cemy wi\u0119c \u0142adowa\u0107 je tylko w razie potrzeby. W tym celu nale\u017cy plik .dot umie\u015bci\u0107 w folderze z szablonami (w Windows XP, dla Word 2007: CDocuments and Settings[nazwa  u\u017cytkownika]Dane aplikacjiMicrosoftSzablony) i aktywowa\u0107 tylko wtedy, gdy jest potrzebny (w Windows 2007: Opcje programu Word -&gt; Dodatki -&gt; w li\u015bcie Zarz\u0105dzaj wybra\u0107 Szablony i klikn\u0105\u0107 Przejd\u017a). Po uruchomieniu szablonu uzyskamy dost\u0119p do nowego menu z opcjami oferowanymi przez pakiet:<\/p>\n<ul>\n<li><strong>Batch<\/strong> &#8211; makro s\u0142u\u017c\u0105ce do wykonania jednego lub wi\u0119kszej liczby innych polece\u0144 w trybie wsadowym, na wszystkich plikach .doc lub .rtf w folderze.<\/li>\n<li><strong>CZAll<\/strong> &#8211; usuwa zb\u0119dne kody, ukrywa wypunktowania, przenosi przypisy na koniec dokumentu, wyci\u0105ga teksty z p\u00f3l tekstowych do tabeli i przenosi ilustracje do pliku tymczasowego.<\/li>\n<li><strong>CZback<\/strong> &#8211; odwraca zmiany wprowadzone przez CZAll (wykonuje si\u0119 po uko\u0144czeniu t\u0142umaczenia).<\/li>\n<li><strong>CZL<\/strong> &#8211; podstawowe makra CodeZappera do usuwania zb\u0119dnych kod\u00f3w w aktywnym dokumencie.<\/li>\n<li><strong>PDFFix<\/strong> &#8211; dodatkowe czyszczenie dla plik\u00f3w skonwertowanych z PDF.<\/li>\n<li><strong>PDFTidy<\/strong> &#8211; \u201eczy\u015bci\u201d pliki konwertowane z PDF przed uruchomieniem CZ.<\/li>\n<li><strong>Bullets<\/strong> &#8211; ukrywa\/ods\u0142ania wypunktowania i automatyczn\u0105 numeracj\u0119 akapit\u00f3w by nie importowa\u0107 ich do DejaVu (DVX).<\/li>\n<li><strong>HdeMnB<\/strong>: ukrywa \u201er\u0119czne\u201d wypunktowania i numery akapit\u00f3w.<\/li>\n<li><strong>MvFtnts\/RevFtnts<\/strong>: czasowo przenosi przypisy na koniec dokumentu i z powrotem w celu u\u0142atwienia t\u0142umaczenia w DVX lub memoQ (MQ).<\/li>\n<li><strong>ImagesOut\/ImagesIn<\/strong>: oznacza i wyci\u0105ga z dokumentu ilustracje wstawione jako \u201einline\u201d do tymczasowego pliku i z powrotem.<\/li>\n<li><strong>Zoom<\/strong>: prze\u0142\u0105cza ustawienia powi\u0119kszenia &#8211; 75, 100 i 150%.<\/li>\n<li><strong>RevTxt<\/strong>: odwraca kolejno\u015b\u0107 s\u0142\u00f3w w zaznaczonym fragmencie tekstu.<\/li>\n<li><strong>Left<\/strong>, <strong>Right<\/strong>: przesuwa zaznaczone s\u0142owa w lewo lub w prawo.<\/li>\n<li><strong>AllCocRTF<\/strong>, <strong>AllRTFDoc<\/strong>, <strong>DocRTF<\/strong>, <strong>RTFDoc<\/strong>: zapisuje bie\u017c\u0105cy plik lub wszystkie pliki jako .rtf (DocRTF) lub .doc (RTFDoc).<\/li>\n<li><strong>CntTxBx<\/strong>: liczy pola tekstowe w dokumencie oraz liczb\u0119 s\u0142\u00f3w w polach tekstowych (cenne w starszych wersjach Worda, kt\u00f3re w statystyce dokumentu nie uwzgl\u0119dniaj\u0105 s\u0142\u00f3w w polach tekstowych).<\/li>\n<li><strong>TxtBxTb<\/strong> i <strong>TbTxtBx<\/strong>: Przenosi tekst z p\u00f3l tekstowych do tabeli i z powrotem.<\/li>\n<li><strong>HdShwAll<\/strong>: ukrywa\/wy\u015bwietla ca\u0142y tekst w dokumencie (tekst ukryty).<\/li>\n<li><strong>HighLght<\/strong>: ukrywa\/ods\u0142ania tekst wok\u00f3\u0142 tekstu zaznaczonego (marker). Przydatne przy t\u0142umaczeniu dokument\u00f3w po redakcji, w kt\u00f3rych zmiany zaznaczono przed pod\u015bwietlenie kolorem.<\/li>\n<li><strong>LangID<\/strong>: ustawienie j\u0119zyka dla ca\u0142ego dokumentu.<\/li>\n<li><strong>DefLang<\/strong>: ustawienie domy\u015blnego j\u0119zyka.<\/li>\n<\/ul>\n<p>Jak wida\u0107, funkcji jest ca\u0142kiem sporo, a jak to wygl\u0105da w praktyce? C\u00f3\u017c, po u\u017cyciu polecenia PDFFix, dokument z przyk\u0142adu powy\u017cej wygl\u0105da teraz tak:<\/p>\n<div id=\"attachment_358\" style=\"width: 462px\" class=\"wp-caption aligncenter\"><img aria-describedby=\"caption-attachment-358\" decoding=\"async\" loading=\"lazy\" class=\"size-full wp-image-358\" title=\"CodeZapper2_after\" src=\"http:\/\/hell.pl\/wasaty\/blog\/wp-content\/uploads\/2010\/05\/CodeZapper2_after.png\" alt=\"Tekst po wyczyszczeniu za pomoc\u0105 makr Code Zapper.\" width=\"462\" height=\"535\" srcset=\"https:\/\/wasaty.pl\/blog\/wp-content\/uploads\/2010\/05\/CodeZapper2_after.png 462w, https:\/\/wasaty.pl\/blog\/wp-content\/uploads\/2010\/05\/CodeZapper2_after-259x300.png 259w\" sizes=\"(max-width: 462px) 100vw, 462px\" \/><p id=\"caption-attachment-358\" class=\"wp-caption-text\">Tekst po wyczyszczeniu za pomoc\u0105 makr Code Zapper.<\/p><\/div>\n<p>Taki tekst t\u0142umaczy si\u0119 zdecydowanie \u0142atwiej i przyjemniej, programy CAT nie maj\u0105 te\u017c problem\u00f3w z rozpoznawaniem podobie\u0144stw segment\u00f3w. Zwracam r\u00f3wnie\u017c uwag\u0119 na polecenie ImagesOut\/ImagesIn &#8211; zdarzaj\u0105 si\u0119 pliki Worda zawieraj\u0105ce tak du\u017co (du\u017cych) ilustracji, \u017ce nawet przy du\u017cej ilo\u015bci pami\u0119ci system mo\u017ce mie\u0107 problemy ze stabiln\u0105 prac\u0105. Tymczasowe \u201ewyrzucenie\u201d obrazk\u00f3w z t\u0142umaczonego pliku mo\u017ce nam znacznie upro\u015bci\u0107 i przyspieszy\u0107 prac\u0119.<\/p>\n<p>Gdy zwr\u00f3ci\u0142em si\u0119 do Davida Turnera z pro\u015bb\u0105 o zgod\u0119 na umieszczenie CodeZappera na stronie (przewa\u017cnie jest do \u015bci\u0105gni\u0119cia tylko z miejsc wymagaj\u0105cych rejestracji), przys\u0142a\u0142 mi jeszcze jeden zestaw makr &#8211; <strong>FormatFixer<\/strong>. Instaluje si\u0119 go i uruchamia w spos\u00f3b identyczny jak CodeZappera, natomiast makra te przydaj\u0105 si\u0119 g\u0142\u00f3wnie przy pracy z \u017ale przygotowanymi dokumentami tekstowymi. FormatFixer umo\u017cliwia hurtowe usuni\u0119cie podw\u00f3jnych spacji, niepotrzebnych tabulator\u00f3w, spacji przed znakami przestankowymi i nieprawid\u0142owych znak\u00f3w ko\u0144ca akapitu, kt\u00f3re czasami wstawiane s\u0105 przy kopiowaniu tekstu ze stron internetowych.<\/p>\n<p>CodeZapper dost\u0119pny jest bezp\u0142atnie, cho\u0107 autor prosi o przekazanie za po\u015brednictwem PayPala darowizny w wysoko\u015bci 20 Euro w przypadku, gdy osoby korzystaj\u0105ce z niego uznaj\u0105 go za warto\u015bciowe narz\u0119dzie. Moim zdaniem CodeZapper wart jest tej ceny, je\u015bli we\u017amie si\u0119 pod uwag\u0119 ile czasu mo\u017ce nam zaoszcz\u0119dzi\u0107. Aby dokona\u0107 wp\u0142aty, wystarczy skorzysta\u0107 z tego adresu <a href=\"http:\/\/www.asap-traduction.com\/Liens-utiles\" target=\"_blank\">http:\/\/www.asap-traduction.com\/Liens-utiles<\/a>.<\/p>\n<p>Szczeg\u00f3\u0142owe informacje na temat korzystania z obu zestaw\u00f3w makr dost\u0119pne s\u0105 w plikach .dot (wystarczy otworzy\u0107 plik w Wordzie). Dla CodeZappera dost\u0119pna jest te\u017c osobno instrukcja w formacie .doc, zawieraj\u0105ca te same informacje, co w pliku .dot.<\/p>\n<p>Pliki mo\u017cna pobra\u0107 st\u0105d:<\/p>\n<ul>\n<li><a href=\"http:\/\/hell.pl\/wasaty\/Stuff\/CodeZapper%20for%20mq%202_6_3.zip\">CodeZapper ver. 2.6.3<\/a><\/li>\n<li><a href=\"http:\/\/hell.pl\/wasaty\/Stuff\/FormatFixer%201_2.zip\">FormatFixer ver. 1.2<\/a><\/li>\n<\/ul>\n","protected":false},"excerpt":{"rendered":"<p>Tweet Pliki PDF. Wszyscy je kochamy, zw\u0142aszcza t\u0142umaczy\u0107. Na szcz\u0119\u015bcie s\u0105 programy, kt\u00f3re umo\u017cliwiaj\u0105 wydostanie z PDFa tekstu w formie w du\u017cym stopniu zgodnej z uk\u0142adem orygina\u0142u: z zachowaniem czcionek, ich atrybut\u00f3w (pogrubienie, kursywa), podzia\u0142u na akapity, wypunktowania itp. Niestety, ma to swoj\u0105 cen\u0119. Zazwyczaj o ile taki tekst po konwersji do .doc \u201ena oko\u201d &hellip; <\/p>\n<p><a class=\"more-link btn\" href=\"https:\/\/wasaty.pl\/blog\/2010\/05\/25\/codezapper-lekarstwo-na-nadmiar-znacznikow\/\">Continue reading<\/a><\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[3,6],"tags":[12,47,24,29],"_links":{"self":[{"href":"https:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/posts\/356"}],"collection":[{"href":"https:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/comments?post=356"}],"version-history":[{"count":2,"href":"https:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/posts\/356\/revisions"}],"predecessor-version":[{"id":587,"href":"https:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/posts\/356\/revisions\/587"}],"wp:attachment":[{"href":"https:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/media?parent=356"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/categories?post=356"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/tags?post=356"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}