{"id":585,"date":"2011-08-31T18:49:32","date_gmt":"2011-08-31T17:49:32","guid":{"rendered":"http:\/\/wasaty.pl\/blog\/?p=585"},"modified":"2011-08-31T19:04:28","modified_gmt":"2011-08-31T18:04:28","slug":"tlumaczenie-plikow-pdf-wreszcie-dobra-wiadomosc","status":"publish","type":"post","link":"https:\/\/wasaty.pl\/blog\/2011\/08\/31\/tlumaczenie-plikow-pdf-wreszcie-dobra-wiadomosc\/","title":{"rendered":"T\u0142umaczenie plik\u00f3w PDF &#8211; wreszcie dobra wiadomo\u015b\u0107"},"content":{"rendered":"<div style=\"float: right; margin-left: 10px;\"><a href=\"https:\/\/twitter.com\/share\" class=\"twitter-share-button\" data-via=\"Wasaty\" data-count=\"vertical\" data-url=\"https:\/\/wasaty.pl\/blog\/2011\/08\/31\/tlumaczenie-plikow-pdf-wreszcie-dobra-wiadomosc\/\">Tweet<\/a><\/div>\n<p><a href=\"http:\/\/wasaty.pl\/blog\/wp-content\/uploads\/2011\/08\/Infix_logo.png\"><img decoding=\"async\" loading=\"lazy\" class=\"alignleft size-full wp-image-595\" title=\"Infix_logo\" src=\"http:\/\/wasaty.pl\/blog\/wp-content\/uploads\/2011\/08\/Infix_logo.png\" alt=\"\" width=\"80\" height=\"80\" \/><\/a>Z problemem t\u0142umaczenia plik\u00f3w PDF zetkn\u0119\u0142a si\u0119 chyba wi\u0119kszo\u015b\u0107 t\u0142umaczy &#8211; klient przysy\u0142a PDF, bo przecie\u017c \u201etylko taki plik posiada\u201d i \u201enie da si\u0119\u201d uzyska\u0107 formatu \u017ar\u00f3d\u0142owego. C\u00f3\u017c, w takiej sytuacji zazwyczaj wypada zakasa\u0107 r\u0119kawy i bra\u0107 si\u0119 do konwersji. Albo nie &#8211; pojawi\u0142o si\u0119 bowiem stosunkowo nowe narz\u0119dzie umo\u017cliwiaj\u0105ce zupe\u0142nie nowe podej\u015bcie do t\u0142umaczenia plik\u00f3w PDF &#8211; <a href=\"http:\/\/www.iceni.com\/infix.htm\">Infix firmy Iceni<\/a>.<\/p>\n<p><!--more-->Tradycyjnie t\u0142umaczenie plik\u00f3w PDF wi\u0105\u017ce si\u0119 z zastosowaniem konwertera PDF\u00f3w, zmieniaj\u0105cego plik PDF w form\u0119 edytowaln\u0105 (zazwyczaj plik .DOC). Z moich do\u015bwiadcze\u0144 wynika, \u017ce konwertery dziel\u0105 si\u0119 na dobre, takie sobie i darmowe. Osobi\u015bcie do konwersji stosuj\u0119 dwa programy komercyjne &#8212; <a href=\"http:\/\/www.nitropdf.com\/\">NitroPDF<\/a> oraz <a href=\"http:\/\/www.iceni.com\/gemini.htm\">Gemini<\/a>. Oba maj\u0105 mocniejsze i s\u0142absze strony &#8211; np. NitroPDF lepiej radzi sobie ze z\u0142o\u017conym uk\u0142adem tekstu i tabelami, za to Gemini lepiej sprawdza si\u0119 przy d\u0142ugich blokach tekstu, wstawiaj\u0105c mniej zb\u0119dnych podzia\u0142\u00f3w wierszy. Nast\u0119pny etap pracy polega na usuni\u0119ciu z tekstu ukrytych znacznik\u00f3w (u\u017cywaj\u0105c <a href=\"http:\/\/wasaty.pl\/blog\/2010\/05\/25\/codezapper-lekarstwo-na-nadmiar-znacznikow\/\">CodeZappera<\/a> lub memoQ). Potem trzeba poprawi\u0107 formatowanie, nanie\u015b\u0107 style, wygenerowa\u0107 prawdziwy spis tre\u015bci&#8230; Wreszcie dochodzimy do t\u0142umaczenia, po kt\u00f3rym generujemy plik w j\u0119zyku docelowym i jeszcze raz poprawiamy formatowanie, dopieszczaj\u0105c wszelkie niedor\u00f3bki. Ca\u0142a procedura przygotowywania dokumentu i jego <em>de facto<\/em> sk\u0142adania mo\u017ce trwa\u0107 nawet kilka dni (dla zainteresowanych &#8211; oferuj\u0119 tak\u0105 us\u0142ug\u0119). Na dodatek klient nie zawsze chce p\u0142aci\u0107 za czas po\u015bwi\u0119cony na przygotowanie tekstu. Czy nie ma na to rady?<\/p>\n<p>Ot\u00f3\u017c jest. Program <strong>Infix<\/strong> firmy Iceni oferuje zupe\u0142nie nowe podej\u015bcie do problemu t\u0142umaczenia plik\u00f3w PDF. Je\u015bli przyjrze\u0107 si\u0119 strukturze pliku PDF oka\u017ce si\u0119, \u017ce zawiera on tekst oraz informacje dotycz\u0105ce jego formatowania i u\u0142o\u017cenia na stronie. Czemu wi\u0119c nie wyci\u0105gn\u0105\u0107 samego tekstu, zachowuj\u0105c informacje o jego uk\u0142adzie? Taki tekst mo\u017cna by przet\u0142umaczy\u0107, a nast\u0119pnie zaimportowa\u0107 z powrotem, podstawiaj\u0105c na miejsce orygina\u0142u.<\/p>\n<p>I dok\u0142adnie tak\u0105 funkcj\u0119 oferuje Infix. Po otwarciu pliku PDF mo\u017cemy skorzysta\u0107 z funkcji <strong>Translate<\/strong> z menu <strong>Document<\/strong>, gdzie mamy mo\u017cliwo\u015b\u0107 wyeksportowania tre\u015bci dokumentu do pliku TXT lub XML. Sugeruj\u0119 skorzystanie z formatu XML, poniewa\u017c du\u017co \u0142atwiej mo\u017cna go potem zaimportowa\u0107 do programu CAT. W przypadku programu memoQ plik nale\u017cy otworzy\u0107 korzystaj\u0105c ze standardowych ustawie\u0144 fitra XML &#8211; w wi\u0119kszo\u015bci wypadk\u00f3w wystarczy u\u017cy\u0107 funkcji <strong>Populate<\/strong> z domy\u015blnymi ustawieniami, a w przypadku nadmiaru znacznik\u00f3w w tek\u015bcie mo\u017cna si\u0119 ich \u0142atwo pozby\u0107 modyfikuj\u0105c ustawienia filtra. Po przet\u0142umaczeniu tekstu w ulubionym programie CAT generujemy plik wynikowy, kt\u00f3ry importujemy do oryginalego pliku PDF. Tekst \u017ar\u00f3d\u0142owy zostaje zast\u0105piony naszym t\u0142umaczeniem, z zachowaniem formatowania i uk\u0142adu. Proste i genialne.<\/p>\n<div id=\"attachment_589\" style=\"width: 501px\" class=\"wp-caption aligncenter\"><a href=\"http:\/\/wasaty.pl\/blog\/wp-content\/uploads\/2011\/08\/Infix_1.png\"><img aria-describedby=\"caption-attachment-589\" decoding=\"async\" loading=\"lazy\" class=\"size-full wp-image-589\" title=\"Infix_1\" src=\"http:\/\/wasaty.pl\/blog\/wp-content\/uploads\/2011\/08\/Infix_1.png\" alt=\"\" width=\"501\" height=\"401\" srcset=\"https:\/\/wasaty.pl\/blog\/wp-content\/uploads\/2011\/08\/Infix_1.png 501w, https:\/\/wasaty.pl\/blog\/wp-content\/uploads\/2011\/08\/Infix_1-300x240.png 300w\" sizes=\"(max-width: 501px) 100vw, 501px\" \/><\/a><p id=\"caption-attachment-589\" class=\"wp-caption-text\">Przet\u0142umaczony tekst zaimportowany do oryginalnego PDFa. Bez profesjonalnego programu do sk\u0142adu stworzenie takiej tabeli nie jest trywialne. (Rozmycie dodane w celu ukrycia zastrze\u017conych nazw).<\/p><\/div>\n<p>Oczywi\u015bcie, nic nie jest idealne. Po pierwsze, nale\u017cy zwr\u00f3ci\u0107 uwag\u0119 na czcionki. Je\u015bli dokument \u017ar\u00f3d\u0142owy zosta\u0142 przygotowany z u\u017cyciem standardowych font\u00f3w pakietu MS Office, nie powinno by\u0107 z nim problem\u00f3w, jednak u\u017cycie rzadszych czcionek mo\u017ce prowadzi\u0107 do konieczno\u015bci r\u0119cznego przypisania odpowiednik\u00f3w z w\u0142a\u015bciwym zakresem znak\u00f3w. Trzeba przyzna\u0107, \u017ce Infix sprawuje si\u0119 tu bardzo dobrze &#8211; w przypadku problem\u00f3w, dla ka\u017cdej czcionki u\u017cytej w dokumencie wy\u015bwietla list\u0119 brakuj\u0105cych znak\u00f3w, umo\u017cliwiaj\u0105c wybranie zast\u0119pnika &#8211; najlepiej jedn\u0105 z czionek unikodowych (np. Arial Unicode MS). Problem mo\u017cna te\u017c zignorowa\u0107, jednak wtedy brakuj\u0105ce znaki zostan\u0105 pomini\u0119te.<\/p>\n<p>Drugi problem przy imporcie t\u0142umaczenia wi\u0105\u017ce si\u0119 ze zmian\u0105 obj\u0119to\u015bci tekstu &#8211; w przypadku pary EN-PL t\u0142umaczenie zazwyczaj ma obj\u0119to\u015b\u0107 wi\u0119ksz\u0105 od orygina\u0142u. Tutaj mamy do wyboru dwie opcje &#8211; automatyczne dopasowanie tekstu, b\u0105d\u017a r\u0119czne nanoszenie poprawek. Je\u015bli zdecydujemy si\u0119 na skorzystanie z automatu, program w razie potrzeby nieznacznie zmniejszy wielko\u015b\u0107 czcionek tak, by tekst zmie\u015bci\u0142 si\u0119 w oryginalnej ramce tekstowej. Trzeba przyzna\u0107, \u017ce w przypadku wi\u0119kszych blok\u00f3w tekstowych zmiana nie rzuca si\u0119 w oczy i musia\u0142em uwa\u017cnie por\u00f3wna\u0107 stron\u0119 z orygina\u0142em, by odkry\u0107 spos\u00f3b dopasowywania tekstu. Alternatywnym rozwi\u0105zaniem jest r\u0119czne dopasowywanie wielko\u015bci ramek tekstowych tak, by widoczny by\u0142 ca\u0142y tekst &#8211; warto przy tym wspomnie\u0107, \u017ce Infix bardzo dobrze radzi sobie z funkcj\u0105 \u201ereflow\u201d &#8211; dopasowaniem tekstu do ramki.<\/p>\n<div id=\"attachment_590\" style=\"width: 510px\" class=\"wp-caption aligncenter\"><a href=\"http:\/\/wasaty.pl\/blog\/wp-content\/uploads\/2011\/08\/Infix_2.png\"><img aria-describedby=\"caption-attachment-590\" decoding=\"async\" loading=\"lazy\" class=\"size-full wp-image-590\" title=\"Infix_2\" src=\"http:\/\/wasaty.pl\/blog\/wp-content\/uploads\/2011\/08\/Infix_2.png\" alt=\"\" width=\"510\" height=\"509\" srcset=\"https:\/\/wasaty.pl\/blog\/wp-content\/uploads\/2011\/08\/Infix_2.png 510w, https:\/\/wasaty.pl\/blog\/wp-content\/uploads\/2011\/08\/Infix_2-150x150.png 150w, https:\/\/wasaty.pl\/blog\/wp-content\/uploads\/2011\/08\/Infix_2-300x300.png 300w\" sizes=\"(max-width: 510px) 100vw, 510px\" \/><\/a><p id=\"caption-attachment-590\" class=\"wp-caption-text\">Przet\u0142umaczony tekst wstawiony do oryginalnego PDFa z opcj\u0105 automatycznego dopasowania wielko\u015bci tekstu. Czas po\u015bwi\u0119cony na sk\u0142ad - 0 minut.<\/p><\/div>\n<p>Jak wida\u0107 na przyk\u0142adach powy\u017cej, mo\u017cna dzi\u0119ki programowi zaoszcz\u0119dzi\u0107 sporo czasu. \u015awietnie sprawdza si\u0119 w tabelach i nieskomplikowanym sk\u0142adzie, idealnie w podr\u0119cznikach obs\u0142ugi z du\u017c\u0105 ilo\u015bci\u0105 pustego miejsca na stronach. Powa\u017cne problemy pojawiaj\u0105 si\u0119 tylko przy tekstach o niestandardowych czcionkach oraz takich, w kt\u00f3rych jest bardzo ma\u0142o miejsca na \u201epuchni\u0119cie\u201d tekstu.<\/p>\n<p>Warto doda\u0107, \u017ce mo\u017cliwo\u015b\u0107 eksportu tekstu i importu t\u0142umaczenia to nie jedyne funkcje programu Infix &#8211; mo\u017cna go u\u017cy\u0107 do zwyk\u0142ej edycji plik\u00f3w PDF &#8211; wystarczy wybra\u0107 narz\u0119dzie tekstowe, by swobodnie modyfikowa\u0107 tekst, lub korzystaj\u0105c z innych narz\u0119dzi przenosi\u0107, skalowa\u0107 lub przycina\u0107 obiekty graficzne. Dost\u0119pna jest te\u017c funkcja korekty dokument\u00f3w po OCR &#8211; w tym trybie zmniejszany jest kontrast element\u00f3w graficznych, co u\u0142atwia wy\u015bwietlanie i edycj\u0119 tekstu. Ponadto mo\u017cliwe jest \u0142\u0105czenie r\u00f3\u017cnych plik\u00f3w PDF i jeszcze par\u0119 ciekawych funkcji, z kt\u00f3rymi warto zapozna\u0107 si\u0119 samemu.<\/p>\n<p>Program dost\u0119pny jest w wersji demo, w kt\u00f3rej mo\u017cna dowolnie korzysta\u0107 z wszystkich funkcji z jednym ograniczeniem &#8211; zapisane pliki PDF posiadaj\u0105 znak wodny (wida\u0107 go na obu ilustracjach). Co ciekawe, \u017ceby m\u00f3c zapisa\u0107 plik bez znaku wodnego, nie trzeba kupowa\u0107 pe\u0142nej wersji programu &#8212; dost\u0119pna jest funkcja \u201ePay &amp; Save\u201d &#8211; za 30 dolar\u00f3w mo\u017cna kupi\u0107 mo\u017cliwo\u015b\u0107 trzykrotnego zapisania dokumentu bez znaku wodnego, co daje 10$ za zmodyfikowany dokument. Przy czym plik mo\u017cna przerabia\u0107 dowoln\u0105 liczb\u0119 razy, zapisuj\u0105c ze znakiem wodnym, a dopiero po osi\u0105gni\u0119ciu jego ostatecznej postaci skorzysta\u0107 z funkcji p\u0142atnego zapisu bez znaku wodnego.<\/p>\n<p>Zdecydowanie polecam program <a href=\"http:\/\/www.iceni.com\/infix.htm\">Infix<\/a> wszystkim maj\u0105cym do czynienia z t\u0142umaczeniem plik\u00f3w PDF &#8211; nie jest rozwi\u0105zaniem na ka\u017cd\u0105 ewentualno\u015b\u0107, ale niew\u0105tpliwie mo\u017ce bardzo u\u0142atwi\u0107 \u017cycie w niekt\u00f3rych sytuacjach.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Tweet Z problemem t\u0142umaczenia plik\u00f3w PDF zetkn\u0119\u0142a si\u0119 chyba wi\u0119kszo\u015b\u0107 t\u0142umaczy &#8211; klient przysy\u0142a PDF, bo przecie\u017c \u201etylko taki plik posiada\u201d i \u201enie da si\u0119\u201d uzyska\u0107 formatu \u017ar\u00f3d\u0142owego. C\u00f3\u017c, w takiej sytuacji zazwyczaj wypada zakasa\u0107 r\u0119kawy i bra\u0107 si\u0119 do konwersji. Albo nie &#8211; pojawi\u0142o si\u0119 bowiem stosunkowo nowe narz\u0119dzie umo\u017cliwiaj\u0105ce zupe\u0142nie nowe podej\u015bcie do &hellip; <\/p>\n<p><a class=\"more-link btn\" href=\"https:\/\/wasaty.pl\/blog\/2011\/08\/31\/tlumaczenie-plikow-pdf-wreszcie-dobra-wiadomosc\/\">Continue reading<\/a><\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[3],"tags":[47,24,50],"_links":{"self":[{"href":"https:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/posts\/585"}],"collection":[{"href":"https:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/comments?post=585"}],"version-history":[{"count":6,"href":"https:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/posts\/585\/revisions"}],"predecessor-version":[{"id":596,"href":"https:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/posts\/585\/revisions\/596"}],"wp:attachment":[{"href":"https:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/media?parent=585"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/categories?post=585"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/wasaty.pl\/blog\/wp-json\/wp\/v2\/tags?post=585"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}