ABBYY FineReader – tipy a nápady pro překladatele a editory
Jelikož naše společnost používá pro překlad naprosté většiny dokumentů CAT nástroje, musíme často provádět převod dokumentů dodaných v needitovatelné podobě přes tzv. OCR programy (optické rozpoznávání znaků, z anglického Optical Character Recognition). Jako ideálním pomocníkem se jeví program ABBYY FineReader.
Narážíme ovšem na problémy s formátováním. V závislosti na nastavení způsobu převodu se FineReader pokusí výsledný text naformátovat sám, ovšem postupuje při tom poměrně neohrabaně a výsledný text bývá sice opticky věrnou kopií předlohy, ovšem pro další editování poměrně nepřizpůsobivou (texty jsou rozděleny do množství oddílů, textových polí, sloupců, apod.).
Po exportu z ABBYY do Wordu (bez formátování) je třeba provést několik kroků:
- Zrušit stínování, respektive nastavit stínování na „žádné“. ABBYY automaticky nastaví stínování na „bílé“, což na bílé stránce nepoznáme, ale některé CAT nástroje, např. Wordfast, s tím mají potom problémy.
- Zrušit dvojité mezery, pomocí CTRL+H. ABBYY bohužel neformátuje odsazení pomocí tabulátorů, ale mezerami. Pro další práci je třeba dvojité mezery odstranit a k formátování použít tabulátory a posuvníky.
- Zrušit zalomení stránek a oddílů.
- Označit celý text a zvolit jeden druh fontu (druh a velikost písma), podle toho, který styl v textu převládá. ABBYY totiž někdy přiřadí textu, který je v originále psaný stejnou velkostí písma, různou velikost fontu (např. část udělá jako velikost 10,5 a část jako 11, čehož si třeba při formátování ani nevšimnete, ale celkově to pak nevypadá dobře). Proto doporučujeme vždy vyjít z jednoho druhu a jedné velikosti písma a pak pokračoval dál.
- Pokračovat formátováním textu, tzn. především nadpisy (případně včetně stylů, pokud je součástí textu obsah), sloupce, apod.
- Pozor na texty, které mají být v záhlaví a zápatí a na čísla stránek ABBYY vše automaticky vkládá do textu
Specifickým problémem jsou tabulky:
- ABBYY některé texty nerozpozná jako tabulku a převede je jako prostý text, pak musí následovat složité formátování ve Wordu, tzn. tabulky vytvářet a vkládat do nich obsah. To lze vyřešit přímo v ABBYY – označením příslušné části textu a změnou „Change Block Type“ na „Table“ a novým načtením bloku. Ve verzi ABBYY 8 je bohužel jedna chyba – při exportu se nově načtené části textu posunou na konec příslušné stránky, tabulku je potom při formátování ve Wordu potřeba vyjmout a umístit na správné místo.
- ABBYY špatně rozpoznává buňky, někdy vloží text, který má být ve více řádcích, do jedné buňky, někde naopak jednu buňku s textem na více řádcích převede tak, že ve Wordu z toho vznikne několik buněk pod sebou. To lze vyřešit přímo v ABBYY tak, že označíte příslušné buňky a kliknutím na pravé tlačítko vyberete Table cells -> a jednu z možností Split cells, Merge cells nebo Merge rows.
- ABBYY při exportu do Wordu nastaví pevnou šířku řádků buněk, což potom činí problémy při práci s Wordfastem a veškerém editování (při prodloužení textu). Proto je ideální všechny tabulky označit a změnit nastavení výšky řádku na „nejméně“.
- ABBYY vytváří tabulky tak, že vnější ohraničení tabulky udělá tlustší čarou než vnitřek. Je dobré na to při formátování textu ve Wordu pamatovat a vždycky ohraničení sjednotit.
Autor: Václav Baláček
Komentáře

Po exportu z ABBYY do Wordu (bez formátování) …
V které verzi jste to dělal? Já jsem na možnost bez formátování nenarazil.
F. Sousedik
V anglické verzi je to „plain text“ – pod Tools – Options – 3. Save
Nejoblíbenější články
Kategorie