Tato stránka je stručným návodem pro studenty, kteří při psaní závěrečných prací v Latexu bojují s požadavkem odevzdat práci ve formátu PDF/A. Zdrojem pro tento návod je několik WWW stránek (viz. níže), včetně oficiální stránky MFF UK, která se věnuje problematice PDF/A také pro jiné textové editory než je Latex: https://www.cuni.cz/UK-7987.html
Doporučený postup:
- Vyhněte se použití online PDF/A konvertorů – často nefungují a nebo problematické pasáže převedou na screenshot, který učiní výsledné PDF ještě hůře strojově čitelné !
- Používejte pdflatex verze alespoň 3.14159265-2.6-1.40.17 (TexLive 2016).
- Pro validaci vygenerovaného PDF souboru použijte:
- buď přímo SIS (ale tam validace chvíli trvá),
- nebo online validátor Národního archivu (zvolte formát PDF/A-2u),
- nebo si stáhněte přímo validátor veraPDF používaný SISem, a využijte UK validační profil ze stránky https://www.cuni.cz/UK-7987.html (XML soubor).
- Používejte doporučenou MFF Latex šablonu:
- Bc. / Mgr. / PhD.
- Podle instrukcí v README v šabloně si stáhněte nejnovější verzi pdfx a rozbalte ji do pod-adresáře tex v šabloně (tedy adresářová struktura bude vzor-bc/tex/pdfx/…).
- Zachovejte v šabloně formát PDF/A-2u, který je méně restriktivní ohledně výsledného dokumentu.
- Otestujte, že šablona generuje validní PDF/A (make projde bez chyb a výsledné PDF projde validací).
- Častý zdrojem problémů s PDF/A jsou obrázky:
- Testujte je samostatně tak, že použijete čistou MFF Latex šablonu a do ní přidáte testovaný obrázek.
- Pokud obrázek způsobuje problémy s PDF/A, zkuste obrázek (nikoliv celou práci!) opravit pomocí Ghostscriptu příkazem:
- gs -q -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -dPDFA=2 -sColorConversionStrategy=RGB -dOverrideICC=true -sOutputFile=output.pdf input.pdf
- (nebo ve starších verzích Ghostscriptu: gs -q -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -dPDFSETTINGS=/prepress -sColorConversionStrategy=RGB -dOverrideICC=true -sOutputFile=output.pdf input.pdf)
- nebo použijte online konvertor z https://kam.mff.cuni.cz/pdfix/, který umí navíc převést text na čáry, což se může hodit v případě problematických fontů (v ghostscriptu se jedná o parameter -dNoOutputFonts).
- Typicky v obrázcích chybí použité fonty, výše zmíněný příkaz je tam přidá (testovat to lze příkazem pdffonts figure.pdf).
- Pokud máte originální obrázek jako bitmapu (PNG, JPG), nekonvertujte ho do PDF, ale ponechte původní bitmapový formát.
- Pokud výše zmíněné konverze nepomohou, konvertujte originální obrázek do bitmapy s vysokým rozlišením.
- Dalším častým problém bývají nestandardní matematické znaky, kdy validátor vyhodí chybovou hlášku obsahující unknown unicode nebo missing key ToUnicode. Nezbývá, než zkusit znak nahradit podobným, který projde. Je dobré testovat práci průběžně, aby se lépe identifikovalo, kde se problematický znak nachází (PS: Validátoru nevadí nefunkční reference, takže lze testovat např. samostatně jednotlivé kapitoly).
- Pokud máte v názvech kapitol matematické výrazy, napovězte Latexu čím je má nahradit v interaktivní osnově obsahu výsledného PDF, viz. např.:
- \section{Analysis of \texorpdfstring{$B^0_s \to \mu^-\mu^+$}{B0s->mu+mu-} decay}
- Pokud potřebujete do práce připojit PDF článku apod., který nesplňuje formát PDF/A, nahrajte ho do SISu jako externí přílohu, která bude s prací svázaná (PS: Externí příloha vyžaduje ruční schválení, které v SISu může chvíli trvat).
Externí zdroje:
- Návod MFF UK: https://www.cuni.cz/UK-7987.html
- Návod MFF UK pro Latex: https://mj.ucw.cz/vyuka/bc/pdfaq.html
- Návod s použitím Adobe Acrobat: https://www.mathstat.dal.ca/~selinger/pdfa