Týdeník Veřejná správa


 e-government

Ing. Ivan Zderadička

Elektronické dokumenty a dlouhodobé uchovávání

Vyšlo v čísle 35/2007

S pokračujícím rozvojem informačních technologií a s jejich nepřetržitým Foto: Radoslav Bernatpronikáním do všech oborů lidské činnosti se dostává do popředí otázka jejich dlouhodobého uchování (archivace). V současné době již řada dokumentů vzniká pouze v elektronické podobě, ať již se jedná o klasické textové dokumenty, či zvukové a obrazové záznamy, které lze také zahrnout do širšího vnímání kategorie elektronických dokumentů. Potřeby jejich dlouhodobého uchování vyplývají jednak z legislativních požadavků, jednak z případné historické hodnoty obsahu elektronického dokumentu.

Dokumenty existující v papírové formě jsou často převáděny do formy elektronické z důvodu jejich snadnějšího zpracování. Požadovaná doba uchovávání elektronických dokumentů může přesahovat desítky let a pro určité skupiny dokumentů může vyvstat nutnost neomezeného uložení. Dále předpokládáme uložení dokumentů pouze v digitální podobě, která poskytuje značné výhody z hlediska nákladů a zpracovatelnosti uložených dokumentů.

Jak předejít problémům
Výše uvedené požadavky přináší několik klíčových problémů, které systémy dlouhodobého uchování elektronických dokumentů musí řešit. Jedná se především o faktor stárnutí informačních technologií, který zasahuje jak datová média, na kterých jsou dokumenty uloženy, tak i počítačové systémy (týká se hardwaru i softwaru), na kterých byly dokumenty vytvořeny. Zde se jedná o tzv. morální stárnutí, kdy jsou stávající systémy nahrazovány novými, které již nemusí být schopny zpracovat starší dokumenty. Aby se předešlo problémům, kdy elektronické dokumenty nebudeme moci v budoucnosti použít, musí organizace zodpovědné za dlouhodobé uchování dokumentů plánovat vhodné strategie (a na ně navazující praktická opatření), které zabrání znehodnocení elektronických dokumentů v budoucnosti. V současné době v této oblasti existují dva hlavní směry:

Zmiňované strategie nejsou vzájemně se vylučující, například je možné, že organizace použije na nějaké formáty dokumentů jednu strategii a na další jinou. Je však zřejmé, že vhodná spolupráce mezi původcem dokumentu a archivem při tvorbě a uplatnění těchto strategií hraje klíčovou roli. Volbou vhodných formátů již při vytváření dokumentů lze značně usnadnit dlouhodobé uchování a výrazně snížit náklady s tím spojené. Původce dokumentu by proto měl brát na zřetel vlastnosti elektronických dokumentů z hlediska dlouhodobého uchování a zohlednit je při výběru svého informačního řešení.

Jaké zvolit formáty
Při volbě vhodných formátů je třeba vzít v úvahu dvě hlavní skupiny faktorů - jednak ty, které se vztahují ke kvalitě nebo speciální funkcionalitě zobrazení obsahu dokumentu a pak ty, které ovlivňují trvanlivost digitálního formátu. Jako prvotní při posuzování určitého formátu je nutné zvážit, zda je schopen uchovat a podat obsah elektronického dokumentu v takové reprezentaci, která bude vyhovovat jak současným, tak i budoucím uživatelům. Je nutné zvážit všechna potenciální možná budoucí využití dokumentu, a to kvalitu reprezentace (například maximální rozlišení, barevná věrnost u obrázků, minimální zkreslení u zvukových záznamů), a speciální funkcionalitu, kdy je zapotřebí určitá interakce s uživatelem (třeba zvětšení a zmenšení u obrázků nebo zastavení a zpětné převinutí u video záznamů). Výše uvedené faktory se mění podle žánru a v daném žánru též v závislosti na formě. Podstatné charakteristiky jsou jiné pro textový dokument, zvuk, obraz nebo video.

Pro statické obrázky budou například důležité následující skutečnosti:

Co je důležité pro trvanlivost elektronických dokumentů
Při posuzovaní trvanlivosti digitálního formátu dokumentu je vhodné vyjít z definované sady vlastností, které lze snadno ověřit pro různé dostupné formáty, bez závislosti na přesných technických a obsahových detailech. Literatura uvádí sedm faktorů, které mohou být pro hodnocení použity: otevřenost formátu, rozšířenost, transparentnost, sebedokumentace, vnější závislosti, vliv patentů a ochranné mechanismy.
Uchování obsahu v daném formátu není možné bez detailní znalosti toho, jak jsou ve formátu ukládány informace na úrovni jednotlivých bitů a bytů. Otevřenost tedy znamená, že detailní specifikace formátu je veřejně dostupná (nejde zde ani tak o nutnost standardizace jako spíše o širokou dostupnost kvalitního a kompletního popisu formátu dokumentu). Tato znalost je velmi důležitá pro možnost ověření integrity formátu ukládaného dokumentu. Pro neproprietární, otevřené formáty jsou většinou validační nástroje a podrobná dokumentace formátu lépe dostupné než pro formáty proprietární, kdy je jejich dostupnost omezena.
Rozšířenost odkazuje na stupeň rozšíření využívání formátu zainteresovanými uživateli a tvůrci obsahu. Značná rozšířenost formátu snižuje pravděpodobnost jeho rychlého zastarání. Pro rozšířený formát je větší pravděpodobnost vzniku migračních a emulačních nástrojů v rámci IT průmyslu, bez nutnosti, aby se archivní instituce na vzniku těchto nástrojů přímo podílela. Dobrými kritérii rozšířenosti formátu je standardní dodávka nástrojů pro práci s daným formátem přímo s PC, nativní podpora formátu přímo ve webových prohlížečích nebo existence řady konkurenčních produktů pro tvorbu obsahu, manipulaci s obsahem či získávání obsahu z daného formátu.

Úplný text je v časopise Veřejná správa č. 35/2007.

Poznámka
Tento článek vznikl v rámci účelové podpory Ministerstva informatiky na projekt č. YA512006002 „Dlouhodobé uchovávání elektronických dokumentů se zaručeným elektronickým podpisem“.