Téma
Data jsou jednou z nejcennějších věcí, které většina institucí má. Jejich skutečnou hodnotu si však často uvědomí až ve chvíli, kdy o ně přijdou. Rostoucí využívání elektronických komunikačních kanálů oproti těm klasickým klade stále větší nároky na uchovávání a ochranu elektronických dat.
Problematika uchovávání, zálohování a ochrany dat byla doposud ostře sledovanou oblastí především v komerčním sektoru. Studie analytické společnosti Gartner Group, provedená na americkém trhu, ukazuje, že téměř polovina firem, postižená ztrátou dat, do pěti let zkrachuje. Zavádění E-governmentu a intenzivnější využívání elektronického podpisu a elektronických podatelen klade stejné nároky na bezpečnost dat i na státní správu a samosprávu. Ztráta důležitých dat sice nezpůsobí krach instituce, ale může mít dalekosáhlé důsledky především ve správních řízeních nebo soudních sporech.
Zálohování vs. archivace
Termín zálohování se používá pro pravidelné uchovávání dat na zvlášť k tomu určená média za účelem jejich obnovy v případě, že dojde k jejich ztrátě na původním úložišti. Cílem zálohování dat je záchrana dat po haváriích a obnova fungování informačních systémů. Oproti tomu archivace znamená trvalé uchování dat za účelem jejich případného pozdějšího využívání. Zatímco zálohování probíhá cyklicky a pro jeho potřeby jsou vhodná vícenásobně přepisovatelná média, pro potřeby archivace je mnohem důležitější životnost uložených dat. Pro tyto účely jsou vhodná nepřepisovatelná média (DVD, CD-ROM).
Plán zálohování
Ochrana dat, označovaná jako storage management, zahrnuje několik různých zálohovacích technologií, přizpůsobených odlišným požadavkům. Před volbou zálohovacího systému je proto vhodné především zvážit, jaká data je třeba zálohovat, jakou kapacitu bude mít úložný prostor (viz Jak spočítat potřebnou kapacitu úložiště), jaký bude nejvhodnější interval záloh, zda povaha dat vyžaduje mít k dispozici pouze aktuální zálohu, či zda je třeba archivovaná data uchovávat ve více zálohách, prováděných po určitých časových intervalech. Z této úvahy potom vyplynou základní požadavky na zálohovací systém, na jejichž základě je možné vybrat optimální technologii. Vždy ale platí, že je třeba vybírat řešení s výhledem do budoucna. Volba systému, neumožňujícího pružně reagovat na zvyšující se požadavky ať už na množství zálohovaných dat či na další vznikající nároky, se dříve či později vymstí v podobě zmařené počáteční investice a zbytečných výdajů na přechod na dokonalejší systém.
Základní zásady
Zálohování je možno pojmout mnoha různými způsoby, od základní práce s jednotlivými soubory až po ukládání kopií celých pevných disků. Jednoduchý princip zálohovat všechno sice může být uživatelsky jednoduchý, na druhou stranu zase zdlouhavý při samotné realizaci a částečně zbytečný. Je proto třeba důkladně posoudit “cenu” dat a vybrat ta důležitá. Zálohování velkého množství menších souborů je možné usnadnit zkomprimováním do jednoho souboru. Výhodné je to především při ukládání především nekomprimovaných formátů jako .doc nebo .xls na disky CD a DVD. Komprimované formáty .jpg nebo .mp3 další komprimací svoji velikost nezmenší. Nejznámější komprimační programy (viz Komprimační programy) disponují ochrannými algoritmy před poškozením souborů a dalšími pokročilými funkcemi. Další možností, jak si zálohování ulehčit, je rozdělení zálohovacího cyklu na plná a částečná zálohování (viz Typy zálohování). Tato metoda šetří čas a prostor na zálohovacích médiích, o něco složitější je potom obnova dat. Při složitějším zálohování, např. při zálohování z více adresářů na různých místech nebo při různých zálohovacích úložištích, je vhodné použít zálohovací manažer, který většinu práce obstará automaticky. Na internetu jsou k dispozici ke stažení jak placené, tak freewarové programy. Nejdůležitější data je vhodné zálohovat dvakrát, z důvodu snížení pravděpodobnosti ztráty dat při poruše jak primárního nosiče, tak zálohovacího média, přičemž jednu kopii je vhodné mít umístěnu na bezpečném místě mimo původní budovu. V bankovním sektoru je zavedená praxe, kdy je jedna kopie převezena do trezoru konkurenční banky. Předchází se tak rizikům spojeným s živelnou katastrofou, která může zničit jak primární data, tak i ten nejsofistikovanější zálohovací systém, jsou-li umístěny ve stejné budově. Obecně platí, že čím cennější jsou data, tím by výběr technologie a jejího dodavatele měl být pečlivější.
Magnetooptická média
Zálohování dat na magnetooptické disky je tou nejjednodušší variantou, vhodnou pro jednotlivce či menší organizace, řádově s jednotkami či málo desítkami počítačů. Ceny vypalovacích mechanik i médií jsou vzhledem k hodnotě ostatního hardwaru zanedbatelné. Stále oblíbené disky CD-R a přepisovatelné CR-RW o kapacitě 700 MB v současnosti vytlačují disky DVD o kapacitě 4,7 GB. DVD disky mají, na rozdíl od CD, několik částečně nekompatibilních formátů. Prvním z nich je DVD+R/RW (RW - přepisovatelný), druhým DVD-R/RW a konečně třetím je formát DVD-RAM. Zatímco první dva formáty jsou kompatibilní pro čtení, pro třetí je třeba vlastnit mechaniku, výslovně umožňující zápis nebo čtení těchto médií. Pro zálohování datových souborů je jednoznačně nejvhodnější formát DVD-RAM, jednak z hlediska delší trvanlivosti záznamu, dále pro širší možnosti manipulace s daty při zálohování, jako např. spojování volného místa na disku atd. Před zakoupením mechaniky je proto dobré věnovat pozornost podporovaným médiím. Disky DVD ještě ani nestačily zcela vytlačit starší CD, výrobci ale už v tuto chvíli připravují masové nasazení další generace magnetooptických médií. Mezi koncerny opět vypukla bitva o jejich formát. Ve hře jsou znovu tři varianty: Blu-ray, HD DVD a FVD. Jejich kapacita se v pohybuje v řádech desítek GB.
Zálohování na pásky
Další zálohovací technologie jsou vhodnější pro náročnější podmínky, jako je požadavek na sdílení přístupu k zálohovaným datům nebo větší objem uchovávaných dat. První z nich je technologie DLT (Digital linear tape). Kazety s magnetickými páskami využívají sofistikovaná zálohovací zařízení jako např. robotické datové knihovny nebo jednodušší autoloadery. Jejich výhodou je vysoká spolehlivost a oproti další technologii – diskovým polím – jednoduché přemístění na bezpečné místo. Páskové systémy je možno dále rozdělit na mechaniky s pevnou a s rotující záznamovou hlavou. Kapacita jednotlivých pásků se opět pohybuje v řádech desítek GB. Na trhu je mnoho formátů těchto kazet. Při výběru dodavatele se vyplatí informovat na jeho zkušenosti s výrobou zálohovacích zařízení a zákaznickou podporu.
Disky a disková pole
Pevný disk je nejvhodnější především pro primární ukládání dat. Disková pole jsou výhodná především díky vysoké kapacitě, nízké pořizovací ceně a především v možnosti zálohovat data takřka v reálném čase. Pomocí speciálního softwaru jsou primární data okamžitě po jejich zapsání do primárního úložiště zkopírována na zálohovací disk. Poruchám disků, které vzhledem k jejich životnosti není možné v delším časovém horizontu zabránit, lze předcházet replikováním dat na více kopií najednou. Zálohování na pevný disk je možné aplikovat i na menší sítě bez nutnosti vysokých nákladů na nákup speciálního hardwaru v podobě např. magnetopáskové knihovny. Běžně používané operační systémy už obsahují podporu protokolu RAID umožňujícího budování diskových polí na standardních počítačích. Hlavním nákladem na pořízení tohoto systému je kromě hardwaru software sloužící k automatickému zálohování.
Úplný text je v časopise Veřejná správa č. 42/2005.
Jak spočítat potřebnou kapacitu úložiště Kapacita zálohovacího úložiště je základním parametrem při tvorbě zálohovacího systému. Množství dat v globálním objemu roste ročně o 60 procent. Potřebná kapacita úložného prostoru lze spočítat následujícím vzorcem: C=d x(1+p%)n C – celková kapacita pole |
Komprimační programy ARJ, autor ARJ Software, Inc.,
www.arjsoftware.com |
Typy zálohování Plné zálohování - Archivace všech souborů ve vybraném adresáři. Přírůstkové zálohování – Zálohování souborů, změněných od minulého zálohování. Rozdílové zálohování - Zálohování souborů změněných nebo vytvořených od posledního plného zálohování ukládá se tedy rozdíl změn od poslední plné zálohy. Výhodou přírůstkového zálohování proti rozdílovému jsou menší kapacitní nároky na zálohovací média. Další rozdíl mezi přírůstkovým a rozdílovým zálohováním pocítíme při obnově všech dat. Při rozdílovém zálohování stačí plná záloha a poslední rozdílová záloha. Naopak při přírůstkovém zálohování je pro plnou obnovu třeba poslední plná záloha a všechny pozdější přírůstkové zálohy. |