Wróć do informacji o e-podręczniku Wydrukuj Pobierz materiał do PDF Pobierz materiał do EPUB Pobierz materiał do MOBI Zaloguj się, aby dodać do ulubionych Zaloguj się, aby skopiować i edytować materiał Zaloguj się, aby udostępnić materiał Zaloguj się, aby dodać całą stronę do teczki

Czym jest archiwum? Z tym pojęciem dość często spotykamy się w życiu codziennym. Osobom niezwiązanym z informatyką zazwyczaj kojarzy się ono ze zbiorem dokumentów z dawnych lat, przechowywanych w teczkach i segregatorach w ogromnych szafach, w specjalnych pomieszczeniach.

Informatyczna definicja archiwum jest analogiczna do tej, jaką znamy z życia codziennego. Odnosi się do zbioru danych, plików i programów zapisanych w odpowiednim formacie i przechowywanych na nośnikach danych (dyski zewnętrzne, serwery NASserwer NASserwery NAS), które są odpowiednio zabezpieczone.

Archiwum danych
Definicja: Archiwum danych

To zbiór plików i katalogów, zapisanych w odpowiednim dla programu archiwizującego formacie, które przechowuje się na zewnętrznych nośnikach danych w celu ich zabezpieczenia. Popularne programy do archiwizacji danycharchiwizacja danycharchiwizacji danych to WinRAR oraz 7zip.

Przykłady zastosowania archiwów:

  • przedsiębiorstwo informatyczne przechowuje w nich faktury z lat ubiegłych;

  • firma księgowa zabezpiecza w ten sposób dane swoich klientów z wcześniejszych okresów rozliczeniowych;

  • szkoła archiwizuje dzienniki lekcyjne z poprzednich roczników.

Ważne!

Elektroniczne archiwa danych ułatwiają również tworzenie przez administratorów systemów informatycznych kopii danych, wykorzystywanych w firmach oraz instytucjach. Z punktu widzenia systemu operacyjnego archiwum widoczne jest jako jeden plik, jeden obiekt, dzięki czemu łatwo je zabezpieczyć i przenieść.

Ciekawostka

Archiwa, czyli „paczki danych”, mają jeszcze inne zastosowanie. Za ich pomocą możemy rozpowszechniać i dystrybuować oprogramowanie. W wypadku systemów operacyjnych opartych na jądrze Linux częstym nośnikiem oprogramowania lub jego aktualizacji są właśnie archiwa.

Archiwizacja danych w systemie Linux

Przyjrzyjmy się teraz, jakie polecenia pozwolą nam tworzyć archiwa, sprawdzać ich zawartość, dodawać do nich nowe pliki i rozpakowywać je - czyli ogólnie mówiąc, zarządzać nimi.

Ważne!

W systemach opartych na jądrze Linux podstawowym i najpopularniejszym programem do zarządzania archiwami poprzez terminal jest tar.

Ćwiczenie 1

Utworzenie archiwum danych z plików zapisanych w katalogu dokumenty.

Potrzebne polecenia i dodatkowe opcje:

  • tar – program/polecenie do zarządzania archiwami,

  • -c – opcja programu tar pozwalająca utworzyć archiwum,

  • -f – opcja programu tar pozwalająca wskazać/nadać nazwę archiwum.

Korzystając z programu tar oraz opcji dodatkowych, utwórzmy archiwum katalogu dokumenty o nazwie archwium_dokumenty:

tar -cf dokumenty_archiwum.tar dokumenty

Polecenie utworzyło nowy plik o nazwie dokumenty_archiwum.tar z zawartością katalogu dokumenty.

Ważne!

Opcję -f stosuje się, gdy tworzymy nowe archiwum, ale również wtedy, kiedy dokonujemy modyfikacji już istniejącego archiwum (przykład w ćwiczeniu nr 2).

Ważne!

Tworząc archiwum, musimy pamiętać o podaniu jego nazwy wraz z rozszerzeniem. Domyślnym rozszerzaniem archiwum tworzonego za pomocą programu tar jest .tar.

Proces tworzenie paczki danych mamy już za sobą. Teraz zobaczmy, jak dodać nowy plik do już istniejącego archiwum.

Ćwiczenie 2

Dodanie do archiwum dokumenty pliku o nazwie nowa_faktura.txt.

Potrzebne polecenia i dodatkowe opcje:

  • tar – program/polecenie do zarządzania archiwami,

  • -r – opcja programu tar pozwalająca dodać nowy plik do archiwum,

  • -f – opcja programu tar pozwalająca wskazać na nazwę archiwum.

Korzystając z programu tar oraz opcji dodatkowych, dodajmy plik o nazwie nowa_faktura.txt do archiwum archwium_dokumenty.tar:

tar -rf dokumenty_archiwum.tar nowa_faktura.txt

Polecenie dodało nowy plik o nazwie nowa_faktura.txt do archiwum *dokumenty_archiwum.tar.

Archiwum danych to specjalny typ pliku, zapisywany na dysku twardym komputera. Aby sprawdzić jego zawartość, nie możemy do niego po prostu zajrzeć, tak jak choćby do katalogu. Możemy jednak skorzystać z opcji programu tar i wskazując na konkretne archiwum, sprawdzić jego zawartość.

Ćwiczenie 3

Sprawdzenie zawartości archiwum o nazwie dokumenty.

Potrzebne polecenia i dodatkowe opcje:

  • – program/polecenie do zarządzania archiwami,

  • -t – opcja programu tar pozwalająca wyświetlić zawartość archiwum,

  • -f – opcja programu tar pozwalająca wskazać na nazwę archiwum.

Korzystając z programu tar oraz opcji dodatkowych, wyświetlmy zawartość archiwum o nazwie archwium_dokumenty.tar:

tar -tf dokumenty_archiwum.tar

Polecenie zwróci zawartość archiwum o nazwie archwium_dokumenty.tar.

Zarządzanie archiwami to nie tylko ich tworzenie czy uzupełnianie o nowe pliki. Korzystając z komputera, często otrzymujemy pliki oraz inne zasoby zapisane jako archiwum i potrzebujemy się do nich dostać. Poprzednie ćwiczenie pozwoliło nam sprawdzić zawartość archiwum. Teraz nauczymy się je rozpakowywać, czyli odtwarzać strukturę plików katalogów zapisanych w archiwum.

Ćwiczenie 4

Rozpakowanie archiwum o nazwie dokumenty.

Potrzebne polecenia i dodatkowe opcje:

  • tar – program/polecenie do zarządzania archiwami,

  • -x – opcja programu tar pozwalająca rozpakować archiwum,

  • -f – opcja programu tar pozwalająca wskazać na nazwę archiwum.

Korzystając z programu tar oraz opcji dodatkowych, rozpakujmy archiwum o nazwie archwium_dokumenty.tar:

tar -xf dokumenty_archiwum.tar

Polecenie przywróci zawartość wszystkich plików i katalogów znajdujących się wewnątrz archiwum o nazwie archwium_dokumenty.tar.

Kompresja danych

Z archiwizacją danych łączy się również pojęcie kompresji danychkompresja danychkompresji danych, czyli zamiany sposobu zapisu plików w taki sposób, aby zajmowały mniej miejsca na dysku niż zbiór źródłowy. Kompresja pozwala zaoszczędzić znaczną ilość miejsca pamięci masowych przechowujących archiwa. Szacuje się, że skompresowane archiwum, w zależności od zastosowanych narzędzi i technologii, możne zajmować do kilkudziesięciu procent mniej w pamięci komputera niż archiwum nieskompresowane. Więcej na jej temat znajdziesz w e‑materiale Kompresja danychPAOpIvgHKKompresja danych.

Kompresję danych podzielić można na dwie grupy:

  • stratną,

  • bezstratną.

Więcej na temat tego podziału znajdziesz w e‑materiale Kompresja stratna i bezstratnaPG0p5obvJKompresja stratna i bezstratna.

Ważne!

W przypadku kompresji stratnej niektóre dane źródłowe tracone są bezpowrotnie i nie da się ich już odtworzyć. Ten rodzaj kompresji stosuje się w sytuacjach, kiedy owa strata nie wpływa znacząco na efekt końcowy, a skompresowany plik nie traci na jakości. Przykładem takiej kompresji są m.in. format muzyczny .mp3 oraz formaty graficzne, takie jak .jpeg. Kompresja multimediów jest opisana w e‑materiale Kompresja multimediówPTQ5SkVRfKompresja multimediów.

Ważne!

W przypadku kompresji bezstratnej nie tracimy danych wejściowych plików, a po dokonaniu ich dekompresji ilość oraz jakość danych pozostaje niezmieniona.

W systemach opartych na jądrze Linux występuje kilka narzędzi do kompresji bezstratnej, wśród których najpopularniejszym jest gzip.

Ćwiczenie 5

Kompresja archiwum o nazwie archwium_dokumenty.tar.

Potrzebne polecenia:

gzip – program do kompresji danych.

Korzystając z programu gzip, dokonajmy kompresji archiwum o nazwie archwium_dokumenty.tar:

gzip dokumenty_archiwum.tar

Polecenie dokona kompresji danych zapisanych w archiwum o nazwie archwium_dokumenty.tar, jednocześnie zmieniając rozszerzenie pliku archiwum_dokumenty.tar na .tar.gz.

Ważne!

Program służący do kompresji archiwum, oprócz zmiany sposobu zapisu w celu zmniejszenia objętości pliku, zmodyfikuje również rozszerzenie archiwum na .tar.gz. Pliki z takim rozszerzeniem są skompresowanymi archiwami.

Ćwiczenie 6

Dekompresja archiwum o nazwie archwium_dokumenty.tar.gz.

Potrzebne polecenia:

  • gunzip – program do dekompresji danych.

Korzystając z programu gunzip, dokonajmy dekompresji archiwum o nazwie archwium_dokumenty.tar.gz:

gzip dokumenty_archiwum.tar.gz

Polecenie dokona dekompresji danych zapisanych w archiwum o nazwie archwium_dokumenty.tar.gz, jednocześnie zmieniając rozszerzenie pliku archiwum_dokumenty.tar.gz na .tar.

Ważne!

Program służący do dekompresji archiwum oprócz samej zmiany sposobu zapisu w celu przywrócenia danych sprzed kompresji, zmieni również rozszerzenie archiwum .tar.gz na .tar.

Słownik

archiwizacja danych
archiwizacja danych

proces tworzenia kopii danych w celu ich przechowania i zabezpieczenia przed utratą

kompresja danych
kompresja danych

zmiana sposobu zapisu pliku, tak aby zajmował mniej miejsca w pamięci komputera

serwer NAS
serwer NAS

komputer wraz z oprogramowaniem przygotowany do przechowywania dużej ilości danych