Przeczytaj
Czym jest archiwum? Z tym pojęciem dość często spotykamy się w życiu codziennym. Osobom niezwiązanym z informatyką zazwyczaj kojarzy się ono ze zbiorem dokumentów z dawnych lat, przechowywanych w teczkach i segregatorach w ogromnych szafach, w specjalnych pomieszczeniach.
Informatyczna definicja archiwum jest analogiczna do tej, jaką znamy z życia codziennego. Odnosi się do zbioru danych, plików i programów zapisanych w odpowiednim formacie i przechowywanych na nośnikach danych (dyski zewnętrzne, serwery NASserwery NAS), które są odpowiednio zabezpieczone.
To zbiór plików i katalogów, zapisanych w odpowiednim dla programu archiwizującego formacie, które przechowuje się na zewnętrznych nośnikach danych w celu ich zabezpieczenia. Popularne programy do archiwizacji danycharchiwizacji danych to WinRAR oraz 7zip.
Przykłady zastosowania archiwów:
przedsiębiorstwo informatyczne przechowuje w nich faktury z lat ubiegłych;
firma księgowa zabezpiecza w ten sposób dane swoich klientów z wcześniejszych okresów rozliczeniowych;
szkoła archiwizuje dzienniki lekcyjne z poprzednich roczników.
Elektroniczne archiwa danych ułatwiają również tworzenie przez administratorów systemów informatycznych kopii danych, wykorzystywanych w firmach oraz instytucjach. Z punktu widzenia systemu operacyjnego archiwum widoczne jest jako jeden plik, jeden obiekt, dzięki czemu łatwo je zabezpieczyć i przenieść.
Archiwa, czyli „paczki danych”, mają jeszcze inne zastosowanie. Za ich pomocą możemy rozpowszechniać i dystrybuować oprogramowanie. W wypadku systemów operacyjnych opartych na jądrze Linux częstym nośnikiem oprogramowania lub jego aktualizacji są właśnie archiwa.
Archiwizacja danych w systemie Linux
Przyjrzyjmy się teraz, jakie polecenia pozwolą nam tworzyć archiwa, sprawdzać ich zawartość, dodawać do nich nowe pliki i rozpakowywać je - czyli ogólnie mówiąc, zarządzać nimi.
W systemach opartych na jądrze Linux podstawowym i najpopularniejszym programem do zarządzania archiwami poprzez terminal jest tar.
Utworzenie archiwum danych z plików zapisanych w katalogu dokumenty
.
Potrzebne polecenia i dodatkowe opcje:
tar
– program/polecenie do zarządzania archiwami,-c
– opcja programu tar pozwalająca utworzyć archiwum,-f
– opcja programu tar pozwalająca wskazać/nadać nazwę archiwum.
Korzystając z programu tar oraz opcji dodatkowych, utwórzmy archiwum katalogu dokumenty
o nazwie archwium_dokumenty
:
tar -cf dokumenty_archiwum.tar dokumenty
Polecenie utworzyło nowy plik o nazwie dokumenty_archiwum.tar
z zawartością katalogu dokumenty
.
Opcję -f
stosuje się, gdy tworzymy nowe archiwum, ale również wtedy, kiedy dokonujemy modyfikacji już istniejącego archiwum (przykład w ćwiczeniu nr 2).
Tworząc archiwum, musimy pamiętać o podaniu jego nazwy wraz z rozszerzeniem. Domyślnym rozszerzaniem archiwum tworzonego za pomocą programu tar jest .tar.
Proces tworzenie paczki danych mamy już za sobą. Teraz zobaczmy, jak dodać nowy plik do już istniejącego archiwum.
Dodanie do archiwum dokumenty
pliku o nazwie nowa_faktura.txt
.
Potrzebne polecenia i dodatkowe opcje:
tar
– program/polecenie do zarządzania archiwami,-r
– opcja programu tar pozwalająca dodać nowy plik do archiwum,-f
– opcja programu tar pozwalająca wskazać na nazwę archiwum.
Korzystając z programu tar oraz opcji dodatkowych, dodajmy plik o nazwie nowa_faktura.txt
do archiwum archwium_dokumenty.tar
:
tar -rf dokumenty_archiwum.tar nowa_faktura.txt
Polecenie dodało nowy plik o nazwie nowa_faktura.txt
do archiwum *dokumenty_archiwum.tar
.
Archiwum danych to specjalny typ pliku, zapisywany na dysku twardym komputera. Aby sprawdzić jego zawartość, nie możemy do niego po prostu zajrzeć, tak jak choćby do katalogu. Możemy jednak skorzystać z opcji programu tar i wskazując na konkretne archiwum, sprawdzić jego zawartość.
Sprawdzenie zawartości archiwum o nazwie dokumenty
.
Potrzebne polecenia i dodatkowe opcje:
– program/polecenie do zarządzania archiwami,
-t
– opcja programu tar pozwalająca wyświetlić zawartość archiwum,-f
– opcja programu tar pozwalająca wskazać na nazwę archiwum.
Korzystając z programu tar oraz opcji dodatkowych, wyświetlmy zawartość archiwum o nazwie archwium_dokumenty.tar
:
tar -tf dokumenty_archiwum.tar
Polecenie zwróci zawartość archiwum o nazwie archwium_dokumenty.tar
.
Zarządzanie archiwami to nie tylko ich tworzenie czy uzupełnianie o nowe pliki. Korzystając z komputera, często otrzymujemy pliki oraz inne zasoby zapisane jako archiwum i potrzebujemy się do nich dostać. Poprzednie ćwiczenie pozwoliło nam sprawdzić zawartość archiwum. Teraz nauczymy się je rozpakowywać, czyli odtwarzać strukturę plików katalogów zapisanych w archiwum.
Rozpakowanie archiwum o nazwie dokumenty
.
Potrzebne polecenia i dodatkowe opcje:
tar
– program/polecenie do zarządzania archiwami,-x
– opcja programu tar pozwalająca rozpakować archiwum,-f
– opcja programu tar pozwalająca wskazać na nazwę archiwum.
Korzystając z programu tar oraz opcji dodatkowych, rozpakujmy archiwum o nazwie archwium_dokumenty.tar
:
tar -xf dokumenty_archiwum.tar
Polecenie przywróci zawartość wszystkich plików i katalogów znajdujących się wewnątrz archiwum o nazwie archwium_dokumenty.tar
.
Kompresja danych
Z archiwizacją danych łączy się również pojęcie kompresji danychkompresji danych, czyli zamiany sposobu zapisu plików w taki sposób, aby zajmowały mniej miejsca na dysku niż zbiór źródłowy. Kompresja pozwala zaoszczędzić znaczną ilość miejsca pamięci masowych przechowujących archiwa. Szacuje się, że skompresowane archiwum, w zależności od zastosowanych narzędzi i technologii, możne zajmować do kilkudziesięciu procent mniej w pamięci komputera niż archiwum nieskompresowane. Więcej na jej temat znajdziesz w e‑materiale Kompresja danychKompresja danych.
Kompresję danych podzielić można na dwie grupy:
stratną,
bezstratną.
Więcej na temat tego podziału znajdziesz w e‑materiale Kompresja stratna i bezstratnaKompresja stratna i bezstratna.
W przypadku kompresji stratnej niektóre dane źródłowe tracone są bezpowrotnie i nie da się ich już odtworzyć. Ten rodzaj kompresji stosuje się w sytuacjach, kiedy owa strata nie wpływa znacząco na efekt końcowy, a skompresowany plik nie traci na jakości. Przykładem takiej kompresji są m.in. format muzyczny .mp3 oraz formaty graficzne, takie jak .jpeg. Kompresja multimediów jest opisana w e‑materiale Kompresja multimediówKompresja multimediów.
W przypadku kompresji bezstratnej nie tracimy danych wejściowych plików, a po dokonaniu ich dekompresji ilość oraz jakość danych pozostaje niezmieniona.
W systemach opartych na jądrze Linux występuje kilka narzędzi do kompresji bezstratnej, wśród których najpopularniejszym jest gzip.
Kompresja archiwum o nazwie archwium_dokumenty.tar
.
Potrzebne polecenia:
gzip
– program do kompresji danych.
Korzystając z programu gzip, dokonajmy kompresji archiwum o nazwie archwium_dokumenty.tar
:
gzip dokumenty_archiwum.tar
Polecenie dokona kompresji danych zapisanych w archiwum o nazwie archwium_dokumenty.tar
, jednocześnie zmieniając rozszerzenie pliku archiwum_dokumenty
z .tar na .tar.gz.
Program służący do kompresji archiwum, oprócz zmiany sposobu zapisu w celu zmniejszenia objętości pliku, zmodyfikuje również rozszerzenie archiwum na .tar.gz. Pliki z takim rozszerzeniem są skompresowanymi archiwami.
Dekompresja archiwum o nazwie archwium_dokumenty.tar.gz
.
Potrzebne polecenia:
gunzip
– program do dekompresji danych.
Korzystając z programu gunzip, dokonajmy dekompresji archiwum o nazwie archwium_dokumenty.tar.gz
:
gzip dokumenty_archiwum.tar.gz
Polecenie dokona dekompresji danych zapisanych w archiwum o nazwie archwium_dokumenty.tar.gz
, jednocześnie zmieniając rozszerzenie pliku archiwum_dokumenty
z .tar.gz na .tar.
Program służący do dekompresji archiwum oprócz samej zmiany sposobu zapisu w celu przywrócenia danych sprzed kompresji, zmieni również rozszerzenie archiwum .tar.gz na .tar.
Słownik
proces tworzenia kopii danych w celu ich przechowania i zabezpieczenia przed utratą
zmiana sposobu zapisu pliku, tak aby zajmował mniej miejsca w pamięci komputera
komputer wraz z oprogramowaniem przygotowany do przechowywania dużej ilości danych