bg‑azure

Przy analizie danych zgromadzonych w arkuszu uciążliwa jest ich niejednorodność: powtarzające się rekordy, nadmiarowe spacje, nazwy własne pisane raz z małej litery, raz z wielkiej, te same wyrazy pisane raz wersalikami, raz małymi literami. W każdej sytuacji ta sama wartość (np.: „Ala ma KOTA” i „ala ma    KOTA”) może zostać potraktowana przez program jako wartości różne. Przy użyciu np. funkcji SZUKAJ.TEKST, gdzie szukanym tekstem będzie „ma KOTA”, tekst w pierwszym przypadku zostanie znaleziony, ale w drugim już nie.

Trudne do wykrycia, niepożądane znaki niedrukowane (jak zbędne odstępy), powodują błędy w działaniu formuł. Mogą się pojawiać nie tylko w wyniku niedbałego zapisu danych, ale również przy importowaniu danych ze źródeł zewnętrznych (np. z pliku tekstowego).

Pobierz przykładowe dane, na których przećwiczysz poniższe operacje:

Rd1XVZ9oe6P1w

Przycisk do pobrania skompresowanych plików zawierających treść zadania. Jeden plik w formacie ODS, drugi plik w formacie XLSX.

Plik ZIP o rozmiarze 28.22 KB w języku polskim

Porządkowanie danych

RdE9hKUHVN0Iu
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

Chcemy uporządkować dane na temat liczby książek wypożyczonych ze szkolnej biblioteki w poszczególnych dniach tygodnia. Wcześniej informacje te były rejestrowane w pliku przez wiele osób, bez ustalonej procedury wpisywania.

W pliku z danymi znajdują się zatem różnorodne błędy. Każdy z nich da się poprawić, stosując określone formuły oferowane przez arkusz kalkulacyjny. Musimy jednak pamiętać o likwidacji błędów w odpowiedniej kolejności. Sprawdźmy więc, jaką strategię należy przyjąć, aby wszystkie błędy zostały usunięte.

Widzimy rekordy powtórzone, które zawierają te same informacje, ale system będzie je traktował jako różne. Tak jest w wierszach: 2 i 3, 7 i 8 oraz 10, 11, 12. Widzimy, że aby ujednolicić komórki zawierające tekst, musimy zlikwidować zbędne spacje, oczyścić komórki z niedrukowanych znaków oraz sprawić, aby tylko pierwsze litery były duże. Dopiero po usunięciu tych błędów będziemy mogli zlikwidować powtórzone rekordy.

Zaczniemy zatem od likwidacji zbędnych spacji oraz niedrukowanych znaków (jak na przykład w komórce A9, gdzie ktoś, zapewne przypadkowo, nacisnął kombinację klawiszy Alt + ENTER rozdzielając słowo „Piątek” na dwie odrębne części).

Do usuwania zbędnych spacji posłuży formuła:

PODSTAW(tekst;stary_tekst;nowy_tekst;[wystąpienie_liczba])

w której występują następujące parametry:

  • tekst - argument wymagany. Tekst lub odwołanie do komórki zawierającej tekst, w którym zostaną zastąpione znaki.

  • stary_tekst - argument wymagany. Tekst, który zostanie zastąpiony.

  • nowy_tekst - argument wymagany. Tekst, którym zostanie zastąpiony tekst określony przez argument stary_tekst.

  • wystąpienie_liczba - argument opcjonalny. Określa, które wystąpienie argumentu stary_tekst zostanie zastąpione przez argument.

Wpisujemy formułę =PODSTAW(A2;" ";"") do komórki C2 i kopiujemy aż do komórki C13. Efekt zawierający wpisane formuły (w kolumnie C) oraz, dla zobrazowania i porównania formuł z wynikami, przekopiowane wyniki ich działania (w kolumnie D) pokazuje poniższa ilustracja.

RA1sHSkFX0bnU
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.
Ciekawostka

Podobny efekt uzyskamy, zaznaczając obszar komórek zawierających tekst przewidziany do likwidacji zbędnych spacji i wywołując kombinacją klawiszy CTRL + h funkcjonalność Znajdź i zamień.

Pojawiające się wówczas okno dialogowe pokazuje poniższa ilustracja.

Microsoft Excel

RILHEC2f1p1Kp
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

LibreOffice Calc

RSdJ5u81WU1gY
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

Wpisując do okienka Znajdź spację i pozostawiając okienko Zamień puste, zlikwidujemy wszystkie spacje w zaznaczonym zakresie komórek. Możemy to uczynić globalnie (przycisk Zamień wszystko) albo krokowo (przycisk Zamień). Ta druga sytuacja będzie miała miejsce wówczas, gdy niektóre spacje w tekście chcielibyśmy zostawić. Stosowanie przycisku Zamień daje możliwość pomijania wybranych podstawień.

Przekopiujmy teraz zawartość komórek C2:C13 do obszaru A2:A13 (wybierając opcję wklejania jako wartości). Pierwszy błąd danych mamy zlikwidowany.

RZj7cM72lFkYT
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.
Dla zainteresowanych
Linia 1. USUŃ kropka ZBĘDNE kropka ODSTĘPY otwórz nawias okrągły tekst zamknij nawias okrągły.

W składni funkcji USUŃ.ZBĘDNE.ODSTĘPY argument tekst jest wymagany. Argument może być tekstem ujętym w cudzysłów, stanowić odwołanie do komórki zawierającej tekst lub zawierać formułę zwracającą tekst. Funkcja nie zmienia znaków w tekście, które nie są literami.

Funkcja ta może być użyta zamiast PODSTAW, jeśli w komórce znajduje się tekst składający się z wielu wyrazów oddzielonymi wieloma spacjami.

Do likwidacji błędu w komórce A9 posłuży formuła likwidująca w tekście wszystkie znaki, które nie mogą być wydrukowane.

OCZYŚĆ(tekst)

Jej jedynym wymaganym argumentem jest tekst (lub adres komórki zawierającej tekst). Po wpisaniu w dowolnej komórce poza danymi formuły

OCZYŚĆ(A9)

i przekopiowaniu jej wyniku (jako wartości) do komórki A9 zlikwidujemy następny błąd danych tkwiący w pierwotnym zestawieniu.

R1P7A0MHZvyQ4
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

Ostatni błąd, który pozostał do usunięcia przed likwidacją powtórzonych rekordów, to pisownia. Analizując dane, widzimy, że niektóre dni tygodnia pisane są z małej litery, inne z wielkiej. A do tego niektóre wpisane są wersalikami. Aby ujednolicić wielkość liter w komórkach, możemy zastosować następujące formuły:

LITERY.MAŁE(tekst)

gdzie wymagany argument zawiera tekst (lub odwołanie do komórki zawierającej tekst), w którym wielkie litery mają zostać przekonwertowanekonwertowanieprzekonwertowane na małe. Funkcja LITERY.MAŁE nie zmienia znaków w tekście, które nie są literami.

LITERY.WIELKIE(tekst)

gdzie wymagany argument zawiera tekst (lub odwołanie do komórki zawierającej tekst), w którym wszystkie litery mają zostać przekonwertowane na wielkie. Funkcja LITERY.WIELKIE nie zmienia znaków w tekście, które nie są literami.

Microsoft Excel

Linia 1. Z kropka WIELKIEJ kropka LITERY otwórz nawias okrągły tekst zamknij nawias okrągły.

Funkcja sprawi, że w podanym tekście, każdy wyraz zaczynać się będzie od dużej litery, a pozostałe znaki zapisane będą małą literą.

W składni funkcji Z.WIELKIEJ.LITERY argument tekst jest wymagany. Argument tekst zawiera tekst ujęty w cudzysłów lub stanowi odwołanie do komórki zawierającej tekst. Funkcja Z.WIELKIEJ.LITERY nie zmienia znaków w tekście, które nie są literami.

LibreOffice Calc

Linia 1. WIELKĄ kropka LITERĄ otwórz nawias okrągły tekst zamknij nawias okrągły.

Funkcja sprawi, że w podanym tekście, każdy wyraz zaczynać się będzie od dużej litery, a pozostałe znaki zapisane będą małą literą.

W składni funkcji WIELKĄ.LITERĄ argument tekst jest wymagany. Argument tekst zawiera tekst ujęty w cudzysłów lub stanowi odwołanie do komórki zawierającej tekst. Funkcja WIELKĄ.LITERĄ nie zmienia znaków w tekście, które nie są literami.

W analizowanym przykładzie mimo wystąpienia dwóch rodzajów różnic powodujących brak jednorodności danych (z małej i z wielkiej litery oraz małymi i wielkimi literami) wystarczy zastosować jedną z formuł, by dane ujednolicić. Jeśli zdecydujemy się na pisanie nazw dni tygodnia wielką literą, wówczas wprowadzimy odpowiednią formułę do komórki C2 i skopiujemy tę formułę do całego zakresu kolumny, kończąc na komórce C13. Efekt zawierający wpisane formuły (w kolumnie C) oraz, dla zobrazowania i porównania formuł z wynikami, przekopiowane wyniki ich działania (w kolumnie D) pokazuje poniższa ilustracja.

RKrh7VD45Xd5i
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

Przekopiujmy teraz zawartość komórek C2:C13 do obszaru A2:A13 (wybierając opcję wklejania jako wartości). Następny błąd danych mamy zlikwidowany.

R1N3hEFZCurLu
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

Ostatni błąd, który został do usunięcia w analizowanym zbiorze danych, to powtórzone rekordy.

Microsoft Excel

Zaznaczmy całą tabelę. W przykładzie będą to komórki z zakresu A1:B13. Do likwidacji powtórzonych rekordów posłużymy się funkcjonalnością Usuń duplikaty z menu Dane.

R1BJBPjQeu5h5
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

W pojawiającym się oknie dialogowym możemy sprawdzić, czy komórki w obu kolumnach (A i B) zostaną usunięte (albo możemy wybrać dowolny inny zakres kolumn).

RmgZ4B9Cjh1HV
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

Po zaakceptowaniu przyciskiem OK uzyskujemy oczekiwany efekt.

R1Y74fJHTPOY4
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

LibreOffice Calc

Do likwidacji powtórzonych rekordów posłużymy się odpowiednią opcją filtrowania. Zaznaczmy całą tabelę, w przykładzie będą to komórki z zakresu A1:B13. Następnie, z menu głównego, wybierzmy Dane i z rozwijanej listy kliknijmy opcję Autofiltr.

RPkwHvAliFWjU
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

Przy nazwach kolumn pojawiła się strzałka umożliwiająca filtrowanie interesujących nas wartości. Przy kolumnie Dzień tygodnia kliknijmy w nią lewym przyciskiem myszy i wybierzmy opcję Filtr standardowy...

RABQ50TAeKgrD
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

Pojawi się okno Filtr standardowy. Wybierzmy Niepusty z rozwijanej listy w polu Wartość. Rozwińmy Opcje, klikając znak plus i zaznaczmy opcję Bez duplikatów.

RCz9InzX11LdC
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

Po potwierdzeniu operacji przyciskiem OK uzyskujemy oczekiwany efekt.

R1YKvcwIX71lG
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

Przykład

Nauczyciel otrzymał zestawienie zawierające listę osób oraz liczbę tematów do indywidualnej realizacji przez danego ucznia. Plik z danymi okazał się jednak niejednorodny. Przed przekazaniem informacji uczniom nauczyciel postanowił go uporządkować i oczyścić dane z błędów. Dane wyglądały tak jak na ilustracji poniżej.

R3SNBPiVAMv2H
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

Microsoft Excel

Aby uporządkować dane, nauczyciel wykonał następujące operacje.

  1. Zaznaczył obszar komórek A2:A16.

  2. Użył skrótu klawiaturowego CTRL + h.

  3. W okienko Znajdź wpisał kropkę.

  4. W okienko Zamień na wpisał spację i zatwierdził przyciskiem Zamień wszystko.

  5. W okienko Znajdź wpisał kombinację klawiszy CTRL + ENTER, czyli zostaną znalezione wszystkie znaki ENTER.

  6. W okienko Zamień na wpisał spację i zatwierdził przyciskiem Zamień wszystko.

  7. W komórce C2 wpisał formułę =USUŃ.ZBĘDNE.ODSTĘPY(A2) i przekopiował tę formułę do wszystkich komórek w kolumnie C aż do komórki C16.

  8. Zawartość obszaru C2:C16 przekopiował jako wartości do obszaru A2:A16.

  9. W komórce C2 wpisał formułę =Z.WIELKIEJ.LITERY(A2) i przekopiował tę formułę do wszystkich komórek w kolumnie C aż do komórki C16.

  10. Zawartość obszaru C2:C16 przekopiował jako wartości do obszaru A2:A16.

  11. Zaznaczył obszar komórek A2:B16 i uruchomił funkcjonalność Usuń duplikaty z menu Dane.

Ostateczny efekt tych wszystkich operacji pokazuje ilustracja poniżej.

R13dCaeSig9Zi
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

LibreOffice Calc

Aby uporządkować dane, nauczyciel wykonał następujące operacje:

  1. Zaznaczył obszar komórek A2:A16.

  2. Użył skrótu klawiaturowego CTRL + h.

  3. W okienko Znajdź wpisał kropkę.

  4. W okienko Zamień na wpisał spację i zatwierdził przyciskiem Zamień wszystko.

  5. W okienko Znajdź wpisał \n i zaznaczył opcję Wyrażenia regularne, czyli zostaną znalezione wszystkie znaki nowej linii.

  6. W okienko Zamień na wpisał spację i zatwierdził przyciskiem Zamień wszystko.

  7. W komórce C2 wpisał formułę =USUŃ.ZBĘDNE.ODSTĘPY(A2) i przekopiował tę formułę do wszystkich komórek w kolumnie C aż do komórki C16.

  8. Zawartość obszaru C2:C16 przekopiował jako wartości do obszaru A2:A16.

  9. W komórce C2 wpisał formułę =WIELKĄ.LITERĄ(A2) i przekopiował tę formułę do wszystkich komórek w kolumnie C aż do komórki C16.

  10. Zawartość obszaru C2:C16 przekopiował jako wartości do obszaru A2:A16.

  11. Zaznaczył obszar komórek A2:B16 i uruchomił funkcjonalność Autofiltr z menu Dane.

  12. Dla kolumny NAZWISKO I IMIĘ otworzył okno opcji Filtr standardowy.

  13. Jako wartość wybrał opcję Niepusty oraz zaznaczył opcję Bez duplikatów.

Ostateczny efekt tych wszystkich operacji pokazuje ilustracja poniżej.

R1UEh8YiXZ8CL
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

Słownik

konwertowanie
konwertowanie

w tym materiale, zamiana jednego sposobu sformatowania danych na inny