R9shQslTTYEbb
Ilustracja przedstawia kaktusa w doniczce, obok niego postawiona jest rozwijana miarka pokazująca jego wielkość.

Statystyka

Źródło: Charles Deluvio, dostępny w internecie: www.unsplash.com.

6*. Wiedza z plusem: Centyl

W tym materiale poznamy centyl, zwany też percentylem. Choć niewiele osób orientuje się zapewne co to pojęcie oznacza, percentyle są często wykorzystywane w praktyce. Na przykład w badaniach wzrostu i wagi dzieci, badaniach poziomu inteligencji, testach zdolności.

Wielu rodziców zaraz po urodzeniu dziecka wpada w pułapkę statystyki, otrzymując informację o własnym dziecku w stylu Pani dziecko mieści się między 20 a 30 centylem albo Pana dziecko plasuje się powyżej 90 centyla. I nie wiadomo, która informacja jest dobra, a która źle wróży na przyszłość.

Podobna sprawa jest z maturzystami, którzy na podstawie wyników matury (np.: z historii poniżej 20 centyla, a z chemii powyżej 40 centyla), chcą zorientować się, jaką mają szansę przyjęcia na wymarzone studia.

Warto więc wiedzieć, co oznaczają poszczególne wartości centylowe, aby nie tracić głowy w przełomowych momentach życia. 

Twoje cele
  • Obliczysz kwantyle w szeregu uporządkowanych danych statystycznych (umiejętność spoza podstawy programowej).

  • Obliczysz dany centyl określonego zestawu danych.

  • Zinterpretujesz wynik obliczenia centyla.

Aby dowiedzieć się – co to jest centyl, poznamy najpierw równie dziwne pojęcie – mianowicie kwantyl.

Kwantyl – co to takiego?

Kwantyle to wartości cechy badanej zbiorowości, które dzielą uporządkowaną zbiorowość statystyczną na określone, równe części pod względem liczby jednostek statystycznych.

Kwantyl oznaczamy literą Q.

Kwantylem rzędu q, gdzie 0<q<1 nazywamy taką liczbę Q, że q·100% elementów danej zbiorowości statystycznej ma wartość nie większą od Q.

Niektóre kwantyle mają swoje nazwy, np.: kwantylem rzędu 12 jest mediana, kwantyle rzędu 1434 nazywają się odpowiednio kwantylem dolnymkwantylem górnym.

Przykład 1

W poniższym szeregu uporządkowanym, składającym się z 7 elementów, element czwarty, czyli 5 , jest elementem środkowym, zatem kwantylem rzędu 12 (po prawej i po lewej stronie liczby 5 znajduje się tyle samo elementów).

Zapisujemy: Q12=5.

R1elI5WxCyUxF

Jeśli liczba danych jest parzysta, to kwantyl rzędu 12 będzie średnią arytmetyczną dwóch elementów środkowych.

Przykład 2

Uporządkowany szereg statystyczny 1, 2, 4, 8, 10, 20 składa się z parzystej liczby elementów.

Kwantylem rzędu 12 (medianą) będzie więc średnia arytmetyczna liczb 48.

R1CY6SRXdWL3t

Odpowiedź:

Q12=6

Kwantyle rzędu 14, 24, 34 zwane są kwartylami.

Kwantyle rzędu 15, 25, 35, 45 to kwintyle, itd.

Kwantyle rzędu 110, 210, ..., 910 to decyle.

Kwartyl rzędu 14 dzieli zbiorowość na dwie części w ten sposób, że 0,25 25% jednostek tej zbiorowości ma wartości mniejsze lub równe wartości tego kwartyla, a 0,75 75% jednostek ma wartości większe od tego kwartyla lub mu równe.

Przykład 3

Dziesięciu uczniów zapytano: Ile razy dziennie myjesz ręce?

Oto zebrane dane: 1, 1, 4, 5, 6, 8, 10, 12, 14, 20.

Wyznaczamy kwantyl rzędu 14 i kwantyl rzędu 34 tych danych.

Dzielimy szereg na pół (liczby są już ustawione rosnąco) i w każdej „połówce” wyznaczamy wartość środkową.

R6s6I3RD5Fnch

Interpretacja wyników:

  • 0,25 25% wszystkich osób myje ręce co najwyżej 4 razy dziennie, a 0,75 75% wszystkich osób myje ręce co najmniej 4 razy dziennie,

  • 0,75 wszystkich osób myje ręce co najwyżej 12 razy dziennie, a 0,25 co najmniej 12 razy.

Odpowiedź:

Q14=4, Q34=12

Ważne!

Kwantyl rzędu 14 nazywany jest też kwartylem 1 (lub 1 kwartylem).

Kwartyl rzędu 34 nazywany jest kwartylem 3 (lub 3 kwartylem), itd.

Centyl – co to takiego?

Wiemy już, że kwantyle pomagają w ustaleniu miejsca interesującego nas wyniku w uporządkowanym szeregu statystycznym. Jednym z rodzajów kwantyli są centyle.

Centyle to kwantyle rzędu 1100, 2100, 3100, ..., 99100. Zamiast centyl rzędu np. 3100 mówimy często – 3 centyl.

CentylcentylCentyl to jedna z miar przeciętnych. Charakteryzuje zbiorowość statystyczną niezależnie od różnic występujących między jednostkami tej zbiorowości. Ponieważ centyl dzieli zbiorowość na 100 równych części, można więc dla każdego numeru obserwacji określić procent zbiorowości znajdującej się powyżej lub poniżej tej obserwacji.

Centyl
Definicja: Centyl

p–tym centylem w szeregu uporządkowanym nazywamy taką wartość, przed którą (czyli po lewej stronie) znajduje się p% (czyli p100) liczb zestawu.

Ważne!

W różnych opracowaniach można znaleźć różne definicje centyla.

Zauważ, że mediana to 50centylcentylcentyl (mediana to wartość, która znajduje się w połowie wyników).

Kwantyl 1 to 10 centyl, kwantyl 2 to 50 centyl, kwantyl 3 to 75 centyl.

Przykład 4

Darek jest trzecią najwyższą osobą w grupie 10 osób. Oznacza to, że 70% osób jest nie wyższych od Darka.

R1TsWrQ8OZxOS

Jeśli Darek ma 170 cm wzrostu, to wartość 70 centyla w tej grupie jest równa 170 cm.

Przykład 5

W pewnej klasie 20 osób pisało klasówkę z matematyki. Aż 16 osób uzyskało oceny nie niższe niż Marta.

Ponieważ liczba 16 to 80% liczby 20, zatem wynik Marty znajduje się na 80 centylu.

Pokażemy teraz, jak interpretować centylcentylcentyl w przypadku danych zgrupowanych.

Przykład 6

Na konkurs plastyczny nadesłano wiele prac, ale tylko 5% prac otrzymało najwyższą ocenę – Z (zachwycająca), ocenę S (super) otrzymało 20% prac, ocenę W (wybitna) – aż 60% i wreszcie P (przeciętna) otrzymało 15% prac. Obliczymy, na którym centylu znalazła się praca Agaty, która otrzymała ocenę S.

R9icuDd312qb7

Wiemy, że oceny gorsze otrzymało na pewno 15%+60%=75% wszystkich prac.

Nie wiemy jednak dokładnie ile punktów otrzymała praca Agaty, ani nawet jaka była skala punktów dla każdej oceny. Zatem możemy tylko oszacować, w którym centylu znalazła się praca Agaty. W tym celu – postępujemy podobnie, jak szukając mediany – bierzemy tylko „połowę” wartości określającej procent ocen S.

Wynika z tego, że 75%+10%=85%, czyli praca Agaty znalazła się mniej więcej na 85 centylu.

Oznacza to, że około 85% prac zostało ocenionych nie wyżej niż praca Agaty, a tylko około 15% prac zostało ocenionych nie niżej.

Siatka centylowa

Siatka centylowa jest jedną z metod obiektywnej oceny rozwoju fizycznego dzieci. Lekarze pediatrzy kontrolują rozwój dziecka, porównując przebieg wzrostu, przybór masy ciała, przyrost obwodu głowy na tle danej populacji.

Dane umieszczane są w układzie współrzędnych – na osi poziomej zaznaczony jest wiek dziecka, na osi pionowej – dany parametr.

Na siatce zaznaczonych jest kilka krzywych – najwyżej położona jest linia 97 centyla – oznacza ona, że u 97% dzieci z danej populacji dany parametr ma nie większą wartość. Pięćdziesiąty centyl oznacza, że u połowy dzieci parametr przyjmuje wartości nie większe, a u drugiej połowy nie mniejsze.

Jako normę przyjmuje się obszar między 397 centylem. Ważne jest, aby krzywa rozwoju dziecka utrzymywała się na tym samym centylu.

Przykładowa siatka centylowa wysokości ciała dziewcząt.

R1VrdbmPl3Plq
Źródło: dostępny w internecie: http://bi.gazeta.pl/im/8/1326/m1326948.jpg.

Na podstawie siatki możemy stwierdzić na przykład, że 10 centyl jest równy 105 cm dla dziewcząt w wieku 5 lat. Oznacza to, że wzrost 10% dziewczynek w wieku 5 lat nie przekracza 105 cm. Natomiast połowa dziewcząt wieku 13 lat jest nie wyższa niż 160 cm.

Animacja multimedialna

Zapoznaj się z animacją i zorientuj się, w jaki sposób można zinterpretować wyniki egzaminów maturalnych podawane w skali centylowej.

R1Zv7kB8V3Ytd1
Na środku ekranu pojawia się napis centyl. Napis znika, a na ekranie pojawia się dokument świadectwa dojrzałości Jana Kowalskiego na tle rozsypanych na stole kredek i ołówków. Dokument zawiera wyniki z części ustnej: języka polskiego i języka angielskiego, oraz części pisemnej: języka polskiego i języka angielskiego. Wyniki są zaprezentowane w postaci procentowej zmieniają się. Obok świadectw pojawia się tablet. Na tablecie pojawia się wykres rosnący wykładniczo. Na poziomej osi X są zaznaczone punkty: dziesięć, dwadzieścia, trzydzieści, czterdzieści, pięćdziesiąt, sześćdziesiąt, siedemdziesiąt, osiemdziesiąt, dziewięćdziesiąt, sto. Na osi pionowej są zaznaczone punkty: dwadzieścia pięć, pięćdziesiąt, siedemdziesiąt pięć, sto. Punkty na osiach X i Y stanowią podstawę do wyrysowania siatki na wykresie. Oprócz głównego wykresu na wykresie pojawiają się dodatkowe wykresy, przesunięte w stosunku do głównego wykresu nieznacznie w górę lub w dół. Świadectwo dojrzałości znika, ekran tabletu rozszerza się na większość ekranu. Ekran tabletu jest czysty. Na środku ekranu tabletu pojawia się napis Zuza siedemdziesiąt dziewięć procent. Napis przesuwa się do dołu tabletu, a nad nim pojawia się słupek wykresu. Większa, dolna część słupka jest wydzielona i oznaczona jako siedemdziesiąt dziewięć procent. Pozostała cześć słupka u góry oznaczona jest jako 21%. Ekran tabletu jest wyczyszczony, pojawia się na nim tabela wyników z matematyki poziom rozszerzony. Tabela zawiera wyniki procentowe i odpowiadające im wartości centyla w trzech pionowych kolumnach. Zaznaczony jest rząd tabeli zawierający wynik procentowy sześć i wartość centyla dwadzieścia jeden, wynik procentowy czterdzieści i wartość centyla siedemdziesiąt dwa, oraz wynik procentowy siedemdziesiąt cztery i wartość centyla dziewięćdziesiąt siedem. Obraz tabletu zmniejsza się, i przesuwa na lewą stronę ekranu. Po prawej stronie pojawia się kartka papieru w kratkę. Na dole kartki papieru pojawia się napis Julek siedemdziesiąt cztery procent. Nad napisem pojawia się słupek wykresu. Prawie cały słupek, od dołu prawie do samej góry słupka, jest zaznaczony i opisany jako dziewięćdziesiąt siedem procent. Pozostała, górna cześć słupka oznaczona jest jako trzy procent. Kartka jest wyczyszczona. Na dole kartki papieru pojawia się napis Ada czterdzieści procent. Nad napisem pojawia się słupek wykresu. Prawie trzy czwarte słupka od dołu jest zaznaczone i opisany jako siedemdziesiąt dwa procent. Pozostała, górna cześć słupka oznaczona jest jako dwadzieścia osiem procent. Tablet powiększa się, zajmuje prawie całą powierzchnię ekranu. Na tablecie pojawia wykres wyników egzaminu w postaci słupków. Oś pozioma X to rosnąca skala centylowa z zaznaczonymi punktami sześćdziesiąt, sześćdziesiąt pięć, siedemdziesiąt, siedemdziesiąt pięć, osiemdziesiąt, osiemdziesiąt pięć, dziewięćdziesiąt. Oś pionowa to liczba uczniów, z zaznaczonymi poziomami zero, jeden, dwa, trzy, cztery, pięć i sześć. Jeden słupek znajduje się na osi X w punkcie sześćdziesiąt, i osiąga wysokość pięć. Kolejny znajduje się w punkcie siedemdziesiąt pięć , i osiąga wysokość cztery. Ostatni znajduje się w punkcie osiemdziesiąt pięć, i osiąga wysokość jeden.
Polecenie 1

Oto fragment tabeli opisującej wyniki egzaminu maturalnego z informatyki na poziomie rozszerzonym (egzamin w nowej formule, absolwenci liceum ogólnokształcącego i technikum). Wyniki zapisano w procentach i odpowiadające im wartości celtyli.

RjUmynPsIubcV
Źródło: dostępny w internecie: https://cke.gov.pl/images/_EGZAMIN_MATURALNY_OD_2015/Informacje_o_wynikach/2019/20190704%20Wst%C4%99pna%20informacja%20o%20wynikach%20matury%202019%20CENTYLE.pdf.

Zinterpretuj te wyniki dla wartości zaznaczonych zielonym kolorem.

Na maturze z informatyki na poziomie rozszerzonym wyniki 8%, 42%76% odpowiadały centylom 13, 6495. Dokonaj interpretacji tych wyników.

Zestaw ćwiczeń interaktywnych

1
Pokaż ćwiczenia:
1
Ćwiczenie 1
R1RfjG6M1CxZv
Podaj definicję kwantyla.
R1OAUtv5v5T2S
Oceń, czy poniższe zdanie jest prawdziwe czy fałszywe? Zaznacz prawidłową odpowiedź.
Wartość średnia ze zbioru A, równa się, nawias klamrowy, jeden przecinek dwa, przecinek, osiem przecinek jeden zero trzy, przecinek, sto piętnaście, zamknięcie nawiasu klamrowego jest mniejsza od mediany tego zbioru. Możliwe odpowiedzi: 1. Fałsz., 2. Prawda.
RCDmlZji1V99Z1
Ćwiczenie 2
Zaznacz wszystkie zdania prawdziwe. Możliwe odpowiedzi: 1. Marek z testu otrzymał wynik, który plasuje się na dziewięćdziesiąt centylu, co oznacza, że uzyskał wynik nie gorszy niż dziewięćdziesiąt % osób, które przystąpiły do testu., 2. dwadzieścia pięć centyl to jeden kwantyl., 3. Mediana to pięćdziesiąt centyl., 4. Jeśli Ania w klasowym rankingu masy ciała znajduje się na trzydzieści centylu, to oznacza, że trzydzieści osób w klasie ma masę ciała nie większą niż Anka.
2
Ćwiczenie 3

Rysunek przedstawia  siatkę centylową wysokości wzrostu chłopców. Korzystając z rysunku, uzupełnij zdania, przeciągając odpowiednie wyrażenia.

RwNfrLyRbCTRC
Źródło: dostępny w internecie: http://bi.gazeta.pl/im/6/1326/m1326946.jpg.
RI8z2zmizzKGx
Dostępne opcje do wyboru: nie niższy niż, połowa, nie wyższy niż, nie wyższy niż, nie niższy niż. Polecenie: . W wieku sześć lat dziesięć % chłopców ma wzrost luka do uzupełnienia sto dziesięć cm.
Natomiast aż osiemdziesiąt % chłopców w tym wieku ma wzrost luka do uzupełnienia sto dziesięć cm.
W wieku trzynaście lat luka do uzupełnienia chłopców ma wzrost nie wyższy niż sto sześćdziesiąt cm.
Aż zero przecinek dziewięć wszystkich niemowląt płci męskiej w wieku sześć miesięcy ma wzrost luka do uzupełnienia siedemdziesiąt cm, a w wieku cztery miesięcy ok. piętnaście % niemowląt płci męskiej ma wzrost luka do uzupełnienia sześćdziesiąt pięć cm.
2
Ćwiczenie 4

Zapoznaj się z poniższym rysunkiem i odpowiedz na pytanie.

RLaNstpkKxjwn
R1dZs2W86o7c9
Na którym centylu (licząc od lewej strony) stoi chłopiec w pomarańczowej koszulce, w szeregu uporządkowanym ze względu na wzrost? Możliwe odpowiedzi: 1. dziesięć, 2. piętnaście, 3. dwadzieścia, 4. dwadzieścia pięć
2
Ćwiczenie 5

Zapoznaj się z poniższym rysunkiem i odpowiedz na pytanie.

RKyeXGiK2T3qY
RaJonvyZ6ZOrv
Jaki kolor ma koszulka chłopca stojącego na drugim decylu (licząc od lewej strony) w szeregu uporządkowanym ze względu na wzrost? Możliwe odpowiedzi: 1. Żółty, 2. Pomarańczowy, 3. Niebieski, 4. Zielony
R1FxSMp1TC6eA2
Ćwiczenie 6
Uzupełnij, wpisując odpowiednie liczby.
Dla zestawu danych: dziewięć, przecinek, siedem, przecinek, sześć, przecinek, cztery, przecinek, trzy, przecinek, sześć, przecinek, osiem, przecinek, pięć, przecinek, jeden, przecinek, trzy. siedemdziesiąt pięć centyl to Tu uzupełnij dwadzieścia pięć centyl to Tu uzupełnij pięćdziesiąt centyl to Tu uzupełnij
RSe4CX7Mto2CJ3
Ćwiczenie 7
Połącz w pary zestawy danych z odpowiadającymi im centylami. dwa, przecinek, trzy, przecinek, trzy, przecinek, trzy, przecinek, cztery, przecinek, pięć, przecinek, sześć, przecinek, osiem Możliwe odpowiedzi: 1. czterdzieści centyl to dwa, 2. trzydzieści centyl to cztery, 3. sześćdziesiąt centyl to osiem przecinek pięć, 4. dwadzieścia cztery centyl to trzy trzy, przecinek, trzy, przecinek, cztery, przecinek, cztery, przecinek, pięć, przecinek, dziesięć, przecinek, dwanaście, przecinek, czternaście, przecinek, szesnaście, przecinek, osiemnaście Możliwe odpowiedzi: 1. czterdzieści centyl to dwa, 2. trzydzieści centyl to cztery, 3. sześćdziesiąt centyl to osiem przecinek pięć, 4. dwadzieścia cztery centyl to trzy zero, przecinek, zero, przecinek, dwa, przecinek, dwa, przecinek, siedem, przecinek, osiem, przecinek, dziewięć, przecinek, dziesięć Możliwe odpowiedzi: 1. czterdzieści centyl to dwa, 2. trzydzieści centyl to cztery, 3. sześćdziesiąt centyl to osiem przecinek pięć, 4. dwadzieścia cztery centyl to trzy dwa, przecinek, cztery, przecinek, pięć, przecinek, sześć, przecinek, siedem, przecinek, osiem, przecinek, dziewięć, przecinek, dziesięć, przecinek, jedenaście, przecinek, dwanaście Możliwe odpowiedzi: 1. czterdzieści centyl to dwa, 2. trzydzieści centyl to cztery, 3. sześćdziesiąt centyl to osiem przecinek pięć, 4. dwadzieścia cztery centyl to trzy
RY3s1OXiBH4r43
Ćwiczenie 8
Ustaw w odpowiedniej kolejności obliczanie sześćdziesiąt centyla zestawu danych: dwanaście, przecinek, dwa, przecinek, cztery, przecinek, dwanaście, przecinek, pięć, przecinek, dziesięć, przecinek, pięć, przecinek, sześć, przecinek, dziewięć, przecinek, siedem. Elementy do uszeregowania: 1. Wartość pozycji n, równa się, sześć to siedem, a wartość pozycji n, plus, jeden, równa się, siedem to dziewięć., 2. sześćdziesiąt centyl to osiem., 3. Ustawiamy dane rosnąco: dwa, przecinek, cztery, przecinek, pięć, przecinek, pięć, przecinek, sześć, przecinek, siedem, przecinek, dziewięć, przecinek, dziesięć, przecinek, dwanaście, przecinek, dwanaście., 4. Obliczamy średnią arytmetyczną liczb siedem i dziewięć.
początek ułamka, siedem, plus, dziewięć, mianownik, dwa, koniec ułamka, równa się, osiem, 5. Interpretacja: sześćdziesiąt % liczb jest mniejszych bądź równych osiem, a czterdzieści % większych bądź równych osiem., 6. Obliczamy numer n pozycji sześćdziesiąt centyla:
n, równa się, początek ułamka, p, mianownik, sto, koniec ułamka, razy, N
gdzie: p, równa się, sześćdziesiąt, N - liczba danych., 7. Ponieważ pozycja centyla n jest liczbą całkowitą, to wartość sześćdziesiąt centyla jest średnią danych z pozycji n oraz n, plus, jeden., 8. n, równa się, początek ułamka, sześćdziesiąt, mianownik, sto, koniec ułamka, razy, dziesięć, równa się, sześć

Słownik

centyl
centyl

p–tym centylem w szeregu uporządkowanym nazywamy taką wartość, przed którą (czyli po lewej stronie) znajduje się p% (czyli p100) liczb zestawu