Statystyka
6*. Wiedza z plusem: Centyl
W tym materiale poznamy centyl, zwany też percentylem. Choć niewiele osób orientuje się zapewne co to pojęcie oznacza, percentyle są często wykorzystywane w praktyce. Na przykład w badaniach wzrostu i wagi dzieci, badaniach poziomu inteligencji, testach zdolności.
Wielu rodziców zaraz po urodzeniu dziecka wpada w pułapkę statystyki, otrzymując informację o własnym dziecku w stylu Pani dziecko mieści się między 20 a 30 centylem
albo Pana dziecko plasuje się powyżej 90 centyla.
I nie wiadomo, która informacja jest dobra, a która źle wróży na przyszłość.
Podobna sprawa jest z maturzystami, którzy na podstawie wyników matury (np.: z historii poniżej 20 centyla, a z chemii powyżej 40 centyla), chcą zorientować się, jaką mają szansę przyjęcia na wymarzone studia.
Warto więc wiedzieć, co oznaczają poszczególne wartości centylowe, aby nie tracić głowy w przełomowych momentach życia.
Obliczysz kwantyle w szeregu uporządkowanych danych statystycznych (umiejętność spoza podstawy programowej).
Obliczysz dany centyl określonego zestawu danych.
Zinterpretujesz wynik obliczenia centyla.
Aby dowiedzieć się – co to jest centyl, poznamy najpierw równie dziwne pojęcie – mianowicie kwantyl.
Kwantyl – co to takiego?
Kwantyle to wartości cechy badanej zbiorowości, które dzielą uporządkowaną zbiorowość statystyczną na określone, równe części pod względem liczby jednostek statystycznych.
Kwantyl oznaczamy literą .
Kwantylem rzędu , gdzie nazywamy taką liczbę , że elementów danej zbiorowości statystycznej ma wartość nie większą od .
Niektóre kwantyle mają swoje nazwy, np.: kwantylem rzędu jest mediana, kwantyle rzędu i nazywają się odpowiednio kwantylem dolnym i kwantylem górnym.
W poniższym szeregu uporządkowanym, składającym się z elementów, element czwarty, czyli , jest elementem środkowym, zatem kwantylem rzędu (po prawej i po lewej stronie liczby znajduje się tyle samo elementów).
Zapisujemy: .

Jeśli liczba danych jest parzysta, to kwantyl rzędu będzie średnią arytmetyczną dwóch elementów środkowych.
Uporządkowany szereg statystyczny , , , , , składa się z parzystej liczby elementów.
Kwantylem rzędu (medianą) będzie więc średnia arytmetyczna liczb i .

Odpowiedź:
Kwantyle rzędu , , zwane są kwartylami.
Kwantyle rzędu , , , to kwintyle, itd.
Kwantyle rzędu , , ..., to decyle.
Kwartyl rzędu dzieli zbiorowość na dwie części w ten sposób, że jednostek tej zbiorowości ma wartości mniejsze lub równe wartości tego kwartyla, a jednostek ma wartości większe od tego kwartyla lub mu równe.
Dziesięciu uczniów zapytano: Ile razy dziennie myjesz ręce?
Oto zebrane dane: , , , , , , , , , .
Wyznaczamy kwantyl rzędu i kwantyl rzędu tych danych.
Dzielimy szereg na pół (liczby są już ustawione rosnąco) i w każdej „połówce” wyznaczamy wartość środkową.

Interpretacja wyników:
wszystkich osób myje ręce co najwyżej razy dziennie, a wszystkich osób myje ręce co najmniej razy dziennie,
wszystkich osób myje ręce co najwyżej razy dziennie, a co najmniej razy.
Odpowiedź:
,
Kwantyl rzędu nazywany jest też kwartylem (lub kwartylem).
Kwartyl rzędu nazywany jest kwartylem (lub kwartylem), itd.
Centyl – co to takiego?
Wiemy już, że kwantyle pomagają w ustaleniu miejsca interesującego nas wyniku w uporządkowanym szeregu statystycznym. Jednym z rodzajów kwantyli są centyle.
Centyle to kwantyle rzędu , , , ..., . Zamiast centyl rzędu np. mówimy często – centyl.
CentylCentyl to jedna z miar przeciętnych. Charakteryzuje zbiorowość statystyczną niezależnie od różnic występujących między jednostkami tej zbiorowości. Ponieważ centyl dzieli zbiorowość na równych części, można więc dla każdego numeru obserwacji określić procent zbiorowości znajdującej się powyżej lub poniżej tej obserwacji.
–tym centylem w szeregu uporządkowanym nazywamy taką wartość, przed którą (czyli po lewej stronie) znajduje się (czyli ) liczb zestawu.
W różnych opracowaniach można znaleźć różne definicje centyla.
Zauważ, że mediana to centylcentyl (mediana to wartość, która znajduje się w połowie wyników).
Kwantyl to centyl, kwantyl to centyl, kwantyl to centyl.
Darek jest trzecią najwyższą osobą w grupie osób. Oznacza to, że osób jest nie wyższych od Darka.

Jeśli Darek ma wzrostu, to wartość centyla w tej grupie jest równa .
W pewnej klasie osób pisało klasówkę z matematyki. Aż osób uzyskało oceny nie niższe niż Marta.
Ponieważ liczba to liczby , zatem wynik Marty znajduje się na centylu.
Pokażemy teraz, jak interpretować centylcentyl w przypadku danych zgrupowanych.
Na konkurs plastyczny nadesłano wiele prac, ale tylko prac otrzymało najwyższą ocenę – Z (zachwycająca), ocenę S (super) otrzymało prac, ocenę W (wybitna) – aż i wreszcie P (przeciętna) otrzymało prac. Obliczymy, na którym centylu znalazła się praca Agaty, która otrzymała ocenę S.

Wiemy, że oceny gorsze otrzymało na pewno wszystkich prac.
Nie wiemy jednak dokładnie ile punktów otrzymała praca Agaty, ani nawet jaka była skala punktów dla każdej oceny. Zatem możemy tylko oszacować, w którym centylu znalazła się praca Agaty. W tym celu – postępujemy podobnie, jak szukając mediany – bierzemy tylko „połowę” wartości określającej procent ocen S.
Wynika z tego, że , czyli praca Agaty znalazła się mniej więcej na centylu.
Oznacza to, że około prac zostało ocenionych nie wyżej niż praca Agaty, a tylko około prac zostało ocenionych nie niżej.
Siatka centylowa
Siatka centylowa jest jedną z metod obiektywnej oceny rozwoju fizycznego dzieci. Lekarze pediatrzy kontrolują rozwój dziecka, porównując przebieg wzrostu, przybór masy ciała, przyrost obwodu głowy na tle danej populacji.
Dane umieszczane są w układzie współrzędnych – na osi poziomej zaznaczony jest wiek dziecka, na osi pionowej – dany parametr.
Na siatce zaznaczonych jest kilka krzywych – najwyżej położona jest linia centyla – oznacza ona, że u dzieci z danej populacji dany parametr ma nie większą wartość. Pięćdziesiąty centyl oznacza, że u połowy dzieci parametr przyjmuje wartości nie większe, a u drugiej połowy nie mniejsze.
Jako normę przyjmuje się obszar między a centylem. Ważne jest, aby krzywa rozwoju dziecka utrzymywała się na tym samym centylu.
Przykładowa siatka centylowa wysokości ciała dziewcząt.

Na podstawie siatki możemy stwierdzić na przykład, że centyl jest równy dla dziewcząt w wieku lat. Oznacza to, że wzrost dziewczynek w wieku lat nie przekracza . Natomiast połowa dziewcząt wieku lat jest nie wyższa niż .
Animacja multimedialna
Zapoznaj się z animacją i zorientuj się, w jaki sposób można zinterpretować wyniki egzaminów maturalnych podawane w skali centylowej.

Film dostępny pod adresem /preview/resource/R1Zv7kB8V3Ytd
Na środku ekranu pojawia się napis centyl. Napis znika, a na ekranie pojawia się dokument świadectwa dojrzałości Jana Kowalskiego na tle rozsypanych na stole kredek i ołówków. Dokument zawiera wyniki z części ustnej: języka polskiego i języka angielskiego, oraz części pisemnej: języka polskiego i języka angielskiego. Wyniki są zaprezentowane w postaci procentowej zmieniają się. Obok świadectw pojawia się tablet. Na tablecie pojawia się wykres rosnący wykładniczo. Na poziomej osi X są zaznaczone punkty: dziesięć, dwadzieścia, trzydzieści, czterdzieści, pięćdziesiąt, sześćdziesiąt, siedemdziesiąt, osiemdziesiąt, dziewięćdziesiąt, sto. Na osi pionowej są zaznaczone punkty: dwadzieścia pięć, pięćdziesiąt, siedemdziesiąt pięć, sto. Punkty na osiach X i Y stanowią podstawę do wyrysowania siatki na wykresie. Oprócz głównego wykresu na wykresie pojawiają się dodatkowe wykresy, przesunięte w stosunku do głównego wykresu nieznacznie w górę lub w dół. Świadectwo dojrzałości znika, ekran tabletu rozszerza się na większość ekranu. Ekran tabletu jest czysty. Na środku ekranu tabletu pojawia się napis Zuza siedemdziesiąt dziewięć procent. Napis przesuwa się do dołu tabletu, a nad nim pojawia się słupek wykresu. Większa, dolna część słupka jest wydzielona i oznaczona jako siedemdziesiąt dziewięć procent. Pozostała cześć słupka u góry oznaczona jest jako 21%. Ekran tabletu jest wyczyszczony, pojawia się na nim tabela wyników z matematyki poziom rozszerzony. Tabela zawiera wyniki procentowe i odpowiadające im wartości centyla w trzech pionowych kolumnach. Zaznaczony jest rząd tabeli zawierający wynik procentowy sześć i wartość centyla dwadzieścia jeden, wynik procentowy czterdzieści i wartość centyla siedemdziesiąt dwa, oraz wynik procentowy siedemdziesiąt cztery i wartość centyla dziewięćdziesiąt siedem. Obraz tabletu zmniejsza się, i przesuwa na lewą stronę ekranu. Po prawej stronie pojawia się kartka papieru w kratkę. Na dole kartki papieru pojawia się napis Julek siedemdziesiąt cztery procent. Nad napisem pojawia się słupek wykresu. Prawie cały słupek, od dołu prawie do samej góry słupka, jest zaznaczony i opisany jako dziewięćdziesiąt siedem procent. Pozostała, górna cześć słupka oznaczona jest jako trzy procent. Kartka jest wyczyszczona. Na dole kartki papieru pojawia się napis Ada czterdzieści procent. Nad napisem pojawia się słupek wykresu. Prawie trzy czwarte słupka od dołu jest zaznaczone i opisany jako siedemdziesiąt dwa procent. Pozostała, górna cześć słupka oznaczona jest jako dwadzieścia osiem procent. Tablet powiększa się, zajmuje prawie całą powierzchnię ekranu. Na tablecie pojawia wykres wyników egzaminu w postaci słupków. Oś pozioma X to rosnąca skala centylowa z zaznaczonymi punktami sześćdziesiąt, sześćdziesiąt pięć, siedemdziesiąt, siedemdziesiąt pięć, osiemdziesiąt, osiemdziesiąt pięć, dziewięćdziesiąt. Oś pionowa to liczba uczniów, z zaznaczonymi poziomami zero, jeden, dwa, trzy, cztery, pięć i sześć. Jeden słupek znajduje się na osi X w punkcie sześćdziesiąt, i osiąga wysokość pięć. Kolejny znajduje się w punkcie siedemdziesiąt pięć , i osiąga wysokość cztery. Ostatni znajduje się w punkcie osiemdziesiąt pięć, i osiąga wysokość jeden.
Oto fragment tabeli opisującej wyniki egzaminu maturalnego z informatyki na poziomie rozszerzonym (egzamin w nowej formule, absolwenci liceum ogólnokształcącego i technikum). Wyniki zapisano w procentach i odpowiadające im wartości celtyli.

Zinterpretuj te wyniki dla wartości zaznaczonych zielonym kolorem.
Na maturze z informatyki na poziomie rozszerzonym wyniki , i odpowiadały centylom , i . Dokonaj interpretacji tych wyników.
Zestaw ćwiczeń interaktywnych
Wartość średnia ze zbioru A, równa się, nawias klamrowy, jeden przecinek dwa, przecinek, osiem przecinek jeden zero trzy, przecinek, sto piętnaście, zamknięcie nawiasu klamrowego jest mniejsza od mediany tego zbioru. Możliwe odpowiedzi: 1. Fałsz., 2. Prawda.
Rysunek przedstawia siatkę centylową wysokości wzrostu chłopców. Korzystając z rysunku, uzupełnij zdania, przeciągając odpowiednie wyrażenia.

Natomiast aż osiemdziesiąt % chłopców w tym wieku ma wzrost luka do uzupełnienia sto dziesięć cm.
W wieku trzynaście lat luka do uzupełnienia chłopców ma wzrost nie wyższy niż sto sześćdziesiąt cm.
Aż zero przecinek dziewięć wszystkich niemowląt płci męskiej w wieku sześć miesięcy ma wzrost luka do uzupełnienia siedemdziesiąt cm, a w wieku cztery miesięcy ok. piętnaście % niemowląt płci męskiej ma wzrost luka do uzupełnienia sześćdziesiąt pięć cm.
Zapoznaj się z poniższym rysunkiem i odpowiedz na pytanie.

Zapoznaj się z poniższym rysunkiem i odpowiedz na pytanie.

Dla zestawu danych: dziewięć, przecinek, siedem, przecinek, sześć, przecinek, cztery, przecinek, trzy, przecinek, sześć, przecinek, osiem, przecinek, pięć, przecinek, jeden, przecinek, trzy. siedemdziesiąt pięć centyl to Tu uzupełnij dwadzieścia pięć centyl to Tu uzupełnij pięćdziesiąt centyl to Tu uzupełnij
początek ułamka, siedem, plus, dziewięć, mianownik, dwa, koniec ułamka, równa się, osiem, 5. Interpretacja: sześćdziesiąt % liczb jest mniejszych bądź równych osiem, a czterdzieści % większych bądź równych osiem., 6. Obliczamy numer n pozycji sześćdziesiąt centyla:
n, równa się, początek ułamka, p, mianownik, sto, koniec ułamka, razy, N
gdzie: p, równa się, sześćdziesiąt, N - liczba danych., 7. Ponieważ pozycja centyla n jest liczbą całkowitą, to wartość sześćdziesiąt centyla jest średnią danych z pozycji n oraz n, plus, jeden., 8. n, równa się, początek ułamka, sześćdziesiąt, mianownik, sto, koniec ułamka, razy, dziesięć, równa się, sześć
Słownik
–tym centylem w szeregu uporządkowanym nazywamy taką wartość, przed którą (czyli po lewej stronie) znajduje się (czyli ) liczb zestawu