Wydrukuj Pobierz materiał do PDF Pobierz materiał do EPUB Pobierz materiał do MOBI Zaloguj się, aby skopiować i edytować materiał Zaloguj się, aby udostępnić materiał Zaloguj się, aby dodać całą stronę do teczki

W tym materiale zawarte są informacje na temat podstawowych miar rozproszenia. Obliczysz rozstęp, odchylenie przeciętne, odchylenie standardowe i wariancję zestawu danych.

1
Przykład 1

Właściciel dwóch sklepów z odzieżą, położonych w różnych miejscach miasta, próbuje ustalić, które bluzki sprzedają się najlepiej w każdym z jego sklepów, przy czym bierze pod uwagę jedynie cenę bluzki. Chce w ten sposób ustalić, jaki towar powinien zamówić. Zanotował, że podczas ostatniego dnia w pierwszym sklepie sprzedano kolejno bluzki w cenach (zaokrąglonych do pełnych dziesiątek złotych): 10 , 80 , 20 , 20 , 90 , 10 , 90 , 80 . W tym samym czasie w drugim sklepie sprzedano kolejno bluzki w cenach (zaokrąglonych do pełnych dziesiątek złotych): 50 , 50 , 40 , 60 , 50 , 40 , 60 , 50 , 50 , 50 .

Ceny te, po uporządkowaniu w kolejności niemalejącej, zapisał w następującej tabeli:

1 sklep

2 sklep

10 zł
40 zł
10 zł
40 zł
20 zł
50 zł
20 zł
50 zł
80 zł
50 zł
80 zł
50 zł
90 zł
50 zł
90 zł
50 zł
60 zł
60 zł

Zauważmy, że średnia cena zakupionej bluzki oraz mediana są takie same w obu sklepach.

W pierwszym sklepie

x-=10+10+20+20+80+80+90+908=4008=50

oraz mediana jest równa

20+802=50.

W drugim sklepie

x-=40+40+50+50+50+50+50+50+60+6010=50010=50

oraz mediana jest równa

50+502=50.

Na podstawie tych danych można wysnuć wnioski, że w obu sklepach sprzedaż wygląda podobnie.

Zilustrujmy jednak te dane na wykresach.

R1FxCZ4z8eHVm1
Źródło: Zespół autorski Politechniki Łódzkiej, licencja: CC BY 3.0.

Na pierwszym wykresie dane znajdują się w sporej odległości od średniej x=50, na drugim skupiają się wokół niej. W pierwszym zestawie danych są kwoty bardzo małe i bardzo duże w stosunku do średniej. Może to oznaczać, że do sklepu przychodzą zarówno zamożni klienci, jak i wydający na ubrania minimum pieniędzy. W drugim sklepie większość danych jest bliska średniej i medianie. Może to oznaczać, że klienci drugiego sklepu to ludzie średnio zamożni, którzy wybierają towar przeciętny, nie za drogi i nie za tani.

Właściciel sklepów prowadził podobne badanie przez kilka kolejnych dni i wnioski powtarzały się. Zdecydował się więc do pierwszego sklepu zamówić bluzki bardzo tanie i  droższe, zaś do drugiego takie, których cena jest bliska 50 zł.

Przykład 2

Pewna firma zajmuje się prowadzeniem szkoleń. Po każdym ze szkoleń uczestnicy oceniają trenera prowadzącego szkolenie. Ocena ta jest liczbą całkowitą od 1 (najniższa ocena) do 10. Jedno ze szkoleń, w którym wzięło udział 20 uczestników, prowadzone było przez dwóch trenerów. Na poniższym wykresie przedstawiono otrzymane przez nich oceny.

R1VvLscCy8UC61
Źródło: Zespół autorski Politechniki Łódzkiej, licencja: CC BY 3.0.

Obliczmy średnią ocen, jaką otrzymał każdy z trenerów.

Trener 1: x1-=12+22+31+42+71+82+95+10520=13520=6,75.

Trener 2: x2-=68+79+8320=13520=6,75.

Średnia ocen jest taka sama. Wykres natomiast wskazuje na inne rozkłady poszczególnych ocen jednostkowych. Trener 1 otrzymał oceny prawie z całej skali. Są one rozproszone w stosunku do oceny średniej, a więc część uczestników szkolenia oceniła go bardzo wysoko, a część bardzo nisko. Trener 2 otrzymał jedynie oceny 6, 78, a więc skupione wokół średniej. Może nie jest idealny (nie otrzymał 10), ale ludziom się na ogół podobał i nie wzbudzał negatywnych odczuć.
Oczywiście, jeżeli zestaw danych jest większy, to trudniej zaobserwować jego strukturę. Do oceny koncentracji badanych danych służą miary rozproszenia. Najprostszą miarą rozproszenia jest rozstęp, czyli różnica pomiędzy największą i najmniejszą wartością.

R=xmax-xmin.

Dużą zaletą tej charakterystyki jest łatwość jej wyznaczania. Jednak nie informuje nas ona, jak w przedziale xmin,xmax o długości R są rozłożone poszczególne dane. Czy np. są skupione wokół jednego punktu, czy rozrzucone w tym przedziale. Rozstęp mówi tylko o tym, jaką długość ma najkrótszy przedział zawierający wszystkie dane.

1
Przykład 3

Obliczmy rozstęp dla każdej z wielkości występujących w poprzednich dwóch przykładach.

Dla pierwszego sklepu R=90-10=80, a dla drugiego R=60-40=20. Zauważymy więc, że różnica w cenie najdroższej i najtańszej bluzki w pierwszym sklepie wynosi 80 , zaś w drugim 20 zł, czyli jest cztery razy mniejsza. Zatem w drugim sklepie ceny są bardziej „skupione”.

W drugim przykładzie dla pierwszego trenera R=10-1=9, a dla drugiego R=8-6=2. Tutaj także rozstęp wyników drugiego trenera jest mniejszy niż pierwszego.

Najczęściej jednak potrzebujemy dokładniejszej analizy rozproszenia danych. Zauważmy, że dla tego samego rozstępu dane mogą układać się bardzo różnie. Na przykład rozstęp w zestawie danych: 1, 3, 3, 3, 3, 3, 3, 3, 5 jest równy 4 i jest taki sam jak w zestawie: 1, 1, 2, 2, 3, 4, 4, 5, 5. Jednak w pierwszym zestawie, poza danymi skrajnymi, występuje wielokrotnie ta sama wartość 3, a w drugim zestawie występują wszystkie wartości całkowite od 1 do 5 i prawie każda tak samo często. Spróbujemy skonstruować taki wskaźnik, który pozwoli nam odróżnić te dwie sytuacje.

Zajmiemy się więc badaniem odległości każdej danej od średniej. Odległość między dwiema liczbami na osi liczbowej to wartość bezwzględna różnicy tych liczb. Zatem odchylenie liczby xi od średniej x-, to

xi-x-.

Obliczmy odchylenia średnich cen bluzek z przykładu pierwszego w każdym z dwóch sklepów. Wyniki zapiszmy w tabeli.

I sklep

II sklep

Cena bluzki xi

Odchylenie od średniej xi-x-=xi-50

Cena bluzki xi

Odchylenie od średniej xi-x-=xi-50

10
40
40
10
10
40
40
10
20
30
50
0
20
30
50
0
80
30
50
0
80
30
50
0
90
40
60
10
90
40
60
10

Obliczmy teraz średnią arytmetyczną znalezionych odchyleń w każdym ze sklepów.

W pierwszym sklepie: 40+40+30+30+30+30+40+408=2808=35.

W drugim sklepie: 10+10+10+108=408=5.

Obliczone przez nas wielkości to tak zwane odchylenia przeciętne.

Odchylenie przeciętne
Definicja: Odchylenie przeciętne

Odchyleniem przeciętnym liczb x1, x2, , xn nazywamy liczbę

x1-x-+x2-x-++xn-x-n.

Zatem w pierwszym sklepie odchylenie przeciętne jest wyższe niż w drugim, co potwierdza naszą wcześniejszą obserwację, że w pierwszym sklepie „ceny leżą dalej od średniej”, a w drugim znajdują się bliżej średniej.

W statystyce częściej od odchylenia przeciętnego wykorzystuje się tzw. odchylenie standardowe.

Odchylenie standardowe
Definicja: Odchylenie standardowe

Odchyleniem standardowym σ liczb x1, x2, , xn nazywamy liczbę

σ=x1-x-2+x2-x-2++xn-x-2n.

Kwadrat tej wielkości nazywamy wariancją i oznaczamy symbolem σ2, czyli

σ2=x1-x-2+x2-x-2++xn-x-2n.

Wariancja i odchylenie standardowe niosą dokładnie te same informacje. Wygodniej używać odchylenia standardowego, ponieważ wariancja jest podawana w jednostkach kwadratowych, a odchylenie standardowe dokładnie w tych samych jednostkach, co analizowane dane.

Obliczanie odchylenia standardowego, czy też wariancji, jest uciążliwe w sytuacji, gdy x- jest liczbą niecałkowitą i ma albo długie rozwinięcie dziesiętne, albo nawet nieskończone. Podamy teraz wzór, który sprawia, że obliczenia są znacznie wygodniejsze.

Wariancja liczb
Twierdzenie: Wariancja liczb

Wariancja liczb x1, x2, , xn jest równa

σ2=x12+x22++xn2n-x-2.
Dowód

Przekształcając wzór z definicji wariancji ,otrzymujemy

σ2=x1-x-2+x2-x-2++xn-x-2n=
=x12-2x1x-+x-2+x22-2x2x-+x-2++xn2-2xnx-+x-2n=
=x12+x22++xn2n-2x-x1+x2+xnn+nx-2n=
=x12+x22++xn2n-2x-2+x-2=x12+x22++xn2n-x-2.
Przykład 4

W tabeli przedstawiono kwoty rachunków za telefon, jakie zapłaciła Małgosia w kolejnych miesiącach.

styczeń

luty

marzec

kwiecień

maj

czerwiec

63 zł
41 zł
35 zł
67 zł
60 zł
52 zł

Obliczymy wariancję i odchylenie standardowe tych wydatków z dokładnością do 1 zł. Średnia wydatków na telefon Małgosi jest równa:

x-=63+41+35+67+60+526=3186=53.

W kolejnych miesiącach odchylenie od średniej jest równe:

styczeń

luty

marzec

kwiecień

maj

czerwiec

xi
63 zł
41 zł
35 zł
67 zł
60 zł
52 zł
xi-x-
10
12
18
14
7
1

Wariancja jest więc równa:

σ2=102+122+182+142+72+126=100+144+324+196+49+16=8146=135,(6)136

a odchylenie standardowe:

σ=13612.
1
Przykład 5

Wyniki pewnego badania umieszczono w tabeli.

Wynik

Częstość

4
5
5
2
6
4
7
6
8
3

Obliczymy wariancję i odchylenie standardowe w tym badaniu.

Zaczniemy od policzenia średniej

x-=5·4+2·5+4·6+6·7+3·85+2+4+6+3=12020=6.
  • sposób I

Obliczymy wariancję, korzystając ze wzoru podanego w twierdzeniu. W tym celu obliczymy średnią kwadratów otrzymanych wyników

5·42+2·52+4·62+6·72+3·825+2+4+6+3=76020=38.

Stąd wariancja jest równa σ2=38-x-2=38-36=2 i odchylenie standardowe σ=2.

  • sposób II

Obliczymy wariancję, posługując się definicją. Odchylenia poszczególnych wyników od średniej zamieścimy w tabeli.

Wynik xi

Odchylenie xi-x-

Częstość

4
4-6=2
5
5
5-6=1
2
6
6-6=0
4
7
7-6=1
6
8
8-6=2
3

Podstawiając wyniki do wzoru na wariancję, otrzymujemy:

σ2=522+212+402+612+3225+2+4+6+3=4020=2.
1
Przykład 6

W pewnej szkole przeprowadzono ankietę, w której zadano uczniom pytanie „Ile książek przeczytałeś/łaś w ciągu ostatnich dwóch tygodni?”. Wyniki ankiety przedstawiono na diagramie.

Rj3y74J8c4KmQ1
Źródło: Zespół autorski Politechniki Łódzkiej, licencja: CC BY 3.0.

Obliczymy wariancję i odchylenie standardowe otrzymanych wyników.
Dla otrzymanych wyników możemy przyjąć następujące wagi:

1 książka

2 książki

3 książki

4 książki

Suma wag

0,1
0,4
0,3
0,2
1

Średnia ważona otrzymanych wyników jest równa

x-w=0,1·1+0,4·2+0,3·3+0,2·4=0,1+0,8+0,9+0,8=2,6.

Licząc wariancję, posłużymy się wzorem z twierdzenia

σ2=0,1·12+0,4·22+0,3·32+0,2·421-2,62=0,1+1,6+2,7+3,2-6,76=0,84.

Wtedy odchylenie standardowe jest równe σ0,92.

1
Przykład 7

Michał przeprowadził doświadczenie, w którym mierzył m.in. czas ruchu pewnego ciała. Wykonał doświadczenie 10 razy i otrzymał następujące wyniki w sekundach:

Doświadczenie

Wynik

1
10,23
2
10,45
3
9,98
4
9,67
5
10,05
6
10,14
7
9,48
8
9,92
9
10,31
10
10,26

Wyznaczymy średni czas ruchu ciała oraz odchylenie standardowe w tym doświadczeniu.

Zaczniemy od policzenia średniej

x¯=10,23+10,45+9,98+9,67+10,05+10,14+9,48+9,92+10,31+10,2610=100,4910=10,049.

Podstawiając do wzoru na odchylenie standardowe dostajemy

σ=10,23-10,0492+10,45-10,0492+9,98-10,0492++10,31-10,0492+10,26-10,049210
=0,032761+0,160801+0,004761++0,068121+0,04452110=0,2834237111.
RryFpsw6kdMec1
Ćwiczenie 1
Jaką wartość liczbową przyjmuje odchylenie standardowe zestawu liczb: 5, 7, 11, 13? Zaznacz poprawną odpowiedź. Możliwe odpowiedzi: 1. 10 , 2. 8 , 3. 9 , 4. 10
Źródło: Zespół autorski Politechniki Łódzkiej, licencja: CC BY 3.0.
RPbVW4FxyiLH81
Ćwiczenie 2
Jaką wartość liczbową przyjmuje wariancja zestawu liczb: 4, 7, 9, 20? Zaznacz poprawną odpowiedź. Możliwe odpowiedzi: 1. 10 , 2. 12 , 3. 36,5 , 4. 146
Źródło: Zespół autorski Politechniki Łódzkiej, licencja: CC BY 3.0.
RbvaP6VqhFSBl1
Ćwiczenie 3
Jaką wartość liczbową przyjmuje wariancja, jeśli odchylenie standardowe pewnego zestawu danych jest równe 42? Zaznacz poprawna odpowiedź. Możliwe odpowiedzi: 1. 2 2 4 , 2. 2 2 , 3. 8 , 4. 32
Źródło: Zespół autorski Politechniki Łódzkiej, licencja: CC BY 3.0.
R4QqjaVEWHBlK1
Ćwiczenie 4
Który z poniższych zestawów liczb ma największe odchylenie standardowe? Zaznacz poprawną odpowiedź. Możliwe odpowiedzi: 1. 1, 2, 4, 6, 7, 2. 1, 2, 9, 10, 11, 3. 15, 15, 15, 15, 4. 10, 12, 14, 12
Źródło: Zespół autorski Politechniki Łódzkiej, licencja: CC BY 3.0.
2
Ćwiczenie 5
RP1I4iRD520ob1
Połącz w pary te zestawy danych, które mają jednakowe odchylenie standardowe. 5, 3, 4, 6 Możliwe odpowiedzi: 1. 11, 13, 14, 16, 2. 15, 13, 11, 9, 3. 15, 12, 13, 14 5, 2, 7, 4 Możliwe odpowiedzi: 1. 11, 13, 14, 16, 2. 15, 13, 11, 9, 3. 15, 12, 13, 14 12, 14, 16, 18 Możliwe odpowiedzi: 1. 11, 13, 14, 16, 2. 15, 13, 11, 9, 3. 15, 12, 13, 14
Źródło: Zespół autorski Politechniki Łódzkiej, licencja: CC BY 3.0.
2
Ćwiczenie 6
R1aE6jA625DJ0
Tabela przedstawia wyniki uzyskane na sprawdzianie z matematyki przez uczniów
klasy I. Oblicz średnią i odchylenie standardowe otrzymanych wyników, a następnie przeciągnij wyniki w odpowiednie luki.
Źródło: Zespół autorski Politechniki Łódzkiej, licencja: CC BY 3.0.
R1cOEe7GP76DU
W pewnej klasie z matematyki na koniec roku dwójka uczniów otrzymała ocenę niedostateczną, trójka uczniów otrzymało ocenę dopuszczającą, a siedmiu uczniów dostało ocenę dostateczną. Najwięcej było ocen dobrych, bo otrzymała ją grupa ośmiu uczniów. Były cztery oceny bardzo dobre oraz jedna osoba otrzymała ocenę celującą. Zaznacz odpowiednią średnią i odchylenie standardowe podanych ocen. Możliwe odpowiedzi: 1. x-=3,48, σ=1,24, 2. x-=3,6, σ=7,56, 3. x-=3,48, σ=1,34, 4. x-=2,48, σ=2,24
Źródło: Zespół autorski Politechniki Łódzkiej, licencja: CC BY 3.0.
2
Ćwiczenie 7
R1XGBDcInWzm6
Diagram słupkowy przedstawia wyniki uzyskane na sprawdzianie z matematyki przez uczniów klasy III. Oblicz średnią i odchylenie standardowe otrzymanych wyników, a następnie przeciągnij odpowiedzi w wyznaczone luki.
Źródło: Zespół autorski Politechniki Łódzkiej, licencja: CC BY 3.0.
RYOQvUPuCtcKP
W III klasie ze sprawdzianu z matematyki czworo uczniów otrzymało ocenę niedostateczną, sześciu uczniów – ocenę dopuszczającą, a ośmiu uczniów – ocenę dostateczną. Ocenę dobrą otrzymała grupa pięciu uczniów. Były trzy oceny bardzo dobre oraz jedna osoba otrzymała ocenę celującą. Zaznacz odpowiednią średnią i odchylenie standardowe podanych ocen. Możliwe odpowiedzi: 1. x-=3,48, σ=1,33, 2. x-=3, σ=1,33, 3. x-=5,48, σ=1,34, 4. x-=2,17, σ=2,24
Źródło: Zespół autorski Politechniki Łódzkiej, licencja: CC BY 3.0.
R1Yzuwk6XWzul21
Ćwiczenie 8
Uporządkuj zestawy danych w kolejności wzrastającej wariancji. Elementy do uszeregowania: 1. 1, 10, 4, 12, 2. 8, 8, 8, 8, 3. 3, 1, 7, 5, 4. 9, 4, 1, 6, 5. 6, 6, 5, 7
Źródło: Zespół autorski Politechniki Łódzkiej, licencja: CC BY 3.0.
2
Ćwiczenie 9
R11e8zNsQVUbT1
Uporządkuj podane liczby rosnąco. Elementy do uszeregowania: 1. 0,88, 2. 23, 3. 35, 4. 2325, 5. 0,8
Źródło: Zespół autorski Politechniki Łódzkiej, licencja: CC BY 3.0.
R4qUmEqvNDbvw21
Ćwiczenie 10
Uporządkuj podane liczby malejąco. Elementy do uszeregowania: 1. 2913, 2. 32311, 3. 32,3, 4. 3,23, 5. 3,223
Źródło: Zespół autorski Politechniki Łódzkiej, licencja: CC BY 3.0.
2
Ćwiczenie 11
R3lgFGLUCVIPx
Oblicz odchylenie standardowe podanego zestawu danych: 15,12, 17, 10, 13, 8, 10, 16. Wynik zaokrąglij do całości, a następnie zaznacz poprawną odpowiedź. Możliwe odpowiedzi: 1. 3, 2. 1, 3. 5, 4. 2
Źródło: Zespół autorski Politechniki Łódzkiej, licencja: CC BY 3.0.
2
Ćwiczenie 12

Tomek każdego dnia rano, jadąc do szkoły, porównywał czas przyjazdu tramwaju z informacją umieszczoną na przystanku. Przez kolejne dni notował w zeszycie, ile minut spóźniał się tramwaj. Oblicz, ile przeciętnie minut spóźniał się tramwaj.

poniedziałek

wtorek

środa

czwartek

piątek

3,5 min
6 min
2,5 min
0 min
3 min
RxWRLxhdZJx0n
Uzupełnij poniższe zdanie, wpisując w lukę odpowiednią liczbę. Odchylenie przeciętne przyjazdu tramwaju wyniosło Tu uzupełnij min.
Źródło: Zespół autorski Politechniki Łódzkiej, licencja: CC BY 3.0.
2
Ćwiczenie 13
RI4kBWXMA93KB
Zaznacz takie trzy liczby, dla których średnia jest równa 7 i odchylenie standardowe jest większe od 2,3. 4 10 7 2 5 15
Źródło: Zespół autorski Politechniki Łódzkiej, licencja: CC BY 3.0.
2
Ćwiczenie 14

Magda, przygotowując się do matury, postanowiła sprawdzić, ile godzin dziennie przeznacza na naukę. W tym celu przez dwa tygodnie codziennie zapisywała wyniki w tabeli, a następnie zaznaczyła je na wykresie. Oblicz średnią liczbę czasu poświęconego na naukę i odchylenie standardowe w pierwszym tygodniu, w drugim oraz w całym okresie dwóch tygodni.

RIM6v3ywS49351
Źródło: Zespół autorski Politechniki Łódzkiej, licencja: CC BY 3.0.
REqpzXYPivHeJ
(Uzupełnij).
Źródło: Zespół autorski Politechniki Łódzkiej, licencja: CC BY 3.0.
3
Ćwiczenie 15

Odpowiedz na pytania.

  1. Jaka jest wariancja i jakie jest odchylenie standardowe zestawu liczb: 2, 4, 6, 8, 10? Jak zmienią się wariancja i odchylenie standardowe, jeżeli każdą z podanych liczb zwiększymy dwa razy?

  2. Średnia arytmetyczna zestawu pięciu liczb: a, b, c, d, e jest równa x-, a odchylenie standardowe σ. Jak zmienią się te dwa wskaźniki, gdy każdą z liczb tego zestawu zwiększymy trzy razy?

RON5mzvSZpCF0
(Uzupełnij).
Źródło: Zespół autorski Politechniki Łódzkiej, licencja: CC BY 3.0.
3
Ćwiczenie 16

W pewnej szkole przeprowadzono badanie dotyczące liczby dzieci w rodzinach uczniów. Wyniki przedstawiono na diagramie.

R1S99PUJrb8Lw1
Źródło: Zespół autorski Politechniki Łódzkiej, licencja: CC BY 3.0.
R1YMvcSTYuQOj
Oblicz wariancję i odchylenie standardowe otrzymanych wyników. Wyniki wpisz w luki. σ2= Tu uzupełnij σ Tu uzupełnij
Źródło: Zespół autorski Politechniki Łódzkiej, licencja: CC BY 3.0.
3
Ćwiczenie 17

Na lekcji fizyki przeprowadzono doświadczenie, podczas którego mierzono temperaturę pewnej próbki umieszczonej w określonych warunkach. Wyniki zapisano w tabeli.

Nr próbki

Temperatura

1
23,12
2
23,71
3
22,93
4
23,34
5
23,19
6
23,45
7
23,65
8
23,74
9
23,48
10
23,62
R1Zs5GkooxWWU
Oblicz średnią temperaturę oraz wariancję i odchylenie standardowe w tym badaniu. Każdy z otrzymanych wyników wpisz z dokładnością do 0,01. x¯= Tu uzupełnij σ2= Tu uzupełnij σ Tu uzupełnij
Źródło: Zespół autorski Politechniki Łódzkiej, licencja: CC BY 3.0.