Wróć do informacji o e-podręczniku Wydrukuj Pobierz materiał do EPUB Pobierz materiał do MOBI Zaloguj się, aby dodać do ulubionych Zaloguj się, aby skopiować i edytować materiał Zaloguj się, aby udostępnić materiał Zaloguj się, aby dodać całą stronę do teczki

Warto przeczytać

Rozkład normalnyRozkład normalny (rozkład Gaussa)Rozkład normalny, zwany także rozkładem Gaussa (nazw tych będziemy używać wymiennie), odnaleźć można niemalże we wszystkich procesach zachodzących w przyrodzie i we wszystkich dziedzinach życia. Nasze codzienne działania także podlegają temu rozkładowi, chociaż najczęściej nie zdajemy sobie z tego sprawy. Tylko czasami jakiś fizyk, kiedy spóźni się na pociąg, powie wzburzony: „Znów zapomniałem, że Gauss ma takie długie „ogony”.

Codziennie wykonujemy wiele czynności, którym poświęcamy określoną ilość czasu w określonych porach dnia: wstajemy rano o godzinie ..., myjemy się przez … minut, śniadanie zajmuje … minut, a droga do szkoły czy pracy … itd. W wykropkowane miejsca moglibyśmy wstawić najbardziej prawdopodobne liczby, ale wiemy, że jest mało prawdopodobne, by jutro wszystko przebiegło właśnie tak, z dokładnością co do minuty. Zbyt wiele różnych czynników może mieć wpływ na przebieg każdej z tych czynności. Weźmy za przykład czas dojazdu do szkoły czy pracy: oczekiwanie na autobus, układ świateł na skrzyżowaniach, „korki” na ulicy, wypadek na drodze itd.

Te przykłady pokazują, że jeśli na zachodzenie jakiegoś procesu ma wpływ wiele różnych czynników, których nie możemy przewidzieć, bo są zdarzeniami losowymi, to ich sumaryczny wpływ na przebieg tego procesu i końcowy jego rezultat można znać tylko ze skończoną dokładnością. Określamy więc najbardziej prawdopodobną wartość, ale dobrze jest określić także inną, która charakteryzuje od niej odstępstwa, czyli jakiś „margines bezpieczeństwa”, by nie spóźnić się do szkoły, pracy, czy na pociąg.

Ale jak dowiedzieć się, ile wynosi ta najbardziej prawdopodobna wartość i jak oszacować margines bezpieczeństwa? Czy istnieje jakieś uniwersalne prawo, które rządzi takimi procesami?

Tak, istnieje – te wszystkie procesy opisuje rozkład normalnyRozkład normalny (rozkład Gaussa)rozkład normalny, a wspomniane tu dwie ważne informacje: najbardziej prawdopodobna wartość i „margines bezpieczeństwa”, to nic innego, tylko dwa parametry tego rozkładu. O tym, że to właśnie rozkład normalny opisuje takie procesy, mówi jedno z najważniejszych praw statystyki „Centralne Twierdzenie GraniczneCentralne twierdzenie graniczneCentralne Twierdzenie Graniczne”, sens którego w mocno uproszczonej postaci można sformułować następująco „Zbiór wielu niezależnych zmiennych losowych ma w przybliżeniu rozkład normalny”.

Te „zmienne losowe” to zdarzenia, które mogą (choć nie muszą) się wydarzyć, ale które mają wpływ na końcowy rezultat. W naszym przykładzie tym końcowym rezultatem jest czas jazdy autobusu.

Fenomen rozkładu normalnegoRozkład normalny (rozkład Gaussa)rozkładu normalnego polega na tym, że przy ogromnej różnorodności czynników mających wpływ na przebieg danego procesu i przy ogromnej różnorodności procesów zachodzących w przyrodzie, ich sumaryczny efekt dany jest właśnie w postaci rozkładu normalnego.

Rozkład normalnyRozkład normalny (rozkład Gaussa)Rozkład normalny odgrywa ogromną rolę w analizie i ocenie dokładności pomiarów. Jeśli na wynik pomiaru ma wpływ wiele różnorodnych czynników, a zwykle ma, to wyniki pomiarów mają rozkład normalny, a parametry tego rozkładu charakteryzują wartość wielkości mierzonej oraz dokładność jej wyznaczenia.

Rozkład normalnyRozkład normalny (rozkład Gaussa)Rozkład normalny należy do klasy rozkładów prawdopodobieństwa zmiennych losowych. Oznacza to, że wykres tego rozkładu ma na osi x wartości zmiennej losowej, a na osi y prawdopodobieństwa tych wartości. Kształt tego rozkładu opisuje krzywa Gaussa. (Więcej o krzywej Gaussa znajdziesz w e‑materiale „Krzywa Gaussa i odchylenie standardowe”.)

Kształt rozkładu normalnego opisuje funkcja postaci

gdzie a oraz σ (sigma) są parametrami tej funkcji, (podstawa logarytmów naturalnych) to liczba niewymierna, ale możemy ją poznać do takiej (skończonej!) liczby miejsc dziesiętnych, do jakiej sobie zażyczymy (choć w fizyce nie należy z tym przesadzać ponad dokładność, z jaką znamy pozostałe wielkości „uczestniczące” w naszych obliczeniach).

RCMHmDXZZiMCO
Rys. 1. Kształty rozkładów Gaussa dla zadanych wartości parametrów
Źródło: Politechnika Warszawska, Wydział Fizyki, licencja: CC BY 4.0.

Wartości obu parametrów są liczbami rzeczywistymi; parametr σ jest zawsze dodatni. Na Rys. 1. pokazane są przykładowe rozkłady dla różnych wartości parametrów. Warto zwrócić uwagę, że rozkłady osiągają maksimum dla x=a i są symetryczne względem tej wartości oraz, że większym wartościom σ odpowiada większa szerokość i mniejsza wysokość rozkładu. Jest tak, ponieważ pole pod krzywą każdego rozkładu równe jest jedności - mówimy, że rozkłady te są unormowane. Zakres zmienności x rozciąga się od minus do plus nieskończoności, chociaż widać, szczególnie dla małych wartości σ, że wartości y szybko maleją, kiedy oddalamy się od maksimum rozkładu, czyli x=a. Parametr a jest wartością średnią (inaczej: przeciętną, oczekiwaną), a parametr σ charakteryzujący szerokość rozkładu jest odchyleniem standardowym.

Czerwoną krzywą pokazany jest rozkład dla a = 0, σ = 1. Jest to tzw. standardowa postać rozkładu normalnego, którą wyraża wzór

To właśnie ten wzór i rozkład umieszczony jest na ścianie Biblioteki UW w Warszawie.

Na Rys. 2 a, b, c. pokazany jest standardowy rozkład GaussaRozkład normalny (rozkład Gaussa)rozkład Gaussa, na którym zaznaczone są obszary, dla których wartość x mieści się w zakresie jednego, dwóch i trzech odchyleń standardowych. Jest też informacja, jaką powierzchnię pod krzywą obszary te zajmują. Wielkości tych obszarów to prawdopodobieństwa uzyskania wyników pomiarów w zakresie różniącym się od wartości oczekiwanej o wartość jednego, dwóch i trzech odchyleń standardowych. Pole pod wykresem na całej osi wynosi 1.

R1PE4n3Q3q7Qm
Rys. 2. Pola powierzchni pod wykresem rozkładu Gaussa dla obszarów odchyleń od średniej: (a) o najwyżej jedno odchylenie standardowe, (b) o dwa, (c) o trzy. Używamy tu zmiennej niezależnej wyrażonej w jednostkach odchylenia standardowego.
Źródło: Politechnika Warszawska, Wydział Fizyki, licencja: CC BY 4.0.

Wracając do naszego przykładu – w zakresie jednego odchylenia standardowego mieści się ok. 67% czasów jazdy, a w zakresie trzech ok. 99,7%. Pozostałe trzy promile to tak duże czasy, że zwykle uważamy je za niemożliwe. To są jednak te „ogony” rozkładu GaussaRozkład normalny (rozkład Gaussa)rozkładu Gaussa, z powodu których nasz fizyk spóźnił się na dworzec, to gdzieś daleko w takim „ogonie” znalazło się zniszczenie przez tsunami elektrowni w Fukushimie, czego nikt się nie spodziewał. Cóż, zdarzenia mało prawdopodobne też mogą się wydarzyć, bo „ogony” rozkładu normalnego rozciągają się od minus do plus nieskończoności.

W naszym przykładzie parametr a, czyli wartość (oryg. przeciętna) średnia, to także najbardziej prawdopodobny czas jazdy, a σ czyli odchylenie standardowe, to ten „margines bezpieczeństwa”, czyli wielkość charakteryzująca rozrzut czasów przejazdu wokół wartości przeciętnej. Wartości aσ nie znamy, ale możemy oszacować a obliczając średnią z wielu prób, jakimi w naszym przykładzie są poszczególne czasy przejazdu oraz obliczając średnią wartość różnicy pomiędzy średnią a wynikami kolejnych prób, czyli czasów przejazdu – by oszacować σ.

Napiszmy więc wzory, według których będziemy mogli znaleźć najlepsze przybliżenia parametrów rozkładu GaussaRozkład normalny (rozkład Gaussa)rozkładu Gaussa dla analizowanego przez nas procesu. Podstawą do tych obliczeń będą wyniki wielu pomiarów, np. czasów przejazdu w przeciągu miesiąca.

Oznaczmy przez n liczbę wykonanych pomiarów.

Wartość średnia (przeciętna) rozkładu a jest dobrze przybliżana przez wartość średnią wszystkich wyników.

Jest to średnia arytmetyczna.

Odchylenie standardowe σ jest dobrze przybliżane niepewnością standardową pojedynczego pomiaru

Jest to pierwiastek kwadratowy ze średniej wartości kwadratów różnic pojedynczych pomiarów i wartości średniej.

Można zapytać: Po co komplikować życie i podnosić do kwadratu, a potem wyciągać pierwiastek? Nie prościej zwyczajnie policzyć średnią różnicę pomiędzy wartością średnią i wynikami kolejnych pomiarów?

Nie – są po temu dwa powody.

  1. Kiedy obliczymy sumę różnic pomiędzy wynikami pomiarów a wartością średnią policzoną z tych właśnie pomiarów zgodnie ze wzorem (3) to dostaniemy zero. Różnice te są zarówno dodatnie jak i ujemne i wzajemnie się kompensują. Możesz to łatwo sprawdzić.

  2. Kwadraty różnic są zawsze dodatnie, więc się nie kompensują. Można też wykazać, że tak policzone średnie odchylenie pojedynczego pomiaru jest dobrym przybliżeniem odchylenia standardowego dla rozkładu normalnegoRozkład normalny (rozkład Gaussa)rozkładu normalnego.

Tu należy jednak zwrócić uwagę, że wzór (4) byłby całkowicie poprawny, gdybyśmy wyniki pomiarów odejmowali od wartości oczekiwanej rozkładu normalnegoRozkład normalny (rozkład Gaussa)rozkładu normalnego. Wartości tej jednak nie znamy, więc odejmujemy każdy wynik od wartości średniej, która sama jest wyliczona na podstawie n wykonanych pomiarów. Znając wartość średnią i wyniki n - 1 pomiarów, możemy bez trudu wyliczyć, jaki był wynik pomiaru n. Nie jest to więc pomiar niezależny! Pomiarów niezależnych jest n 1 , więc poprawny wzór, w którym różnice liczymy pomiędzy wartością średnią a wynikami pomiarów, ma postać

Tu warto dodać, że dla większej liczby pomiarów różnice pomiędzy wartościami wyliczonymi z pomocą wzorów (4) i (5) są bardzo niewielkie, chociaż sx jest zawsze większe niż σ x. Zauważ też, że na kalkulatorach z możliwością obliczeń statystycznych masz dwie opcje liczenia odchylenia standardowego oznaczone: σ xsx. Warto jeszcze dodać, że niepewność standardowa wartości średniej wyrażona jest wzorem

Porównując wzory (6) i (5), widzimy, że .

Patrząc na postać wzorów (5) i (6), możemy zauważyć, że - wraz ze wzrostem liczby pomiarów n - będziemy znać dokładniej wartość niepewności standardowej pojedynczego pomiaru, a niepewność standardowa wartości średniej będzie się zmniejszać jak 1 / n .

Rozważania nasze odnoszą się do wszelkich procesów i pomiarów, w których istotną role odgrywają czynniki przypadkowe i - w rezultacie przy powtarzaniu pomiaru tej samej wielkości - uzyskujemy różne wyniki. Wybraliśmy jeden taki proces (czas jazdy autobusu), ale bez trudu moglibyśmy podać mnóstwo podobnych przykładów, od fizyki zaczynając, a kończąc na wynikach sportowych, przewidywaniu pogody, czy sondażach opinii publicznej.

Tak, rozkład normalny wart jest swojego miejsca na frontowej ścianie gmachu Biblioteki Uniwersytetu Warszawskiego.

Słowniczek

Rozkład normalny (rozkład Gaussa)
Rozkład normalny (rozkład Gaussa)

(ang. normal distribution) - rozkład prawdopodobieństwa określony wzorem Gaussa, , gdzie aσ są parametrami. Parametr a określa wartość oczekiwaną zmiennej x, zaś σ określa odchylenie standardowe. Rozkład jest unormowany do jedności.

Centralne twierdzenie graniczne
Centralne twierdzenie graniczne

(ang. central limit theorem) - uzasadnia znaczenie rozkładu normalnego poprzez stwierdzenie, że suma (mnogościowa) wielu niezależnych zmiennych losowych przybiera kształt rozkładu normalnego, kiedy liczebność serii wyników dąży do nieskończoności.