Przeczytaj
Warto przeczytać
Prosta prawdę ci powie
Jak można jakościowo ocenić stopień skorelowania dwóch zmiennych, przedstawionych w postaci chmury punktów na wykresie? Takim czytelnym graficznym wzorcem jest linia prosta. Tu, być może, zaprotestujesz: przecież linia prosta przechodzi przez dwa punkty, a niekoniecznie przez chmurę kilku, kilkunastu czy kilkudziesięciu punktów.
To prawda. Tutaj jednak chodzi nie o przechodzenie przez punkty, lecz w ich pobliżu. Chodzi też o możliwie dobre oddanie ich ułożenia, gdy nie leżą one na jednej prostej. A tak właśnie zdarza się najczęściej, gdy prowadzimy pomiary.
Wróćmy do przykładu z Wprowadzenia - z wynikami konkursu skoków narciarskich. Zgodzisz się, że spośród różnych możliwych prostych jedne pasują do chmury punktów lepiej, inne zaś gorzej (Rys. 1.).
Prosta nr 1 to jawne nieporozumienie. Przechodzi ona niemal w poprzek chmury punktów, zamiast przechodzić wzdłuż niej. Wskazuje na tendencję malejącą, czyli korelację ujemną. Tymczasem punkty sprawiają ogólne „wrażenie rosnące”: im skok dłuższy, tym - średnio rzecz biorąc - więcej punktów uzyskał zawodnik na koniec konkursu.
Prosta nr 2 też nie oddaje ułożenia punktów. Jej przebieg wskazywałby na brak korelacji. Zgodnie ze wskazywaną tendencją liczba punktów w całym konkursie byłaby - średnio rzecz biorąc - stała, tj. niezależna od długości skoku.
Prosta nr 3 przyzwoicie oddaje jedną cechę chmury punktów: jej tendencję wzrostową; czyli korelację dodatnią. Natomiast nie oddaje właściwie położenia środka ciężkości chmury - przebiega zbyt nisko na wykresie.
Prosta nr 4 najlepiej (spośród czterech narysowanych na wykresie) oddaje ułożenie chmury punktów - to nie podlega dyskusji. Wskazuje ona na tendencję rosnącą, charakteryzującą chmurę punktów jako całość; przechodzi blisko środka tej chmury.
Linie proste na wykresie (x; y), które nie są prostopadłe do osi odciętych, są wykresami funkcji liniowej. Taką funkcję zapisujemy w postaci y(x) = ax + b, gdzie a jest tzw. współczynnikiem kierunkowym prostej, a b jest tzw. wyrazem wolnym tej prostej, równym wartości y dla x = 0.
Współczynnik kierunkowy a określa nachylenie prostej do osi OX. Gdy jest on dodatni, funkcja liniowa jest rosnąca. W przeciwnym razie jest ona malejąca. Linia prostopadła do osi rzędnych jest wykresem funkcji liniowej stałej, dla której a = 0.
Określenie konkretnej prostej polega na podaniu wartości obu współczynników funkcji liniowej.
Wniosek
Dzięki temu rozumowaniu możemy stwierdzić, że łączna liczba uzyskanych punktów i długość drugiego skoku są wielkościami skorelowanymi dodatnio. Nawet gdybyśmy nie znali zasady punktacji, to właśnie odkryliśmy jeden z jej aspektów: warto skakać jak najdalej. A brak idealnej korelacji podpowiada dodatkowo, że mogą być jeszcze inne aspekty skoku, o które warto dbać. Czy to Ci przypomina badanie przyrody i rozpoznawanie, krok po kroku, zasad, którymi się ona rządzi?
Jak określić prostą najlepiej dopasowaną do punktów?
Praktycznie wszystkie nauki dopuszczają graficzne określanie najlepiej dopasowanej prostejdopasowanej prostej, poprzez wizualne ocenianie jej ułożenia na tle punktów. Wtedy przepis jest łatwy do zrozumienia: prosta ma przechodzić jak najbliżej wszystkich punktów pomiarowych i w pobliżu wyobrażonego środka chmury tych punktów.
Tak dopasowana prosta nie musi przechodzić przez którykolwiek z punktów pomiarowych, lecz właśnie możliwe blisko nich wszystkich jednocześnie. Podczas wizualnej oceny ułożenia prostej powinniśmy starać się traktować wszystkie punkty równoprawnie.
Jeśli wykres z punktami pomiarowymi wydrukowaliśmy (albo wykonaliśmy ręcznie) na arkuszu papieru, to stosujemy „metodę przezroczystej linijki” (to nazwa żartobliwa, ale znana i sugestywna). Kładziemy taką linijkę na arkuszu papieru i tak długo ją przesuwamy i obracamy, aż uznamy, że najlepiej pasuje do układu punktów. Wtedy unieruchamiamy linijkę i kreślimy przy niej linię prostą.
Gdy korzystamy z programu graficznego, to na wykres zawierający punkty pomiarowe nakładamy linię prostą. Korzystamy z możliwości jej przesuwania i obracania na tle punktów, na przykład za pomocą myszki. Podobnie jak w wersji „papierowej”, szukamy takiego ułożenia tej linii, by przebiegała możliwe blisko wszystkich punktów jednocześnie, przez wyobrażony środek ich układu. Tak została poprowadzona prosta nr 4 na Rys. 1.
Współczynnik kierunkowy, czyli nachylenie prostej najlepiej dopasowanej
Na Rys. 2. pokazano tę samą prostą. Wybrano na niej dwa punkty, A i B; nie mają one żadnego związku z punktami pomiarowymi. Ułożono je na liniach siatki wykresu, możliwe daleko od siebie. Ułatwia to odczyt ich współrzędnych i zwiększa precyzję obliczeń. Bezpośrednio możemy odczytać współrzędne oraz (taki skrót zastosujemy dla „punktów konkursowych” - jest to jednostka zmiennej p). Możemy także oszacować oraz .
Dzięki tym odczytom możemy obliczyć współczynnik kierunkowy a dopasowanej prostej. Jest on równy jej nachyleniu względem osi odciętych:
Co to znaczy? To znaczy, że „statystyczny skoczek” za każdy metr odległości swego skoku otrzymał 3 punkty konkursowe. Kto więc skoczył o metr dalej niż konkurent, mógł liczyć - średnio rzecz biorąc - na 3 punkty więcej w końcowej punktacji konkursu, niż tenże konkurent. W tej interpretacji należy pamiętać, że nie jest ona regułą, lecz przedstawia efekt uśrednienia.
Wyraz wolny, czyli gdzie prosta najlepiej dopasowana przecina oś rzędnych?
Jeśli na wykresie występuje punkt o odciętej równej zero, to odczytujemy bezpośrednio wartość wyrazu wolnego b jako miejsce na osi rzędnych, w którym prosta przecina tę oś.
Na naszym wykresie żadna z osi nie jest ujawniona - to świadomy wybór. Nie interesują nas wartości z okolic d = 0 - żaden ze skoczków nie oddał tak krótkiego skoku. Podobnie, żaden z nich nie uzyskał zero, kilku czy nawet kilkudziesięciu punktów. Wyznaczenie wyrazu wolnego wymaga więc przeprowadzenia rozumowania i obliczenia. Wykaż, we własnym zakresie, że wynika z nich wartość b = - 132 pk.
Jak to rozumieć? No cóż, gdyby zgłoszony do konkursu zawodnik oddał skok na odległość d = 0, to mógłby - znowuż: średnio rzecz biorąc - liczyć na uzyskanie ... minus 132 punktów w konkursie. Ta informacja, choć formalnie poprawna, nie wnosi niczego ważkiego do statystycznej interpretacji wyników konkursu.
Uzyskana w ten subiektywny sposób prosta ma nieco ograniczoną wiarygodność. Wynika to nie tylko z ułożenia samej prostej - jest oczywiste, że każdy może nieco inaczej oceniać to ułożenie. Każdy może też nieco inaczej odczytywać i zaokrąglać współrzędne punktów A i B. Wartości parametrów takiej prostej są więc siłą rzeczy przybliżone. Co ważniejsze, nie sposób określić, jak dobre jest to przybliżenie.
Może to być istotne, gdy zależy nam na dokładnych pomiarach i na obliczeniu niepewności uzyskanego wyniku. A tak na ogół jest w fizyce.
Dopasowanie prostej metodą najmniejszych kwadratów
Obiektywna metoda...
...znalezienia równania tej jedynej prostej, która optymalnie odzwierciedla ogólną tendencję zależności pomiędzy dwiema zmiennymi, wymaga przede wszystkim określenia kryterium optymalizacji. Jedna z powszechnie stosowanych metod to tzw. metoda najmniejszych kwadratówmetoda najmniejszych kwadratów. Polega ona na wskazaniu tej prostej, dla której suma kwadratów odległości wszystkich punktów od tej prostej jest najmniejsza. Cechą metody jest, że odległości te liczone są równolegle do osi rzędnych - na Rys. 3. pokazano dwie takie odległości od prostej dopasowanej tą właśnie metodą: dla punktu nr 3 i punktu nr 26.
Stosowanie metody najmniejszych kwadratów...
...sprowadza się do przeprowadzenia dwóch dość żmudnych obliczeń: wynikiem jednego jest wartość współczynnika kierunkowego a najlepiej dopasowanej prostej, wynikiem drugiego zaś jest wartość jej wyrazu wolnego b. Są one dostępne w postaci gotowych formuł w każdym typowym arkuszu kalkulacyjnym oraz w każdej aplikacji z funkcjami statystycznymi.
Prosta uzyskana metodą najmniejszych kwadratów jest na ogół wykreślana w ramach oprogramowania użytego do obliczenia wartości współczynników a oraz b.
Zastosowanie tych wzorów w naszym przypadku pozwala obliczyć wartości:
Jak widać, wartości te (zaokrąglone do trzech cyfr znaczących) potwierdzają, że metoda wizualna pozwala graficznie określić najlepiej dopasowaną prostą w sposób przybliżony.
Wzorów tych nikt nie stara się zapamiętać - jeśli interesuje Cię ich postać - skorzystaj z przeglądarki internetowej.
Podobnie, gdyby zaintrygowało Cię, dlaczego minimalizujemy sumę kwadratów odległości (a nie sumę samych odległości), spróbuj samodzielnie wyszukać informacje na ten temat.
Wyprowadzenie tych wzorów wymaga wiadomości i umiejętności z zakresu matematyki, które zdecydowanie wykraczają poza program szkoły średniej. Gdyby Cię to naprawdę interesowało, dodatkowo wprowadź w przeglądarkę hasło „ekstremum lokalne funkcji dwóch zmiennych”.
Niepewność pomiarowa współczynników dopasowania prostej ...
... wynika z dwóch czynników. Na jeden z nich składają się kwadraty odległości punktów pomiarowych od tej prostej, czyli (na rys. 3.) , , itd. aż do . Drugi z nich związany jest z niepewnościami pomiarowymi, z jakimi zmierzone zostały współrzędne punktów: oraz . Więcej o tych niepewnościach znajdziesz w e‑materiale „Przedstawianie niepewności pomiarowych w formie graficznej”.
Uwzględnienie tych czynników wymaga wiadomości i umiejętności z zakresu statystyki matematycznej daleko wykraczających poza program szkoły średniej.
Dlatego nie jest od Ciebie oczekiwana umiejętność wyznaczania niepewności oraz , lecz jedynie umiejętność operowania tymi niepewnościami, gdy zostaną one podane w treści zadania.
Słowniczek
(ang. line fitting) znalezienie wartości parametrów funkcji liniowej postaci: takiej, że określona funkcja odległości punktów pomiarowych od prostej przyjmuje wartość minimalną. Funkcją tą najczęściej jest suma kwadratów odległości punktów pomiarowych od prostej.
Dopuszczalne jest także wizualne określanie takiej prostej za pomocą metody graficznej.
(ang: least‑squares method) metoda dopasowania zależności funkcyjnej do układu punktów pomiarowych w ten sposób, aby suma kwadratów odległości funkcji od punktów przybierała wartość minimalną. Metoda najmniejszych kwadratów odniesiona do dopasowania zależności liniowej nazywana jest też regresją liniową.
(ang: linear regression) opis zależności pomiędzy dwiema zmiennymy z pomocą funkcji liniowej. Opis ten zwykle wykonywany jest metodą najmniejszych kwadratów. Metoda regresji włącza określenie ilościowe parametrów charakteryzujących korelacje pomiędzy zmiennymi.