Warto przeczytać

Prosta prawdę ci powie

Jak można jakościowo ocenić stopień skorelowania dwóch zmiennych, przedstawionych w postaci chmury punktów na wykresie? Takim czytelnym graficznym wzorcem jest linia prosta. Tu, być może, zaprotestujesz: przecież linia prosta przechodzi przez dwa punkty, a niekoniecznie przez chmurę kilku, kilkunastu czy kilkudziesięciu punktów.

To prawda. Tutaj jednak chodzi nie o przechodzenie przez punkty, lecz w ich pobliżu. Chodzi też o możliwie dobre oddanie ich ułożenia, gdy nie leżą one na jednej prostej. A tak właśnie zdarza się najczęściej, gdy prowadzimy pomiary.

Wróćmy do przykładu z Wprowadzenia - z wynikami konkursu skoków narciarskich. Zgodzisz się, że spośród różnych możliwych prostych jedne pasują do chmury punktów lepiej, inne zaś gorzej (Rys. 1.).

R1QWWDx2v3hQw
Rys. 1. Próba dopasowania czterech prostych do ułożenia punktów pomiarowych.
Źródło: Politechnika Warszawska, Wydział Fizyki, licencja: CC BY 4.0.

Prosta nr 1 to jawne nieporozumienie. Przechodzi ona niemal w poprzek chmury punktów, zamiast przechodzić wzdłuż niej.  Wskazuje na tendencję malejącą, czyli korelację ujemną. Tymczasem punkty sprawiają ogólne „wrażenie rosnące”: im skok dłuższy, tym - średnio rzecz biorąc - więcej punktów uzyskał zawodnik na koniec konkursu.
Prosta nr 2 też nie oddaje ułożenia punktów. Jej przebieg wskazywałby na brak korelacji. Zgodnie ze wskazywaną tendencją liczba punktów w całym konkursie byłaby - średnio rzecz biorąc - stała, tj. niezależna od długości skoku.
Prosta nr 3 przyzwoicie oddaje jedną cechę chmury punktów: jej tendencję wzrostową; czyli korelację dodatnią. Natomiast nie oddaje właściwie położenia środka ciężkości chmury - przebiega zbyt nisko na wykresie.
Prosta nr 4 najlepiej (spośród czterech narysowanych na wykresie) oddaje ułożenie chmury punktów - to nie podlega dyskusji. Wskazuje ona na tendencję rosnącą, charakteryzującą chmurę punktów jako całość; przechodzi blisko środka tej chmury.

Ważne!

Linie proste na wykresie (x; y), które nie są prostopadłe do osi odciętych, są wykresami funkcji liniowej. Taką funkcję zapisujemy w postaci y(x) = ax + b, gdzie a jest tzw. współczynnikiem kierunkowym prostej, a b jest tzw. wyrazem wolnym tej prostej, równym wartości y dla x = 0.

Współczynnik kierunkowy a określa nachylenie prostej do osi OX. Gdy jest on dodatni, funkcja liniowa jest rosnąca. W przeciwnym razie jest ona malejąca. Linia prostopadła do osi rzędnych jest wykresem funkcji liniowej stałej, dla której a = 0.
Określenie konkretnej prostej polega na podaniu wartości obu współczynników funkcji liniowej.

Wniosek

Dzięki temu rozumowaniu możemy stwierdzić, że łączna liczba uzyskanych punktów i długość drugiego skoku są wielkościami skorelowanymi dodatnio. Nawet gdybyśmy nie znali zasady punktacji, to właśnie odkryliśmy jeden z jej aspektów: warto skakać jak najdalej. A brak idealnej korelacji podpowiada dodatkowo, że mogą być jeszcze inne aspekty skoku, o które warto dbać. Czy to Ci przypomina badanie przyrody i rozpoznawanie, krok po kroku, zasad, którymi się ona rządzi?

Jak określić prostą najlepiej dopasowaną do punktów?

Praktycznie wszystkie nauki dopuszczają graficzne określanie najlepiej dopasowanej prostejDopasowanie prostejdopasowanej prostej, poprzez wizualne ocenianie jej ułożenia na tle punktów. Wtedy przepis jest łatwy do zrozumienia: prosta ma przechodzić jak najbliżej wszystkich punktów pomiarowych i w pobliżu wyobrażonego środka chmury tych punktów.

Ważne!

Tak dopasowana prosta nie musi przechodzić przez którykolwiek z punktów pomiarowych, lecz właśnie możliwe blisko nich wszystkich jednocześnie. Podczas wizualnej oceny ułożenia prostej powinniśmy starać się traktować wszystkie punkty równoprawnie.

Jeśli wykres z punktami pomiarowymi wydrukowaliśmy (albo wykonaliśmy ręcznie) na arkuszu papieru, to stosujemy „metodę przezroczystej linijki” (to nazwa żartobliwa, ale znana i sugestywna). Kładziemy taką linijkę na arkuszu papieru i tak długo ją przesuwamy i obracamy, aż uznamy, że najlepiej pasuje do układu punktów. Wtedy unieruchamiamy linijkę i kreślimy przy niej linię prostą.

Gdy korzystamy z programu graficznego, to na wykres zawierający punkty pomiarowe nakładamy linię prostą. Korzystamy z możliwości jej przesuwania i obracania na tle punktów, na przykład za pomocą myszki. Podobnie jak w wersji „papierowej”, szukamy takiego ułożenia tej linii, by przebiegała możliwe blisko wszystkich punktów jednocześnie, przez wyobrażony środek ich układu. Tak została poprowadzona prosta nr 4 na Rys. 1.

Współczynnik kierunkowy, czyli nachylenie prostej najlepiej dopasowanej

Na Rys. 2. pokazano tę samą prostą. Wybrano na niej dwa punkty, A i B;  nie mają one żadnego związku z punktami pomiarowymi. Ułożono je na liniach siatki wykresu, możliwe daleko od siebie. Ułatwia to odczyt ich współrzędnych i zwiększa precyzję obliczeń. Bezpośrednio możemy odczytać współrzędne dA=140 m oraz pB=240 pk (taki skrót zastosujemy dla „punktów konkursowych” - jest to jednostka zmiennej p). Możemy także oszacować pA=288 pk oraz dB=124 m.

R19xUOGZPit04
Rys. 2. Dowolne dwa punkty A i B na prostej najlepiej dopasowanej pozwalają wyznaczyć jej parametry. Współrzędnych dA oraz pB nie zaznaczono dla czytelności rysunku.
Źródło: Politechnika Warszawska, Wydział Fizyki, licencja: CC BY 4.0.

Dzięki tym odczytom możemy obliczyć współczynnik kierunkowy a dopasowanej prostej. Jest on równy jej nachyleniu względem osi odciętych:

a=ΔpΔd=pApBdAdB=(288240) pk(140124) m=3 pkm

Co to znaczy? To znaczy, że „statystyczny skoczek” za każdy metr odległości swego skoku otrzymał 3 punkty konkursowe. Kto więc skoczył o metr dalej niż konkurent, mógł liczyć - średnio rzecz biorąc - na 3 punkty więcej w końcowej punktacji konkursu, niż tenże konkurent. W tej interpretacji należy pamiętać, że nie jest ona regułą, lecz przedstawia efekt uśrednienia.

Wyraz wolny, czyli gdzie prosta najlepiej dopasowana przecina oś rzędnych?

Jeśli na wykresie występuje punkt o odciętej równej zero, to odczytujemy bezpośrednio wartość wyrazu wolnego b jako miejsce na osi rzędnych, w którym prosta przecina tę oś.
Na naszym wykresie żadna z osi nie jest ujawniona - to świadomy wybór. Nie interesują nas wartości z okolic d = 0 - żaden ze skoczków nie oddał tak krótkiego skoku. Podobnie, żaden z nich nie uzyskał zero, kilku czy nawet kilkudziesięciu punktów. Wyznaczenie wyrazu wolnego wymaga więc przeprowadzenia rozumowania i obliczenia. Wykaż, we własnym zakresie, że wynika z nich wartość b = - 132 pk.

Jak to rozumieć? No cóż, gdyby zgłoszony do konkursu zawodnik oddał skok na odległość d = 0, to mógłby - znowuż: średnio rzecz biorąc - liczyć na uzyskanie ... minus 132 punktów w konkursie. Ta informacja, choć formalnie poprawna, nie wnosi niczego ważkiego do statystycznej interpretacji wyników konkursu.

Ważne!

Uzyskana w ten subiektywny sposób prosta ma nieco ograniczoną wiarygodność. Wynika to nie tylko z ułożenia samej prostej - jest oczywiste, że każdy może nieco inaczej oceniać to ułożenie. Każdy może też nieco inaczej odczytywać i zaokrąglać współrzędne punktów AB. Wartości parametrów takiej prostej są więc siłą rzeczy przybliżone. Co ważniejsze, nie sposób określić, jak dobre jest to przybliżenie.
Może to być istotne, gdy zależy nam na dokładnych pomiarach i na obliczeniu niepewności uzyskanego wyniku. A tak na ogół jest w fizyce.

Dopasowanie prostej metodą najmniejszych kwadratów

Obiektywna metoda...

...znalezienia równania tej jedynej prostej, która optymalnie odzwierciedla ogólną tendencję zależności pomiędzy dwiema zmiennymi, wymaga przede wszystkim określenia kryterium optymalizacji. Jedna z powszechnie stosowanych metod to tzw. metoda najmniejszych kwadratówMetoda Najmniejszych Kwadratówmetoda najmniejszych kwadratów. Polega ona na wskazaniu tej prostej, dla której suma kwadratów odległości wszystkich punktów od tej prostej jest najmniejsza. Cechą metody jest, że odległości te liczone są równolegle do osi rzędnych - na Rys. 3. pokazano dwie takie odległości od prostej dopasowanej tą właśnie metodą: dla punktu nr 3 i punktu nr 26.

R1Qx3DBJ9eTDi
Rys. 3. Prosta dopasowana metodą najmniejszych kwadratów. Suma kwadratów odległości wszystkich 30 punktów od tej właśnie prostej jest najmniejsza z możliwych.
Źródło: Politechnika Warszawska, Wydział Fizyki, licencja: CC BY 4.0.
Stosowanie metody najmniejszych kwadratów...

...sprowadza się do przeprowadzenia dwóch dość żmudnych obliczeń: wynikiem jednego jest wartość współczynnika kierunkowego a najlepiej dopasowanej prostej, wynikiem drugiego zaś jest wartość jej wyrazu wolnego b. Są one dostępne w postaci gotowych formuł w każdym typowym arkuszu kalkulacyjnym oraz w każdej aplikacji z funkcjami statystycznymi.
Prosta uzyskana metodą najmniejszych kwadratów jest na ogół wykreślana w ramach oprogramowania użytego do obliczenia wartości współczynników a oraz b.

Zastosowanie tych wzorów w naszym przypadku pozwala obliczyć wartości:

a=3,43 pkm
b=188 pk

Jak widać, wartości te (zaokrąglone do trzech cyfr znaczących) potwierdzają, że metoda wizualna pozwala graficznie określić najlepiej dopasowaną prostą w sposób przybliżony.

Dla zainteresowanych

Wzorów tych nikt nie stara się zapamiętać - jeśli interesuje Cię ich postać - skorzystaj z przeglądarki internetowej.
Podobnie, gdyby zaintrygowało Cię, dlaczego minimalizujemy sumę kwadratów odległości (a nie sumę samych odległości), spróbuj samodzielnie wyszukać informacje na ten temat.
Wyprowadzenie tych wzorów wymaga wiadomości i umiejętności z zakresu matematyki, które zdecydowanie wykraczają poza program szkoły średniej. Gdyby Cię to naprawdę interesowało, dodatkowo wprowadź w przeglądarkę hasło „ekstremum lokalne funkcji dwóch zmiennych”.

Niepewność pomiarowa współczynników dopasowania prostej ...

... wynika z dwóch czynników. Na jeden z nich składają się kwadraty odległości punktów pomiarowych od tej prostej, czyli (na rys. 3.) d12, d22, itd. aż do d302. Drugi z nich związany jest z niepewnościami pomiarowymi, z jakimi zmierzone zostały współrzędne punktów: u(d) oraz u(p). Więcej o tych niepewnościach znajdziesz w e‑materiale „Przedstawianie niepewności pomiarowych w formie graficznej”.
Uwzględnienie tych czynników wymaga wiadomości i umiejętności z zakresu statystyki matematycznej daleko wykraczających poza program szkoły średniej.

Dlatego nie jest od Ciebie oczekiwana umiejętność wyznaczania niepewności u(a) oraz u(b), lecz jedynie umiejętność operowania tymi niepewnościami, gdy zostaną one podane w treści zadania.

Słowniczek

Dopasowanie prostej
Dopasowanie prostej

(ang. line fitting) znalezienie wartości parametrów funkcji liniowej postaci: y=ax+b takiej, że określona funkcja odległości punktów pomiarowych od prostej przyjmuje wartość minimalną. Funkcją tą najczęściej jest suma kwadratów odległości punktów pomiarowych od prostej.
Dopuszczalne jest także wizualne określanie takiej prostej za pomocą metody graficznej.

Metoda najmniejszych kwadratów
Metoda najmniejszych kwadratów

(ang: least‑squares method) metoda dopasowania zależności funkcyjnej y = f ( x ; a 1 , . . . , a n ) do układu punktów pomiarowych w ten sposób, aby suma kwadratów odległości funkcji od punktów przybierała wartość minimalną. Metoda najmniejszych kwadratów odniesiona do dopasowania zależności liniowej nazywana jest też regresją liniową.

Regresja liniowa
Regresja liniowa

(ang: linear regression) opis zależności pomiędzy dwiema zmiennymy z pomocą funkcji liniowej. Opis ten zwykle wykonywany jest metodą najmniejszych kwadratów. Metoda regresji włącza określenie ilościowe parametrów charakteryzujących korelacje pomiędzy zmiennymi.