Przeczytaj

Warto przeczytać

Prosta prawdę ci powie

Jak można jakościowo ocenić stopień skorelowania dwóch zmiennych, przedstawionych w postaci chmury punktów na wykresie? Takim czytelnym graficznym wzorcem jest linia prosta. Tu, być może, zaprotestujesz: przecież linia prosta przechodzi przez dwa punkty, a niekoniecznie przez chmurę kilku, kilkunastu czy kilkudziesięciu punktów.

To prawda. Tutaj jednak chodzi nie o przechodzenie przez punkty, lecz w ich pobliżu. Chodzi też o możliwie dobre oddanie ich ułożenia, gdy nie leżą one na jednej prostej. A tak właśnie zdarza się najczęściej, gdy prowadzimy pomiary.

Wróćmy do przykładu z Wprowadzenia - z wynikami konkursu skoków narciarskich. Zgodzisz się, że spośród różnych możliwych prostych jedne pasują do chmury punktów lepiej, inne zaś gorzej (Rys. 1.).

R1QWWDx2v3hQw

Rys. 1. Na wykresie widoczny jest prostokątny układ współrzędnych, na którym pionowa oś wartości opisana jest jako łączna punktacja mała litera p. Na osi tej zaznaczono wartości od dwustu dwudziestu do trzystu co dwadzieścia. Oś pozioma opisana jest jako długość skoku mała litera d i w nawiasie kwadratowym mała litera m, wyrażona w metrach. Na osi tej zaznaczono wartości od stu dwudziestu do stu czterdziestu metrów co pięć metrów. Pole wykresu podzielone jest pionowymi i poziomymi czarnymi liniami ułatwiającymi odczyt wartości. Na wykresie widoczne są w postaci niebieskich punktów wyniki poszczególnych zawodników. W funkcji długości skoku zawodnika wartość uzyskanych punktów zazwyczaj rośnie, ale punkty i tak rozmieszczone są bardzo nieregularnie. Na wykresie widoczne są cztery funkcje liniowe narysowane kolorowymi liniami. Pierwsza z nich oznaczona cyfrą jeden jest malejąca i przechodzi tylko przez jeden z niebieskich punktów na wykresie. Funkcja ta jest niedopasowana do danych zawartych na wykresie. Druga funkcja opisana cyfrą dwa ma stałą wartość i przechodzi przez dwa niebieskie punkty. Funkcja ta również jest niedopasowana do danych na wykresie. Trzecia funkcja narysowana jest czerwoną linią i jest rosnąca. Przechodzi ona przez trzy punkty, równolegle do rosnącego trendu wyników ale obejmuje tylko punkty znajdujące się na dole rozrzuconych punktów. Czwarta funkcja jest najlepiej dopasowana. Narysowano ją brązową linią. Jest rosnąca i przechodzi przez cztery punkty a jej średnia odległość od wszystkich punktów na wykresie jest najmniejsza. Parametry takiej funkcji liniowej można wyznaczyć korzystając na przykład z metody najmniejszych kwadratów. — Rys. 1. Próba dopasowania czterech prostych do ułożenia punktów pomiarowych.
Źródło: Politechnika Warszawska, Wydział Fizyki, licencja: CC BY 4.0.

Prosta nr 1 to jawne nieporozumienie. Przechodzi ona niemal w poprzek chmury punktów, zamiast przechodzić wzdłuż niej. Wskazuje na tendencję malejącą, czyli korelację ujemną. Tymczasem punkty sprawiają ogólne „wrażenie rosnące”: im skok dłuższy, tym - średnio rzecz biorąc - więcej punktów uzyskał zawodnik na koniec konkursu.
Prosta nr 2 też nie oddaje ułożenia punktów. Jej przebieg wskazywałby na brak korelacji. Zgodnie ze wskazywaną tendencją liczba punktów w całym konkursie byłaby - średnio rzecz biorąc - stała, tj. niezależna od długości skoku.
Prosta nr 3 przyzwoicie oddaje jedną cechę chmury punktów: jej tendencję wzrostową; czyli korelację dodatnią. Natomiast nie oddaje właściwie położenia środka ciężkości chmury - przebiega zbyt nisko na wykresie.
Prosta nr 4 najlepiej (spośród czterech narysowanych na wykresie) oddaje ułożenie chmury punktów - to nie podlega dyskusji. Wskazuje ona na tendencję rosnącą, charakteryzującą chmurę punktów jako całość; przechodzi blisko środka tej chmury.

Ważne!

Linie proste na wykresie (x; y), które nie są prostopadłe do osi odciętych, są wykresami funkcji liniowej. Taką funkcję zapisujemy w postaci y(x) = ax + b, gdzie a jest tzw. współczynnikiem kierunkowym prostej, a b jest tzw. wyrazem wolnym tej prostej, równym wartości y dla x = 0.

Współczynnik kierunkowy a określa nachylenie prostej do osi OX. Gdy jest on dodatni, funkcja liniowa jest rosnąca. W przeciwnym razie jest ona malejąca. Linia prostopadła do osi rzędnych jest wykresem funkcji liniowej stałej, dla której a = 0.
Określenie konkretnej prostej polega na podaniu wartości obu współczynników funkcji liniowej.

Wniosek

Dzięki temu rozumowaniu możemy stwierdzić, że łączna liczba uzyskanych punktów i długość drugiego skoku są wielkościami skorelowanymi dodatnio. Nawet gdybyśmy nie znali zasady punktacji, to właśnie odkryliśmy jeden z jej aspektów: warto skakać jak najdalej. A brak idealnej korelacji podpowiada dodatkowo, że mogą być jeszcze inne aspekty skoku, o które warto dbać. Czy to Ci przypomina badanie przyrody i rozpoznawanie, krok po kroku, zasad, którymi się ona rządzi?

Jak określić prostą najlepiej dopasowaną do punktów?

Praktycznie wszystkie nauki dopuszczają graficzne określanie najlepiej dopasowanej prostejDopasowanie prostejdopasowanej prostej, poprzez wizualne ocenianie jej ułożenia na tle punktów. Wtedy przepis jest łatwy do zrozumienia: prosta ma przechodzić jak najbliżej wszystkich punktów pomiarowych i w pobliżu wyobrażonego środka chmury tych punktów.

Ważne!

Tak dopasowana prosta nie musi przechodzić przez którykolwiek z punktów pomiarowych, lecz właśnie możliwe blisko nich wszystkich jednocześnie. Podczas wizualnej oceny ułożenia prostej powinniśmy starać się traktować wszystkie punkty równoprawnie.

Jeśli wykres z punktami pomiarowymi wydrukowaliśmy (albo wykonaliśmy ręcznie) na arkuszu papieru, to stosujemy „metodę przezroczystej linijki” (to nazwa żartobliwa, ale znana i sugestywna). Kładziemy taką linijkę na arkuszu papieru i tak długo ją przesuwamy i obracamy, aż uznamy, że najlepiej pasuje do układu punktów. Wtedy unieruchamiamy linijkę i kreślimy przy niej linię prostą.

Gdy korzystamy z programu graficznego, to na wykres zawierający punkty pomiarowe nakładamy linię prostą. Korzystamy z możliwości jej przesuwania i obracania na tle punktów, na przykład za pomocą myszki. Podobnie jak w wersji „papierowej”, szukamy takiego ułożenia tej linii, by przebiegała możliwe blisko wszystkich punktów jednocześnie, przez wyobrażony środek ich układu. Tak została poprowadzona prosta nr 4 na Rys. 1.

Współczynnik kierunkowy, czyli nachylenie prostej najlepiej dopasowanej

Na Rys. 2. pokazano tę samą prostą. Wybrano na niej dwa punkty, A i B; nie mają one żadnego związku z punktami pomiarowymi. Ułożono je na liniach siatki wykresu, możliwe daleko od siebie. Ułatwia to odczyt ich współrzędnych i zwiększa precyzję obliczeń. Bezpośrednio możemy odczytać współrzędne $d_{A} = 140 m$ oraz $p_{B} = 240 pk$ (taki skrót zastosujemy dla „punktów konkursowych” - jest to jednostka zmiennej p). Możemy także oszacować $p_{A} = 288 pk$ oraz $d_{B} = 124 m$ .

R19xUOGZPit04

Rys. 2. Na wykresie widoczny jest prostokątny układ współrzędnych, na którym pionowa oś wartości opisana jest, jako łączna punktacja mała litera p. Na osi tej zaznaczono wartości od dwustu dwudziestu do trzystu co dwadzieścia. Oś pozioma opisana jest jako długość skoku mała litera d i w nawiasie kwadratowym mała litera m, wyrażona w metrach. Na osi tej zaznaczono wartości od stu dwudziestu do stu czterdziestu metrów co pięć metrów. Pole wykresu podzielone jest pionowymi i poziomymi czarnymi liniami ułatwiającymi odczyt wartości. Na wykresie widoczne są w postaci niebieskich punktów wyniki poszczególnych zawodników. W funkcji długości skoku zawodnika wartość uzyskanych punktów zazwyczaj rośnie, ale punkty i tak rozmieszczone są bardzo nieregularnie. Na wykresie widoczna jest rosnąca funkcja liniowa której średnia odległość od wszystkich punktów na wykresie jest najmniejsza. Funkcję tę narysowana brązową linią. Przechodzi ona przez cztery niebieskie punkty na wykresie. Na prostej zaznaczono dwa punkty wielka litera A i wielka litera B. Punkt wielka litera A znajduje się w końcowej części danych a punkt wielka litera B na początku wykresu. Na wykresie zaznaczono różnicę wartości pomiędzy punktami wielka litera A i wielka litera B zarówno w kierunku osi punktacji i oznaczono ją jako wielka litera grecka delta i mała litera p, jak i w kierunku długości skoku i oznaczono ją jako wielka grecka litera delta i mała litera d. stosunek przyrostu wartości funkcji do zakresu dziedziny w którym przyrost ten następuje jest równy współczynnikowi kierunkowemu funkcji najlepiej dopasowanej do punktów na wykresie. — Rys. 2. Dowolne dwa punkty A i B na prostej najlepiej dopasowanej pozwalają wyznaczyć jej parametry. Współrzędnych **d_A** oraz **p_B** nie zaznaczono dla czytelności rysunku.
Źródło: Politechnika Warszawska, Wydział Fizyki, licencja: CC BY 4.0.

Dzięki tym odczytom możemy obliczyć współczynnik kierunkowy a dopasowanej prostej. Jest on równy jej nachyleniu względem osi odciętych:

a = \frac{Δ p}{Δ d} = \frac{p_{A} - p_{B}}{d_{A} - d_{B}} = \frac{(288 - 240) pk}{(140 - 124) m} = 3 \frac{pk}{m}

Co to znaczy? To znaczy, że „statystyczny skoczek” za każdy metr odległości swego skoku otrzymał 3 punkty konkursowe. Kto więc skoczył o metr dalej niż konkurent, mógł liczyć - średnio rzecz biorąc - na 3 punkty więcej w końcowej punktacji konkursu, niż tenże konkurent. W tej interpretacji należy pamiętać, że nie jest ona regułą, lecz przedstawia efekt uśrednienia.

Wyraz wolny, czyli gdzie prosta najlepiej dopasowana przecina oś rzędnych?

Jeśli na wykresie występuje punkt o odciętej równej zero, to odczytujemy bezpośrednio wartość wyrazu wolnego b jako miejsce na osi rzędnych, w którym prosta przecina tę oś.
Na naszym wykresie żadna z osi nie jest ujawniona - to świadomy wybór. Nie interesują nas wartości z okolic d = 0 - żaden ze skoczków nie oddał tak krótkiego skoku. Podobnie, żaden z nich nie uzyskał zero, kilku czy nawet kilkudziesięciu punktów. Wyznaczenie wyrazu wolnego wymaga więc przeprowadzenia rozumowania i obliczenia. Wykaż, we własnym zakresie, że wynika z nich wartość b = - 132 pk.

Jak to rozumieć? No cóż, gdyby zgłoszony do konkursu zawodnik oddał skok na odległość d = 0, to mógłby - znowuż: średnio rzecz biorąc - liczyć na uzyskanie ... minus 132 punktów w konkursie. Ta informacja, choć formalnie poprawna, nie wnosi niczego ważkiego do statystycznej interpretacji wyników konkursu.

Ważne!

Uzyskana w ten subiektywny sposób prosta ma nieco ograniczoną wiarygodność. Wynika to nie tylko z ułożenia samej prostej - jest oczywiste, że każdy może nieco inaczej oceniać to ułożenie. Każdy może też nieco inaczej odczytywać i zaokrąglać współrzędne punktów A i B. Wartości parametrów takiej prostej są więc siłą rzeczy przybliżone. Co ważniejsze, nie sposób określić, jak dobre jest to przybliżenie.
Może to być istotne, gdy zależy nam na dokładnych pomiarach i na obliczeniu niepewności uzyskanego wyniku. A tak na ogół jest w fizyce.

Dopasowanie prostej metodą najmniejszych kwadratów

Obiektywna metoda...

...znalezienia równania tej jedynej prostej, która optymalnie odzwierciedla ogólną tendencję zależności pomiędzy dwiema zmiennymi, wymaga przede wszystkim określenia kryterium optymalizacji. Jedna z powszechnie stosowanych metod to tzw. metoda najmniejszych kwadratówMetoda Najmniejszych Kwadratówmetoda najmniejszych kwadratów. Polega ona na wskazaniu tej prostej, dla której suma kwadratów odległości wszystkich punktów od tej prostej jest najmniejsza. Cechą metody jest, że odległości te liczone są równolegle do osi rzędnych - na Rys. 3. pokazano dwie takie odległości od prostej dopasowanej tą właśnie metodą: dla punktu nr 3 i punktu nr 26.

R1Qx3DBJ9eTDi

Rys. 3. Na wykresie widoczny jest prostokątny układ współrzędnych, na którym pionowa oś wartości opisana jest, jako łączna punktacja mała litera p. Na osi tej zaznaczono wartości od dwustu dwudziestu do trzystu co dwadzieścia. Oś pozioma opisana jest jako długość skoku mała litera d i w nawiasie kwadratowym mała litera m, wyrażona w metrach. Na osi tej zaznaczono wartości od stu dwudziestu do stu czterdziestu metrów co pięć metrów. Pole wykresu podzielone jest pionowymi i poziomymi czarnymi liniami ułatwiającymi odczyt wartości. Na wykresie widoczne są w postaci niebieskich punktów wyniki poszczególnych zawodników. W funkcji długości skoku zawodnika wartość uzyskanych punktów zazwyczaj rośnie, ale punkty i tak rozmieszczone są bardzo nieregularnie. Na wykresie widoczna jest rosnąca funkcja liniowa, narysowana czerwoną linią. Funkcja ta przechodzi przez cztery punkty jej średnia odległość od wszystkich punktów jest najmniejsza. Na wykresie zaznaczono czarnymi pionowymi strzałkami odległości pomiędzy trzecim i dwudziestym szóstym punktem a czerwoną funkcją. Trzeci niebieski punkt oznaczony małą literą d z indeksem dolnym trzy znajduje się nad wykresem funkcji a dwudziesty szósty oznaczony małą literą d z indeksem dolnym dwadzieścia sześć pod nią. — Rys. 3. Prosta dopasowana metodą najmniejszych kwadratów. Suma kwadratów odległości wszystkich 30 punktów od tej właśnie prostej jest najmniejsza z możliwych.
Źródło: Politechnika Warszawska, Wydział Fizyki, licencja: CC BY 4.0.

Stosowanie metody najmniejszych kwadratów...

...sprowadza się do przeprowadzenia dwóch dość żmudnych obliczeń: wynikiem jednego jest wartość współczynnika kierunkowego a najlepiej dopasowanej prostej, wynikiem drugiego zaś jest wartość jej wyrazu wolnego b. Są one dostępne w postaci gotowych formuł w każdym typowym arkuszu kalkulacyjnym oraz w każdej aplikacji z funkcjami statystycznymi.
Prosta uzyskana metodą najmniejszych kwadratów jest na ogół wykreślana w ramach oprogramowania użytego do obliczenia wartości współczynników a oraz b.

Zastosowanie tych wzorów w naszym przypadku pozwala obliczyć wartości:

a = 3, 43 \frac{pk}{m}

b = - 188 pk

Jak widać, wartości te (zaokrąglone do trzech cyfr znaczących) potwierdzają, że metoda wizualna pozwala graficznie określić najlepiej dopasowaną prostą w sposób przybliżony.

Dla zainteresowanych

Wzorów tych nikt nie stara się zapamiętać - jeśli interesuje Cię ich postać - skorzystaj z przeglądarki internetowej.
Podobnie, gdyby zaintrygowało Cię, dlaczego minimalizujemy sumę kwadratów odległości (a nie sumę samych odległości), spróbuj samodzielnie wyszukać informacje na ten temat.
Wyprowadzenie tych wzorów wymaga wiadomości i umiejętności z zakresu matematyki, które zdecydowanie wykraczają poza program szkoły średniej. Gdyby Cię to naprawdę interesowało, dodatkowo wprowadź w przeglądarkę hasło „ekstremum lokalne funkcji dwóch zmiennych”.

Niepewność pomiarowa współczynników dopasowania prostej ...

... wynika z dwóch czynników. Na jeden z nich składają się kwadraty odległości punktów pomiarowych od tej prostej, czyli (na rys. 3.) $d_{1}^{2}$ , $d_{2}^{2}$ , itd. aż do $d_{30}^{2}$ . Drugi z nich związany jest z niepewnościami pomiarowymi, z jakimi zmierzone zostały współrzędne punktów: $u (d)$ oraz $u (p)$ . Więcej o tych niepewnościach znajdziesz w e‑materiale „Przedstawianie niepewności pomiarowych w formie graficznej”.
Uwzględnienie tych czynników wymaga wiadomości i umiejętności z zakresu statystyki matematycznej daleko wykraczających poza program szkoły średniej.

Dlatego nie jest od Ciebie oczekiwana umiejętność wyznaczania niepewności $u (a)$ oraz $u (b)$ , lecz jedynie umiejętność operowania tymi niepewnościami, gdy zostaną one podane w treści zadania.

Słowniczek

Dopasowanie prostej

(ang. line fitting) znalezienie wartości parametrów funkcji liniowej postaci: $y = a \cdot x + b$ takiej, że określona funkcja odległości punktów pomiarowych od prostej przyjmuje wartość minimalną. Funkcją tą najczęściej jest suma kwadratów odległości punktów pomiarowych od prostej.
Dopuszczalne jest także wizualne określanie takiej prostej za pomocą metody graficznej.

Metoda najmniejszych kwadratów

(ang: least‑squares method) metoda dopasowania zależności funkcyjnej $y = f (x; a_{1}, . . ., a_{n})$ do układu punktów pomiarowych w ten sposób, aby suma kwadratów odległości funkcji od punktów przybierała wartość minimalną. Metoda najmniejszych kwadratów odniesiona do dopasowania zależności liniowej nazywana jest też regresją liniową.

Regresja liniowa

(ang: linear regression) opis zależności pomiędzy dwiema zmiennymy z pomocą funkcji liniowej. Opis ten zwykle wykonywany jest metodą najmniejszych kwadratów. Metoda regresji włącza określenie ilościowe parametrów charakteryzujących korelacje pomiędzy zmiennymi.

Wprowadzenie

Film samouczek

Warto przeczytać

Prosta prawdę ci powie

Wniosek

Jak określić prostą najlepiej dopasowaną do punktów?

Współczynnik kierunkowy, czyli nachylenie prostej najlepiej dopasowanej

Wyraz wolny, czyli gdzie prosta najlepiej dopasowana przecina oś rzędnych?

Dopasowanie prostej metodą najmniejszych kwadratów

Obiektywna metoda...

Stosowanie metody najmniejszych kwadratów...

Niepewność pomiarowa współczynników dopasowania prostej ...

Słowniczek