RoToofdFyqMTq
Fotografia przedstawiająca kartkę z kolorowymi wykresami słupkowymi. Dłoń osoby wskazuje długopisem na jeden ze słupków.

I_R_W08_M11 Zastosowania linii trendu w analizie danych

Źródło: Pixabay, domena publiczna.

Linia trendu pozwala na wizualizację tendencji, którą podążają dane. Dzięki niej możemy zignorować potencjalne wahania wartości analizowanej zmiennej i wyznaczyć odpowiednią prognozę jej przyszłych wartości.

Dodawanie linii trendulinia trendulinii trendu

R1cRjyjzXdaWR

Przycisk do pobrania pliku ZIP z treścią zadania.

Plik ZIP o rozmiarze 21.17 KB w języku polskim

Załóżmy, że chcemy zobaczyć, w jakim kierunku zmierzają ceny akcji spółki notowanej na GPW. Podane zostały następujące dane:

R1TDTEV3G163L

Microsoft Excel

Zaczynamy od utworzenia wykresu liniowego. Więcej informacji na temat tworzenia wykresów liniowych znajdziesz w module Graficzna prezentacja danych.

W celu dodania linii trendu na stworzony wykres liniowy, zaznaczamy obszar wykresu, a następnie przechodzimy do zakładki Projekt wykresu, którą znajdziemy na wstążce. Tam korzystamy z opcji Dodaj element wykresu i z rozwijanego menu wybieramy typ linii trendu, który najlepiej opisuje zależności pomiędzy punktami na wykresie. W tym przypadku będzie to liniowa linia trendu.

R541VTO3LK8RV

Po dodaniu linii trendu możemy stwierdzić, że ceny akcji stale rosną w czasie.

W powyższym przykładzie wykorzystaliśmy liniową linię trendu, ale to oczywiście tylko jeden z wielu typów linii trendu, jakie mamy do dyspozycji. Porównajmy je zatem i sprawdźmy, w jakich sytuacjach warto zastosować każdy z nich.

LibreOffice Calc

Zaczynamy od utworzenia wykresu liniowego. Więcej informacji na temat tworzenia wykresów liniowych znajdziesz w module Graficzna prezentacja danych.

W celu dodania linii trendu zaznaczamy obszar wykresu, a następnie klikamy prawym przyciskiem myszy na serię danych, dla której chcemy stworzyć linię trendu.  Z menu podręcznego wybieramy opcję Wstaw krzywą regresji... W otwartym oknie wybieramy typ linii trendu, który najlepiej opisuje zależności pomiędzy punktami na wykresie. W tym przypadku będzie to liniowa linia trendu.

R8E67G66M7EFE
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

Po dodaniu linii trendu możemy stwierdzić, że ceny akcji stale rosną w czasie.

W powyższym przykładzie wykorzystaliśmy liniową linię trendu, ale to oczywiście tylko jeden z wielu typów linii trendu, jakie mamy do dyspozycji. Porównajmy je zatem i sprawdźmy, w jakich sytuacjach warto zastosować każdy z nich.

Rodzaje linii trendu:

Liniowa linia trendu

Ten typ linii trendu posłuży do wyznaczania trendu dla danych, których relacja jest liniowa. Oznacza to, że można ją opisać równaniem:

y=m·x+b

Często jest ona wykorzystywana w wykresach cen akcji spółek na giełdzie, co pozwala inwestorom i analitykom ocenić, w jakim kierunku one zmierzają. 2

Wykładnicza linia trendu

R1dc5RUyG4e8K

Przycisk do pobrania pliku ZIP z treścią zadania.

Plik ZIP o rozmiarze 38.88 KB w języku polskim

Linia ta dobrze opisuje relacje pomiędzy zmiennymi, których wartości rosną lub zmniejszają się wykładniczo bądź rosną lub maleją coraz szybciej. Relację pomiędzy danymi można wtedy opisać za pomocą równania:

y=a·ebx

Warto zauważyć, że nasze dane nie mogą przyjąć wartości, które są mniejsze lub równe 0.

Załóżmy, że chcemy obliczyć odsetki od 1000 zł depozytu złożonego w instytucji finansowej w okresie 45 lat, oprocentowanie w skali roku wynosi 5%. Po każdym roku odsetki są dopisywane do kapitału, a w kolejnym roku odsetki są obliczane od powiększonego kapitału. Dane dotyczące poszczególnych lat, wzrostu depozytu i odsetek zostały zapisane w pliku do pobrania.

R1NM1M16CS92F
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

Zależność ta jest przykładem wzrostu wykładniczego, tzn. dane w kolumnie B (Depozyt) i C (Odsetki po kapitalizacji) rosną wykładniczo. Możemy zwizualizować te dane na wykresie.

Microsoft Excel

R1NEKPTXMRJLL
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

Dodajemy linie trendu wykładniczego wraz z równaniem na wykresie oraz wartością R‑kwadrat. Wartość R‑kwadrat oznacza wiarygodność linii trendu, im bliższa 1, tym bardziej wiarygodna jest linia trendu.

R1CHS1ELGHA61
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

LibreOffice Calc

RX2SSMKP1T3KQ
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

Dodajemy linie trendu wykładniczego wraz z równaniem na wykresie oraz wartością R‑kwadrat. Wartość R‑kwadrat oznacza wiarygodność linii trendu, im bliższa 1, tym bardziej wiarygodna jest linia trendu.

R1941Z1T6MLNN
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

3

Logarytmiczna linia trendu

R1U86cyaYC9ab

Przycisk do pobrania pliku ZIP z treścią zadania.

Plik ZIP o rozmiarze 30.05 KB w języku polskim

Ten typ linii trendu szczególnie przydatny jest w przypadku danych, których tempo zmiany jest szybkie na początku, a ich wartości osiągają limit, gdy tempo zmiany się stabilizuje. Relację tę można przedstawić za pomocą następującego równania:

y=alnx+b

Załóżmy, że zajmujemy się analizą przyrostu liczby osób w pełni zaszczepionych przeciwko Covid‑19.

Początkowo liczba całkowicie zaszczepionych będzie rosnąć w szybkim tempie, po czym zmiana stopniowo zacznie się stabilizować. W tym przypadku trend danych zostanie dobrze opisany przez logarytmiczną linię trendu. Możemy zwizualizować te dane na wykresie.

Microsoft Excel

R1VVKQZBOPHZ7
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

Dodajemy linię trendu logarytmicznego wraz z równaniem na wykresie oraz wartością R‑kwadrat.

R1O5713H5XSB9
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

LibreOffice Calc

R1DOHJZDJK1AE
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

Dodajemy linię trendu logarytmicznego wraz z równaniem na wykresie oraz wartością R‑kwadrat.

RJOSGXBD9CSRK
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

4

Potęgowa linia trendu

RjHRTyNC2YtGh

Przycisk do pobrania pliku ZIP z treścią zadania.

Plik ZIP o rozmiarze 35.91 KB w języku polskim

W tym przypadku, podobnie jak przy wykładniczej linii trendu, dane nie mogą przyjmować wartości mniejszych lub równych 0. Potęgowa linia trendu będzie szczególnie przydatna w opisywaniu danych, gdzie zmienne zwiększają się w równym tempie, na przykład podczas badania prędkości spadania gumowej kulki wyrzuconej przez okno.

Zależność opisana jest za pomocą następującego wzoru:

y=axb

Przyjmijmy, że posiadamy dane opisujące, jak pole koła zmieniało się wraz ze wzrostem długości jego promienia. Jako że zależność między dwiema zmiennymi jest kwadratowa, pole zmieniać się będzie w sposób potęgowy. Oznacza to, że do określenia jego trendu najbardziej adekwatna będzie właśnie potęgowa linia trendu.

R16VBR2HV54RH
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

Możemy zwizualizować te dane na wykresie.

Microsoft Excel

R1PFHLFZU6XL1
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

Dodajemy linię trendu potęgowego wraz z równaniem na wykresie oraz wartością R‑kwadrat.

R13J7O7114L9O
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

LibreOffice Calc

Dodajemy linię trendu potęgowego wraz z równaniem na wykresie oraz wartością R‑kwadrat.

R1OJa6rDqb4ZY
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

5

Wielomianowa linia trendu

RcEkOoMod22QV

Przycisk do pobrania pliku ZIP z treścią zadania.

Plik ZIP o rozmiarze 35.10 KB w języku polskim

Załóżmy, że wartości naszych danych są nieregularne – tzn. sporadycznie się wahają. W takim przypadku idealnie sprawdzi się wielomianowa linia trendu. Linia wielomianowa, tak samo jak wielomiany, ma określony stopieństopień wielomianustopień. To, który stopień wielomianu najlepiej sprawdzi się w opisie naszych danych, wywnioskujemy na podstawie liczby wzniesień i zagłębień, jakie są w nich widoczne.

Wielomianową linię trendu opiszemy wzorem:

y=a+b1x+b2x2++bnxn

- gdzie n to stopień wielomianu.

Przyjmijmy, że analizujemy ceny akcji firmy w długim okresie czasu. Zastosowanie wielomianowej linii trendu pozwoli nam zobrazować okresy, w których ceny tej akcji spadały, oraz te, w których rosły.

Możemy zwizualizować te dane na wykresie.

Microsoft Excel

R19LFGO6C4G7D
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

Dodajemy linię trendu wielomianowego, w tym przypadku stopnia 6, wraz z równaniem na wykresie oraz wartością R‑kwadrat.

RT79LXRTGDZNX
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

LibreOffice Calc

RE9CNNMR5ELAG
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

Dodajemy linię trendu wielomianowego, wybieramy taki stopień wielomianu, dla którego wartość R‑kwadrat będzie najbliższa 1. W tym przypadku stopniem będzie 4. Pamiętajmy o dodaniu równania oraz wartości R‑kwadrat linii trendu.

R174RRHCBG71Z
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

6

Średnia ruchoma

R9E9luSwIHbBp

Przycisk do pobrania pliku ZIP z treścią zadania.

Plik ZIP o rozmiarze 31.12 KB w języku polskim

W przypadku gdy w naszych danych występują duże nieregularności, które nie pozwalają nam na jednoznaczne stwierdzenie kierunku trendu, możemy posłużyć się linią średniej ruchomej. Zamiast opisywać wszystkie punkty na wykresie, opisuje ona średnie dwóch lub większej liczby punktów. To, z ilu punktów ma zostać wyciągnięta średnia na jeden punkt linii, nazywane jest okresem. Okres możemy ustalić przy tworzeniu linii.

Średnią ruchomą opisujemy za pomocą wzoru:

Ft=At+At1+Atn+1n

Warto dodać, że średnia ruchoma jako jedyna linia trendu nie udostępnia nam opcji wykonania prognozy przyszłych wartości danych.

R1B84M7B259T6
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

Możemy zwizualizować te dane na wykresie.

Microsoft Excel

R1EXMHFVO1NA1
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

Dodajemy linię trendu średniej ruchomej.

R1Jop2ne1gtIt
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.
R15V8FEFBP8LD
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

LibreOffice Calc

RQH4QMRMSMVQ1
Źródło: Contentplus.pl Sp. z o.o., licencja: CC BY-SA 3.0.

Dodajemy linię trendu średniej ruchomej.

RzIEnQ6ahpW5O
RTMB9C9LJLALR

Słownik

fluktuacja
fluktuacja

wahanie, niestabilność lub zmienność (np. cen akcji)

linia trendu
linia trendu

linia wyznaczająca kierunek ruchu wartości przedstawionej na wykresie, np. cen akcji na giełdzie w czasie

stopień wielomianu
stopień wielomianu

najwyższa potęga, do której podniesiona zostaje zmienna danego wielomianu

zależność geometryczna
zależność geometryczna

występuje pomiędzy wartościami w momencie, gdy tworzą one ciąg geometryczny (tzn. obecnie sprawdzana wartość podzielona przez poprzednią jest równa następnej sprawdzanej wartości podzielonej przez obecnie sprawdzaną)