Internet zawiera ogromną ilość wiadomości na prawie wszystkie tematy otaczającego nas świata. Poznane podstawy korzystania z przeglądarek internetowych w celu przeszukiwania zasobów internetuPt1nhKeXyprzeszukiwania zasobów internetu niekoniecznie ochronią cię przed mało wiarygodnymi źródłami. Znalezione informacje zawsze należy weryfikować. Sprawne posługiwanie się wyszukiwarką internetowąPq6xclFoqSprawne posługiwanie się wyszukiwarką internetową z pewnością upraszcza poruszanie się po sieci, jednak trzeba wiedzieć, jakich narzędzi warto użyć, aby odnaleźć się w tej niesamowicie dużej ilości danych. W celu ułatwienia wyszukiwania informacji na określony temat, różne wiadomości zostały pogrupowane w specjalnych strukturach nazywanych bazami danychDuq1BycqWbazami danych. Na przykład na uczelniach można korzystać z baz danych obejmujących spisy publikacji (książek, czasopism, wydawnictw uczelnianych) z różnych dziedzin nauki. W tym materiale poznasz bazy wiedzy ogólnej oraz takie, które pozwalają na obróbkę statystyczną danych.
R1ZUji1o0F54N
W odróżnieniu od baz danych, gdzie przechowuje się zorganizowany i usystematyzowany zbiór informacji, bazy wiedzy ogólnej skupiają się na logicznych powiązaniach definicji i opisów faktów z danej dziedziny wiedzy. Bazy wiedzy ogólnej zawierają np. takie informacje, jak: „kot jest ssakiem”, „wszystkie ssaki są zwierzętami”. Pozwalają one specjalnym programom wykonywać proste logiczne wnioskowania i nieco lepiej odpowiadać na nasze pytania. Przykład takiej bazy możesz znaleźć na https://www.wikidata.org/
RdR528r4ooUeg
Bazy wiedzy ogólnej mogą być połączone z bazami danych, aby uzyskać bardziej kompleksowe i elastyczne rozwiązania. Na przykład, baza wiedzy ogólnej o zwierzętach może być połączona z bazą danych o zwierzętach, aby odpowiedzieć na pytania takie jak: „Jakie zwierzęta żyją w Afryce?” lub „Jakie zwierzęta są zagrożone wyginięciem?”
Ćwiczenie 1
Skorzystaj z wyszukiwania haseł na stronie Wikidata (https://www.wikidata.org/). Spróbuj odnaleźć proste hasło, jak na przykład „Cat” (po polsku Kot, lepsze rezultaty otrzymasz, gdy wyszukujesz informacje w języku angielskim). Zwróć uwagę na sposób wyszukiwania i wyświetlania wyników oraz strukturalność kolekcjonowanych danych. Jakie informacje zawiera element o nazwie „house cat” i czym jest kod „Q146” znajdujący się przy jego etykiecie? Jakie własności tej bazy danych możesz wyróżnić patrząc na otrzymane wyniki? Swoje odpowiedzi zapisz poniżej.
RPruS39rPfGYC
Informacje czym jest Wikidata, jak działa, jakie dane zawiera, w jaki sposób są one przechowywane, najważniejsze cechy oraz możliwości tej bazy danych znajdziesz na stronie: https://www.wikidata.org/wiki/Wikidata:Introduction/pl
Frazę „Cat” wpisz w polu wyszukiwania widocznym u góry po prawej stronie. Następnie kliknij Enter lub wybierz z rozwiniętej listy „house cat”. Zauważ, że lista propozycji zawiera użycie wyrażenia „cat” w różnych dziedzinach z krótką i zwięzłą definicją. Możesz również zobaczyć wszystkie strony zawierające ciąg znakowy „Cat”.
RKI15nY6T0h1l
Więcej wyników otrzymasz klikając Enter. Wyrażenie „cat” występuje w wielu kategoriach, ma wiele znaczeń jak i również posiada różne właściwości i wartości. Każde zagadnienie rozróżniane jest przez unikalny numer identyfikacyjny. Pod hasłami znajdziesz krótką informację pozwalającą zidentyfikować, czy to tego „kota” szukasz.
RrjQcSiVuY2Ai
Jeśli wybierzesz „house cat Q146” przejdziesz na stronę zawierającą jego ustrukturyzowaną hierarchię znaczeń i przynależności. Informacje będą w formie odnośników, zawierając konkretne dane takie jak średni czas życia, czy początek występowania. Każdy obiekt ma swoją kategorię, kot jest żywym organizmem, gatunkiem ssaka, jako podklasa należy do zwierząt domowych, nauka o nim nazywa się felinologia. Kot również może powodować alergię, a jednym z najczęściej używanych hasztagów z jego nazwą jest „#catlover”. Dostępne są również zdjęcia poglądowe różnych gatunków jak i nagrania głosowe. Wszystko to zostało powiązane w bazie tworząc magazyn danych będący potężnym narzędziem dla ludzi jak i maszyn. Linki prowadzą do stron i podstron w każdym języku i do każdego wymienionego zagadnienia, dzięki czemu dane mogą być w prosty sposób łączone i wykorzystywane w sposób efektywny w zewnętrznych źródłach wiedzy jak np. znana ci już Wikipedia.
RxFLzu64wRKgt
Przykładowa notatka odpowiadająca na pytania zawarte w ćwiczeniu:
Wikidata posiada kilka konkretnych cech - jest przede wszystkim darmowa, na otwartej licencji, dostępna dla każdego, wielojęzyczna, wysoce ustrukturyzowana i udostępnia dane w różnych formatach. Niezależnie tworzona przez światową społeczność edytorów i programy, zbiera fakty, wskazuje na ich źródła, stawia na jakość, różnorodność i weryfikację danych. „House cat” jest jednym z bardzo wielu wpisów - elementów, składających się z etykiety, opisu oraz alternatywnych nazw i znaczeń. Każdy element posiada opisane w deklaracji właściwości i wartości będące faktami jak i powiązanymi zagadnieniami. Z informacji dostępnych przy kocie domowym możemy wyczytać jego przynależność do żywych organizmów, pupili domowych, obejrzeć jego zdjęcia, odsłuchać wydawanych odgłosów, poznać długość życia i początki występowania, nazwy formatowania jego instancji w różnych systemach oraz tłumaczenia dla różnych języków. Każdy unikalny wpis posiada własny identyfikator (np. „Q146 dla house cat”), aby te same wyrażenia o różnym znaczeniu i kontekście były rozróżnialne dla maszyn i systemów, a łączenie z innymi zagadnieniami odbywało się w sposób łatwy do skategoryzowania i określenia przynależności znaczeniowej w strukturze danego wpisu.
Istnieją również bazy, które zawierają duże ilości danych przeznaczonych do obróbki statystycznej polegającej na przetwarzaniu ich zawartości w celu uzyskania przydatnych informacji. Takie bazy dotyczą najróżniejszych dziedzin, na przykład zbiory tekstów z gazet codziennych, najczęściej pojawiające się frazy w wyszukiwarkach, demografia, informacje o pogodzie, czy wyniki badań naukowych. Firma Google udostępnia darmowe narzędzie o nazwie Google Trends, które pozwala sprawdzić, jakie słowa, czy frazy są i były najpopularniejszymi wyszukiwanymi w internecie w wybranym przez nas odstępie czasu. Pozwala to analizować trendy i preferencje grup społecznych na podstawie lokalizacji i bieżących wydarzeń na świecie.
RAIup864J5CbH
Ciekawostka
Wszystkie wyszukiwane przez nas informacje przechowywane są w ogromnych centrach danych, które posiadają największe przedsiębiorstwa takie jak Google, Microsoft, Amazon, czy Facebook. Więcej o tym, oraz jak przetwarzane są dane, możesz dowiedzieć się w materiale Znaczenie technologii informacyjno‑komunikacyjnychD16xlmSWxZnaczenie technologii informacyjno‑komunikacyjnych.
1
Ćwiczenie 2
Porównaj statystyki wyszukiwania słów Psy oraz Koty z ostatnich pięciu lat w Google Trends.
Odszukaj w sieci witrynę Głównego Urzędu Statystycznego i zapoznaj się z rodzajami i zasobami udostępnionych w niej baz danych.
R1WTeHCVzP392
Na stronie https://trends.google.com/trends/?geo=PL&hl=pl wybierz zakładkę Odkrywaj i dodaj wyszukiwane słowa. Zmień zakres daty i przeanalizuj wyświetlone wykresy.
Na stronie https://stat.gov.pl/ poszukaj zakładki Bazy danych.
Będąc na stronie głownej https://trends.google.com/trends/ należy wejść w zakładkę Odkrywaj znajdującą się w górnej belce nawigacyjnej.
W polu tekstowym Dodaj wyszukiwane słowa, wpisz Psy i kliknij Enter. Pojawi się wykres liniowy pokazujący zainteresowanie podanym słowem w ujęciu czasowym.
R1QeKRRqklIF7
Kliknij nowo ukazane pole Porównaj. Następnie, wpisz w nim Koty. Na wykresie liniowym pojawi się druga linia. Ustaw zakres czasu na ostatnie 5 lat z dostępnych opcji na liście rozwijalnej.
RBwqyI7NqoCKB
Możesz porównać oba wykresy w wartościach od 0 do 100, z czego 100 oznacza najwyższą popularność, a 50 - dwukrotnie mniejszą. 0 oznacza brak danych. Po najechaniu na dany punkt linii pokaże się odpowiednia wartość i data. Na stronie z wyświetlonymi statystykami znajdziesz również podział według regionu i miast, a także podobne zapytania, w których dane słowo zostało użyte.
Będąc na głównej stronie urzędu statystycznego https://stat.gov.pl/ rozwiń zakładkę Bazy danych po lewej stronie, a następnie wybierz interesujący cię temat. Zostaniesz przekierowany na jedną z podstron, gdzie w odpowiedni dla tematu sposób zostaną przedstawione dane.
R143pUfa9XSPU
Na przykład, wchodząc w zakładkę Atlas Regionów, zostaniesz przekierowany na stronę http://swaid.stat.gov.pl/SitePagesDBW/AtlasRegionow.aspx#, gdzie znajduje się graficzna wizualizacja przeróżnych danych statystycznych z podziałem na województwa, regiony, podregiony, powiaty, a nawet gminy.
R17W4ZgjvhOzJ
Klikając w mapę przejdziesz do jej pełnowymiarowej interaktywnej wersji. Na stronie znajdziesz wiele modyfikatorów map i wykresów. W zakładce Wskaźniki znajdują się dane statystyczne podzielone na kategorie. Niektóre z nich jak np. Lesistość zostaną nałożone na mapę w postaci kartogramu, inne jak np. Powierzchnia zalesień dostanie własny wykres kołowy dla każdego regionu.
R1Yi6J4p6AxZa
W zakładce Tablica, dane zostaną przedstawione w sposób tabelaryczny dla każdego możliwego przedziału czasowego. Ranking zawierać będzie posortowane wartości, a w Opisie znajdziesz szczegółowe okresy obserwacji, słownik pojęć i daty ostatniej aktualizacji. W Ustawieniach możesz wybrać paletę kolorystyczną, liczbę przedziałów jak i sposób podziału danych wg. własnych preferencji.
Poniżej znajduje się przykładowa mapa z podziałem na regiony przedstawiająca gęstość zaludnienia w Polsce, czyli liczbę ludności przypadającą na 1 kilometr kwadratowy w poszczególnych regionach. Wykresy kołowe przedstawiają z kolei procentowy podział ludności wg. płci w danym okręgu.
R6cqyddYeZeHB
Możliwość zmiany okresu z którego pochodzą dane znajduje się u dołu po lewej stronie mapy. Nad menu z ustawieniami, poza opisem wybranych kategorii, możesz również zmienić zakres lokalizacyjny. Po prawej stronie znajdziesz historię mapy wraz z rozpiętością i kolorami przedstawionych danych.
Zapamiętaj!
Internetowe bazy danych pozwalają przechowywać dowolne informacje z różnych dziedzin wiedzy i są udostępniane wszystkim zainteresowanym lub tylko uprawnionym użytkownikom, uzyskującym dostęp za pomocą hasła.