Wróć do informacji o e-podręczniku Wydrukuj Pobierz materiał do PDF Pobierz materiał do EPUB Pobierz materiał do MOBI Zaloguj się, aby dodać do ulubionych Zaloguj się, aby skopiować i edytować materiał Zaloguj się, aby udostępnić materiał Zaloguj się, aby dodać całą stronę do teczki

Warto przeczytać

Igła w stogu siana

Nauka rozwija się w błyskawicznym tempie i coraz trudniej jest znaleźć procesy i zjawiska, które nie byłyby przedmiotem wcześniejszych badań i analiz. By dokonać odkrycia, niekoniecznie przełomowego, trzeba pozyskać, zapisać i przeanalizować ogrom danych.

R1RyXsEeHtavW1
Rys. 1. Ośrodek CERN pod Genewą. Usytuowanie planowanego akceleratora FCC na tle działającego obecnie akceleratora LHC.
Źródło: dostępny w internecie: https://cds.cern.ch/record/2653532/files/FCC%20v2.jpg?subformat=icon-640 [dostęp 1.02.2022], licencja: CC BY 4.0.

Celują pod tym względem eksperymenty z zakresu fizyki jądrowej i cząstek elementarnych. Od ponad stu lat typowym postępowaniem w tych dziedzinach jest badanie zderzeń cząstek emitowanych z jąder atomowych w naturalnych procesach bądź przyspieszanych w akceleratorach. Analizujemy bezpośrednie produkty tych zderzeń oraz cząstki powstające w wyniku ich rozpadów bądź wtórnych oddziaływań.

Typowy „dzień pracy” akceleratora i sprzężonych z nim detektorów może dostarczyć całe petabajty informacji.

Ciekawostka

Jeden petabajt to 10Indeks górny 15 bajtów. Typowe (spotykane obecnie) miesięczne „limity transferu danych” w sieciach telefonii komórkowej to setki gigabajtów, czyli są one rzędu 10Indeks górny 11 bajtów. Łatwo więc obliczysz, że taki „dzień pracy” odpowiada miesięcznej działalności mieszkańców 10‑tysięcznego miasteczka, wykorzystujących w 100% swoje limity transferu.

Dokonanie i udokumentowanie odkrycia wymaga na ogół przeanalizowania bardzo niewielkiej części tej informacji, powiedzmy jednego promila. Za to wskazanie owego promila i jego wyodrębnienie spośród reszty wymaga pracy ze wszystkimi przychodzącymi danymi. Dlatego badania, które obecnie prowadzimy, przypominają często przysłowiowe poszukiwanie igły w stogu siana.

Proces wyodrębniania tych informacji kluczowychKluczowe informacjeinformacji kluczowych we współczesnych eksperymentach fizycznych jest zwykle wieloetapowy. W najprostszym ujęciu wyodrębniamy dwa etapy zasadnicze: analiza produktów zderzenia i ich selekcja w czasie rzeczywistym (analiza on‑line) oraz analiza danych po zakończeniu pracy aparatury (analiza off‑line).

Analiza zderzeń on‑line

Weźmy za przykład jeden z największych aktualnie eksperymentów fizycznych na świecie – eksperyment ALICEALICEALICE, realizowany w CERNCERNCERN. Jego schematyczny przekrój pokazany jest na Rys. 2. 
Pokazuję ten schemat dla uświadomienia Ci ogromu aparatury umieszczonej kilkadziesiąt metrów pod ziemią.

RpmKeGNF3DvlB
Rys. 2. Schematyczny widok przekroju detektora ALICE w CERN. Porównaj z nim sylwetki ludzi
Źródło: CERN, licencja: CC BY 4.0.

W eksperymencie ALICE badane są zderzenia protonów i jąder ołowiu przy największych energiach dostępnych dla działającego w CERN akceleratora (zderzacza) LHC. W zderzeniach tych produkowane są setki i tysiące cząstek, a zapis informacji o jednej cząstce to setki i tysiące liczb. Gdyby zapisywać wszystko o każdym zderzeniu, to wszelkie zasoby pamięci szybko by się zapełniały. Ale czy zawsze owe petabajty musimy zapisywać? Kiedy badamy bardzo rzadkie procesy, wystarczy zapisać bardzo niewiele, ale trzeba znowu wiedzieć, jak wyodrębnić informacje kluczowe z dużej ilości danych.

Analiza skutków pojedynczego zderzenia następuje w kilku fazach. W naszym uproszczonym schemacie wyróżniamy cztery zasadnicze. Przejściem do każdej kolejnej fazy steruje „trigger” czyli wyzwalaczUkład wyzwalającywyzwalacz.

  1. Faza zwana zerową to podjęcie decyzji, czy dane zderzenie będzie zakwalifikowane do dalszej analizy, czy odrzucone. Czas na podjęcie decyzji to 25 ns (miliardowych części sekundy) w zderzeniach protonów i 125 ns w zderzeniach jąder ołowiu. Informację do wypracowania decyzji podają najszybciej działające detektory i najszybsza elektronika o zdolności rozdzielczej rzędu pikosekund (czyli 10Indeks górny -12 s).

  2. W następnej fazie sprawdzane są bardziej szczegółowe kryteria dotyczące wybranych do analizy procesów fizycznych. Dane pobierane są z wyselekcjonowanych sub‑detektorów. Niespełnienie kryteriów oznacza odrzucenie zdarzenia. Decyzja wypracowywana jest w czasie rzędu kilku mikrosekund.

  3. Kolejna decyzja dotyczy tego, jakie informacje o zderzeniu będą zapisane, które detektory mają te dane dostarczyć oraz jaka będzie postać danych do zapisu przez system akwizycji (zbierania) danych. Zachodzi to w czasie liczonym z mikrosekundach.

  4. Najdłużej trwa zapis danych z detektora projekcji czasowej TPC, ale to on właśnie dostarcza najwięcej informacji. Tu czas jest już liczony w milisekundach.

R1TK6gXRvxVae1
Rys. 3a. Wizualizacja torów kilku tysięcy cząstek ze zderzenia zarejestrowanego w detektorze ALICE.
Źródło: CERN, licencja: CC BY 4.0.

Detektor TPC jest głównym systemem zainstalowanym w eksperymencie ALICE. Służy on do elektronicznego śledzenia naładowanych produktów zderzenia, pierwotnych i wtórnych. Dzięki niemu możliwe jest określanie torów cząstek, pomiar ich pędu i, w efekcie, ich identyfikacja.

Na Rys. 3a i 3b. pokazano dwa przykłady wizualizacji zarejestrowanych zderzeń za pomocą TPC. W pierwszym zarejestrowano kilka tysięcy cząstek, w drugim – kilkadziesiąt.

R134QexFQZ8zM
Rys. 3b. Tory kilkudziesięciu cząstek z innego zderzenia odtworzonego w TPC.
Źródło: CERN, licencja: CC BY 4.0.

Zapisane w tym etapie informacje zostały wyselekcjonowane zgodnie z kryteriami określonymi w poszczególnych fazach. Trafiają one do dalszej analizy, już w etapie off‑line.

Analiza off‑line danych o zderzeniach

Tym razem za przykład posłużą nam wyniki eksperymentu o nazwie CMS, także prowadzonego w CERN. W eksperymencie tym badane są zderzenia protonów przy energiach 13 TeV (trzynaście teraelektronowoltówElektronowoltteraelektronowoltów, czyli 13⋅10Indeks górny 12 eVElektronowolteV) w układzie środka masy. W każdym takim zderzeniu emitowane są ogromne liczby cząstek, w tym także fotonów. Stanowią one ten „stóg siana”, zaś „igłą” są takie pary fotonów, które pochodzą z rozpadu poszukiwanej od prawie pół wieku cząstki, zwanej bozonem Higgsa i oznaczanej HIndeks górny 0. Nie muszę dodawać, że cząstka HIndeks górny 0 produkowana jest bardzo rzadko. Na dodatek prawdopodobieństwo jej rozpadu z produkcją dwóch fotonów nie przekracza 1%. Celem eksperymentu jest stwierdzenie istnienia cząstki Higgsa.

Dla zainteresowanych

Cząstkę Higgsa odkryło, niezależnie od siebie, kilku naukowców w połowie lat sześćdziesiątych XX wieku, na drodze rozumowania teoretycznego. Jednym z nich był angielski fizyk, Peter Higgs. Przez pół wieku trwały intensywne poszukiwania śladów istnienia tej cząstki. Przez ten czas obrosła ona w różne legendy, nazywano ją cząstką boską i cząstką przeklętą. Ale nie tylko - w rozważaniach teoretycznych zajęła ona niepoślednie miejsce wśród cząstek uważanych dziś za fundamentalne. Niektórzy twierdzą nawet, że miejsce wyróżnione.
Zainteresuj się cząstką Higgsa, wyszukaj we własnym zakresie informacje o niej - zarówno naukowe jak i popularne. Na pewno jest warta Twojej uwagi.

Tu śmiało można więc powiedzieć, że poszukiwania te są jeszcze trudniejsze niż szukanie igły w stogu siana. Igłę od siana odróżniają na przykład jej własności magnetyczne. Tu zaś bardzo wiele par fotonów ma własności takie same jak te z rozpadu bozonu Higgsa. Wyodrębnienie ich wydaje się więc prawie beznadziejne, bo rozpatrując oddzielnie każdą parę fotonów nie mamy żadnych szans wydzielić tej „naszej”. Fizyk, analogicznie jak detektyw, szuka więc wskazówek.

Pierwsza wskazówka: przejrzyj wszystkie pary fotonów na raz.

Kiedy jednak będziemy rozpatrywać wszystkie możliwe kombinacje par fotonów, to otrzymamy ich statystyczny rozkład o określonym kształcie (Rys. 4., czerwona linia ciągła). Jest on wynikiem znanych własności procesu produkcji cząstek w zderzeniach jądrowych. Procesy te są znane zarówno od strony teoretycznej jak i eksperymentalnej. Ten rozkład często nazywamy tłem.

R2a06ZWE2fcXM
Rys. 4. Częstość występowania par fotonów gamma o energii pokazanej na osi odciętych. Na osi rzędnych zastosowano jednostki umowne, gdyż każdy detektor zlicza pojedyncze fotony. Częstość zaś dotyczy par fotonów o określonej sumarycznej energii. Słupki niepewności pomiarowej byłyby mniejsze od rozmiarów punktów.
Czerwona linia reprezentuje przewidywany teoretycznie przebieg tła.
Źródło: Politechnika Warszawska Wydział Fizyki, licencja: CC BY 4.0. Licencja: https://creativecommons.org/licenses/by/4.0/deed.pl.
Druga wskazówka: pamiętaj o wynikach swoich poprzedników.

Wszystkie wykonywane od kilku dekad eksperymenty, których celem  było znalezienie cząstki Higgsa, dały wynik negatywny. Mimo tego, były udane: pozwoliły zawęzić obszar poszukiwań do łącznej energii par fotonów z zakresu stu kilkudziesięciu gigaelektronowoltówElektronowoltgigaelektronowoltów.

Trzecia wskazówka: szukaj odstępstw od tła.

Nanieś swoje wyniki (niebieskie punkty pomiarowe na Rys. 4.) i porównaj z przewidywaniami. Natychmiast zauważasz, że panuje między nimi pełna zgodność. Zaraz potem zauważysz mały wzgórek w rejonie wartości 125 GeV. Ten wzgórek właśnie może być dla nas interesujący, bo pokazuje odstępstwo od oczekiwań.

Czwarta wskazówka: odfiltruj tło.

Odejmijmy tło, czyli nieinteresującą nas „podkładkę” par fotonów pochodzących z  procesów znanych. Pozostanie to, czego poszukujemy. Do niebieskich punktów pomiarowych (Rys. 5.) dopasowujemy funkcjęDopasowana funkcjadopasowujemy funkcję, której wykres pokazany jest na czerwono. Wykres odfiltrowany zawiera wyodrębnione kluczowe informacjeKluczowe informacjekluczowe informacje dla naszych poszukiwań. W wielu zastosowaniach określamy je mianem „sygnał” i przeciwstawiamy określeniu „tło” lub „szum”.

RMUKJQfiIxwFD
Rys. 5. We współrzędnych z jednostkami analogicznymi jak na Rys. 4. pokazana jest różnica pomiędzy punktami pomiarowymi a przewidzianym teoretycznie tłem. Poza zakresem od około 120 GeV do około 132 GeV różnica ta jest zerowa – świadczą o tym niepewności pomiarowe.
Wewnątrz tego zakresu występują punkty, dla których częstotliwość występowania par fotonów gamma jest niezerowa.
Źródło: Politechnika Warszawska Wydział Fizyki, licencja: CC BY 4.0. Licencja: https://creativecommons.org/licenses/by/4.0/deed.pl.

Podkreślmy: Wykorzystaliśmy tu nie tyle wyróżniającą cechę poszukiwanych par fotonów, ile własność zbioru innych par, stanowiących tłoTło pomiarowetło dla poszukiwanego przez nas efektu. Gdybyśmy tego tła nie znali, efekt pozostawałby niezauważony.

Piąta wskazówka: zinterpretuj.

Przede wszystkim: istnieje cząstka Higgsa. Choć to wnioskowanie jest poważnie uproszczone, to warto wiedzieć, że informacje z wykresu takiego, jak na Rys. 5., były podstawą przyznania nagrody Nobla dla Petera Higgsa i François’a Englerta w 2013 r.

Dla zainteresowanych

Zwróć teraz uwagę na oś rzędnych obu wykresów; popatrz na każdy trochę jak na histogram (o umownych jednostkach na osi pionowej). W pojedynczym przedziale energii na wykresie z Rys. 4. mamy od kilku do kilkunastu tysięcy przypadków wystąpienia pary fotonów o energii w tym przedziale. Na wykresie z Rys. 5. w ogromnej większości z tych przedziałów mamy zero takich przypadków - przyjrzyj się punktom pomiarowym i ich niepewnościom. Jedynie w obszarze od ok. 120 GeV do ok. 132 GeV mamy osiem  przedziałów energii, w których zarejestrowano po kilkaset wystąpień par fotonów.

To pozwala ocenić, że bozon Higgsa odkryto dzięki zauważeniu około 2800 par fotonów na tle około 370000 par, które zostały zarejestrowane podczas poszukiwań i stanowiły tło.

Na podstawie odfiltrowanych danych możemy podać podstawowe własności bozonu Higgsa, w tym jego masę. Jest ona powiązana z jego energią spoczynkową, wynoszącą niecałe 126 GeV, najsłynniejszym wzorem fizycznym:

E = m c 2   .

Podsumowanie

Na zakończenie podajmy kilka uwag ogólnych, dotyczących różnych sposobów wyodrębniania informacji kluczowych.

  1. Znajdujemy takie własności informacji kluczowych, których nie niosą pozostałe dane. Następnie wykonujemy filtrowanie danych, odrzucając wszystkie te, które tych własności nie mają. Przykład: własności magnetyczne igły w stogu siana.

  2. Jeśli interesujące nas informacje kluczowe nie podlegają statystycznym cechom pozostałych danych, to całość danych opisujemy wybranym rozkładem statystycznym. Interesujące nas dane będą wtedy widoczne jako odstępstwo od tego rozkładu.

  3. Jeśli dane o kluczowym znaczeniu zmieszane są z innymi, które chcemy odfiltrować, to już na etapie planowania pomiarów dołączamy pomiary pomocnicze, które nie będą dostarczać informacji pomiarowych, ale dostarczą informację, z pomocą której odróżnimy informację kluczową od pozostałych.

  4. Już na etapie trwania pomiarów stosujemy wielostopniowy „trigger”, który wyzwala tylko wybrane procesy i wybrane elementy do dalszej analizy – te, które zawierają kluczowe dla nas informacje.

Słowniczek

ALICE
ALICE

(ang. ALICE - A Large Ion Collider Experiment) jeden z kilku eksperymentów wykonywanych za pomocą LHC - wielkiego akceleratora (zderzacza) hadronów w ośrodku CERN. Planowanie eksperymentu i budowa aparatury, w tym detektorów, trwały od połowy lat dziewięćdziesiątych XX wieku, a badania są w nim prowadzone od 2010 roku.

CERN
CERN

(ang. CERN) pierwotnie: Europejska Rada Badań Jądrowych z siedzibą w Genewie (Conseil Européen pour la Recherche Nucléaire), obecnie Europejska Organizacja Badań Jądrowych. Jest międzynarodowym ośrodkiem naukowo‑badawczym z zakresu fizyki jądrowej i cząstek elementarnych. Zrzesza 23 państwa europejskie (w tym Polskę) i współpracuje z kilkuset instytucjami naukowymi w całym świecie.

Elektronowolt
Elektronowolt

(ang. electron‑volt) skrót: 1 eV. Jednostka energii używana w fizyce atomowej, jądrowej i fizyce cząstek elementarnych. 1 eV=1,602·10-19J

Kluczowe informacje
Kluczowe informacje

(ang. key information) – zwięzłe i przejrzyście zaprezentowane informacje dotyczące zasadniczych cech badanego procesu lub zjawiska - takich, od których zależy jego przebieg. W przypadku teorii są to informacje, na których opierają się założenia teorii oraz jej przewidywania, w przypadku eksperymentu - te, które warunkują jego zgodny z założeniami przebieg i uzyskanie wiarygodnych wyników.

Tło pomiarowe
Tło pomiarowe

(ang. measurement background) – informacje, których nie da się oddzielić od informacji kluczowych w procesie pomiaru i rejestracji jego wyników. Ich wydzielenie wymaga zastosowania specjalnych procedur eliminacji tła.

Dopasowana funkcja
Dopasowana funkcja

(ang. fitted function) – funkcja o parametrach dobranych tak, by możliwie dobrze przybliżała i odtwarzała przebieg danych pomiarowych.

Układ wyzwalający
Układ wyzwalający

(ang. trigger) – układ, zwykle elektroniczny, wyzwalający proces rejestracji wyników pomiaru lub uruchamiający zadane elementy aparatury pomiarowej. Spełnia też rolę układu selekcji w procesie pomiarowym, bowiem wyzwalanie następuje tylko przy spełnieniu określonych warunków.
W języku angielskim trigger oznacza język spustowy w broni palnej; potocznie: cyngiel.