Andriej Markov: Matematyk, który nauczył maszyny przewidywać przyszłośćyoutube.com

#WIELKAMATEMATYKA15/147 #matematyka

Najpierw zachęcam do obejrzenia tego odcinka Veritasium (PL) » http://www.youtube.com/watch?v=QEh5mvrTdSg (Pojawia się w niej postać naszego dzisiejszego bohatera: A. Markova. Następnie zapraszam do lektury )

Przyszłość zależy od teraźniejszości, ale nie od przeszłości — chyba, że przez teraźniejszość.


Te słowa, choć nigdy nie zostały wypowiedziane przez Andrieja Markova, doskonale oddają istotę jego największego odkrycia. Ten rosyjski matematyk przełomu XIX i XX wieku stworzył teorię, która miała zrewolucjonizować sposób myślenia o przypadku, przewidywalności i zależnościach w czasie. Łańcuchy Markova - nazwane jego imieniem - stały się podstawą współczesnej sztucznej inteligencji, algorytmów wyszukiwania Google, modeli ekonomicznych i prognoz pogody. Kim był człowiek, który potrafił matematycznie opisać, jak teraźniejszość kształtuje przyszłość, nie będąc skrępowana przeszłością?

Zdjęcie

Dziecko carskiej Rosji, które liczyło śnieżynki

14 czerwca 1856 roku w Riazaniu, mieście leżącym około 200 kilometrów na południowy wschód od Moskwy, przyszedł na świat Andriej Andriejewicz Markov. Jego ojciec, Andriej Grigorjewicz, był urzędnikiem w administracji lokalnej — jednym z tysięcy rosyjskich czynowników(*), którzy utrzymywali porządek w ogromnym imperium carskim. Matka, Nadieżda Pietrowna, zajmowała się domem i wychowywaniem dzieci.

(*) Czynownik (ros. чиновnik) to historyczny termin określający urzędnika w Imperium Rosyjskim, funkcjonujący od czasów Piotra I i wprowadzonej przez niego Tabeli Rang (1722). Określenie to odnosiło się do osób posiadających rangę w służbie cywilnej lub dworskiej. Współcześnie słowo to bywa używane potocznie, często pejoratywnie, na określenie biurokraty.


Riazań połowy XIX wieku to było typowe rosyjskie miasto prowincjonalne: drewniane domy z rzeźbionymi okiennicami, cerkwie z złotymi kopułami, błotniste ulice wiosną i zaspy śnieżne zimą. Ale dla małego Andrieja ten pozornie monotonny krajobraz kryć w sobie fascynujące wzorce i regularności.

Już jako dziecko Andriej przejawiał niezwykłą zdolność do dostrzegania matematycznych struktur w otaczającym świecie. Podczas długich rosyjskich zim obserwował, jak śnieżynki spadają z nieba — każda inna, ale wszystkie podlegające tym samym prawom fizyki. Zastanawiał się, czy można przewidzieć, gdzie spadnie następna śnieżynka, znając pozycję poprzedniej.

Ta dziecięca ciekawość przerodziła się później w fundamentalne pytania o naturę przypadku i przewidywalności. Czy przyszłość jest całkowicie determinowana przez przeszłość? Czy istnieją zjawiska, których przebieg zależy tylko od chwili obecnej? Te pytania miały kształtować całą jego matematyczną karierę.

W szkole Andriej wyróżniał się jako uczeń o wyjątkowych zdolnościach matematycznych, ale również problematyczny i wybuchowy. Miał trudny charakter — był uparty, bezkompromisowy, skłonny do konfrontacji z nauczycielami. Ta cecha charakteru towarzyszyła mu przez całe życie i wpływała na jego stosunki z kolegami i przełożonymi.

Petersburg — brama do świata nauki

W 1874 roku, osiemnastoletni Andriej rozpoczął studia na Wydziale Matematyczno—Fizycznym Uniwersytetu Petersburskiego. Petersburg drugiej połowy XIX wieku był nie tylko stolicą polityczną Rosji, ale też jej centrum intelektualnym. Uniwersytet petersburski, założony w 1819 roku, stał się w tym czasie jedną z najlepszych uczelni w Europie.

Na uniwersytecie Markov zetknął się z najnowszymi kierunkami w matematyce europejskiej. Jego profesorami byli wybitni uczeni, którzy wprowadzali do Rosji osiągnięcia niemieckiej i francuskiej szkoły matematycznej. Szczególne wrażenie zrobił na nim Pafnuty Czebyszew — jeden z najwybitniejszych matematyków rosyjskich, twórca teorii aproksymacji i pionier współczesnej teorii prawdopodobieństwa (na długo przed jej finalnym powstaniem).

Czebyszew był nie tylko genialnym matematykiem, ale też wymagającym nauczycielem. Jego seminaria słynęły z mega wysokiego poziomu i ostrej krytyki słabych prac, nie pier*olił się w tańcu. Albo byłeś zdolny, albo wylatywałeś z hukiem. Markov szybko stał się jednym z jego najzdolniejszych uczniów, ale też jednym z najbardziej krnąbrnych. Nie wahał się kwestionować twierdzeń profesora, proponować własne rozwiązania, wdawać się w matematyczne spory. Lubili razem tańczyć.

Ten intelektualny walc (a może bardziej kozak) z Czebyszewem okazał się niezwykle płodny w skutkach. Zmusił Markova do precyzyjnego myślenia, dokładnego formułowania twierdzeń, szukania rygorystycznych dowodów. Pod kierunkiem Czebyszewa Markov napisał pracę magisterską o ciągłych ułamkach — dziedzinie matematyki łączącej teorię liczb z analizą.

Młody profesor o rewolucyjnych ideach

W 1878 roku Markov ukończył studia z wyróżnieniem. Zdecydował się pozostać na uniwersytecie jako docent. Jego pierwsze prace naukowe dotyczyły teorii aproksymacji — badał, jak najlepiej przybliżać skomplikowane funkcje za pomocą prostszych wyrażeń algebraicznych. Był to temat bliski sercu Czebyszewa, ale Markov wprowadził do niego własne, oryginalne metody.

W 1884 roku, w wieku 28 lat, Markov obronił rozprawę doktorską i został profesorem. Jego rozprawa nosiła tytuł O pewnych zastosowaniach ciągłych ułamków algebraicznych i zawierała nowe, eleganckie dowody ważnych twierdzeń teorii aproksymacji.

Już wtedy Markov zaczął interesować się teorią prawdopodobieństwa — dziedziną, która w XIX wieku była jeszcze mało rozwinięta i traktowana z pewną podejrzliwością przez prawdziwych matematyków. Prawdopodobieństwo kojarzyło się z hazardem, przypadkiem, brakiem precyzji — wszystkim tym, czego unikała klasyczna matematyka.

Ale Markov widział w teorii prawdopodobieństwa ogromny potencjał. Rozumiał, że wiele zjawisk w przyrodzie i społeczeństwie ma charakter probabilistyczny — nie można ich przewidzieć z absolutną pewnością, ale można opisać ich statystyczne właściwości. To była wizja, która wyprzedzała epokę o kilkadziesiąt lat.

Odkrycie, które zmieniło sposób myślenia o czasie

Przełomowy moment w karierze Markova nastąpił na początku XX wieku, gdy zaczął analizować sekwencje zdarzeń losowych, w których każde kolejne zdarzenie zależy od poprzedniego. Klasyczna teoria prawdopodobieństwa zakładała niezależność zdarzeń — rzuty monetą, ciągnięcie kart z talii, wyrzucanie liczb na kostkach to były modele, gdzie każde zdarzenie było niezależne od poprzednich.

Ale Markov dostrzegł, że w rzeczywistości większość zjawisk ma inny charakter. Jutrzejsza pogoda zależy od dzisiejszej. Cena akcji jutro zależy od ceny dzisiaj. Następna litera w tekście zależy od poprzedniej. Przyszłość nie jest niezależna od teraźniejszości — ale czy zależy od całej przeszłości, czy może jedynie od najbliższej chwili wstecz?

W 1906 roku Markov sformułował swoją słynną hipotezę: istnieją procesy stochastyczne, w których przyszły stan zależy tylko od stanu obecnego, a nie od całej historii procesu. Nazwał je łańcuchami — każde ogniwo łączy się z następnym, ale nie pamięta odległej przeszłości.

Matematycznie można to wyrazić tak: jeśli znamy stan systemu w chwili obecnej, to prawdopodobieństwo każdego przyszłego stanu nie zależy od tego, jak system dotarł do stanu obecnego. Przeszłość wpływa na przyszłość tylko przez teraźniejszość. A dokładniej, przeszłość wpływa na przyszłość, tylko do momentu osiągnięcia stanu obecnego (który będzie wpływać dalej: a więc to stricte teraźniejszość kształtuje przyszłość; dobrze zaś wiemy, że teraźniejszość powstaje przez przeszłość, ale Markov wyraźnie i precyzyjnie rozróżniał te stany).

Pierwszy przykład — analiza "Eugeniusza Oniegina"

Aby zilustrować swoją teorię, Markov wybrał zaskakujący przykład — przeanalizował początek Eugeniusza Oniegina Aleksandra Puszkina. Zliczył samogłoski i spółgłoski w poemacie, traktując każdą literę jako stan w łańcuchu. Chciał sprawdzić, czy prawdopodobieństwo wystąpienia samogłoski zależy tylko od tego, czy poprzednia litera była samogłoską czy spółgłoską.

Analiza potwierdziła jego intuicję — w języku rosyjskim istnieją silne korelacje między sąsiednimi literami, ale korelacje z dalszymi literami są znacznie słabsze. Po samogłosce częściej następuje spółgłoska, po spółgłosce — samogłoska. To był pierwszy historyczny przykład analizy tekstu metodami matematycznymi.

Ten eksperyment może wydawać się zabawką matematyczną, ale miał głębokie konsekwencje. Markov pokazał, że łańcuchy noszące jego imię można zastosować do analizy języka, a przez to — do modelowania komunikacji ludzkiej. To była droga, która prowadziła do współczesnego przetwarzania języka naturalnego i sztucznej inteligencji.

Swoją analizę Markov przeprowadził ręcznie, licząc każdą literę w poemacie Puszkina. Gdyby żył w epoce komputerów, prawdopodobnie zostałby pionierem CL (computational linguistics). Jego metoda była prekursorem wszystkich współczesnych algorytmów analizy tekstu.

Matematyczna teoria przypadku z pamięcią

Na podstawie swoich badań Markov sformułował matematyczną teorię procesów, które później nazwano łańcuchami Markova. Kluczowym pojęciem była właściwość markovska — matematyczne wyrażenie idei, że przyszłość zależy tylko od teraźniejszości.

Markov udowodnił szereg fundamentalnych twierdzeń o takich procesach. Pokazał, że pod pewnymi warunkami łańcuchy Markova mają rozkład stacjonarny — długoterminowe prawdopodobieństwa, które nie zmieniają się w czasie. Udowodnił też twierdzenia o konwergencji — że niezależnie od stanu początkowego, łańcuch Markova dąży do tego samego rozkładu długoterminowego.

Te abstrakcyjne twierdzenia miały ogromne znaczenie praktyczne. Oznaczały, że można przewidywać długoterminowe zachowanie skomplikowanych systemów, nawet jeśli nie znamy wszystkich szczegółów ich działania. Wystarczy zidentyfikować stany systemu i prawdopodobieństwa przejść między nimi.

Markov rozwinął też teorię łańcuchów niejednorodnych, gdzie prawdopodobieństwa przejść zmieniają się w czasie, oraz łańcuchów wyższych rzędów, gdzie przyszłość zależy nie tylko od stanu obecnego, ale też od kilku poprzednich stanów. Te uogólnienia okazały się kluczowe dla późniejszych zastosowań.

Nauczyciel w burzliwych czasach

Przez całą swoją karierę Markov był nie tylko badaczem, ale też nauczycielem. Jego wykłady z teorii prawdopodobieństwa na Uniwersytecie Petersburskim były pierwszymi systematycznymi wykładami z tej dziedziny w Rosji. Wychował całe pokolenie rosyjskich probabilistów, którzy kontynuowali jego dzieło.

Markov jednak żył w burzliwych czasach. Rosja końca XIX i początku XX wieku to był kraj w głębokim kryzysie politycznym i społecznym. Rewolucja 1905 roku, która wybuchła po klęsce w wojnie z Japonią, wstrząsnęła carskim imperium. Studenci protestowali, uniwersytety były zamykane, profesorowie aresztowani.

Markov, pomimo swojego trudnego charakteru, lub może właśnie dzięki niemu, stał się obrońcą autonomii uniwersyteckiej i wolności naukowej. Nie wahał się krytykować władz carskich, protestować przeciwko ingerencji polityki w naukę, bronić swoich kolegów przed represjami.

W 1908 roku, gdy rząd próbował ograniczyć autonomię uniwersytetów, Markov zorganizował protest profesorów. Groził rezygnacją, jeśli władze będą ingerowały w działalność naukową. Ta postawa przyniosła mu konflikty z administracją, ale też szacunek studentów i kolegów.

Twórca rosyjskiej szkoły probabilistycznej

Markov był nie tylko twórcą teorii łańcuchów, ale też budowniczym całej rosyjskiej szkoły teorii prawdopodobieństwa. Jego uczniowie — Aleksander Chinczyn, Aleksander Kolmogorov, Eugeniusz Słucki — stali się później wielkimi nazwiskami światowej matematyki.

Szczególnie ważne było jego mentorstwo młodego Kolmogorova, który w latach trzydziestych XX wieku stworzył nowoczesne aksjomatyczne podstawy teorii prawdopodobieństwa. Kolmogorov zawsze podkreślał, że jego prace wyrastają z tradycji Czebyszewa—Markova—Lapunowa.

Markov napisał też pierwszy nowoczesny podręcznik teorii prawdopodobieństwa — Rachunek prawdopodobieństwa, który przez dziesięciolecia był podstawą nauczania tej dziedziny w Rosji i innych krajach słowiańskich. Książka łączyła matematyczny rygor z intuicyjnymi wyjaśnieniami, precyzyjne dowody z praktycznymi przykładami.

Jego stylem naukowym była niezwykła jasność myślenia połączona z matematyczną elegancją. Markov nie lubił niepotrzebnych komplikacji — dążył zawsze do najprostszych, najelegantszych sformułowań. Ta cecha charakteryzowała całą rosyjską szkołę probabilistyczną.

Rewolucja, która zniszczyła stary świat

Rewolucja lutowa 1917 roku zakończyła trzysetletnie panowanie dynastii Romanowów. Markov, jak wielu rosyjskich intelektualistów, początkowo z nadzieją patrzył na zmiany polityczne. Wierzył, że upadek caratu przyniesie wolność naukową i demokratyzację edukacji.

Ale rewolucja październikowa i dojście do władzy bolszewików zapoczątkowały okres, który radykalnie zmienił życie w Rosji. Nowe władze ogłosiły, że nauka musi służyć celom rewolucji, że burżuazyjna matematyka musi zostać zastąpiona przez naukę proletariacką.

Markov, pomimo swoich wcześniejszych konfliktów z carem, nie potrafił zaakceptować nowej rzeczywistości. Był człowiekiem starej szkoły, wychowanym w tradycjach europejskiej nauki, dla którego najważniejsza była prawda matematyczna, a nie ideologia polityczna.

W 1919 roku, gdy kraj pogrążył się w chaosie wojny domowej, władze radzieckie zaczęły reorganizację uniwersytetów. Wielu profesorów zostało usuniętych, programy nauczania dostosowane do nowych wymogów ideologicznych. Markov, chociaż nie został formalnie zwolniony, znalazł się w niezwykle trudnej sytuacji.

Ostatnie lata mistrza

Ostatnie lata życia Markov spędził w atmosferze niepewności i niepokoju. Jego uniwersytet był reorganizowany, wielu kolegów emigrowało lub zostało aresztowanych, warunki życia w Petersburgu — przemianowanym na Piotrogród — drastycznie się pogorszyły.

Ale nawet w tych trudnych warunkach Markov kontynuował pracę naukową. Pracował nad uogólnieniami swojej teorii łańcuchów, badał zastosowania teorii prawdopodobieństwa w fizyce, prowadził seminaria dla nielicznej grupy pozostałych studentów.

Jego zdrowie pogarszało się. Lata napięcia, stres związany z przemianami politycznymi, trudne warunki życia w czasie wojny domowej — wszystko to odcisnęło piętno na jego organizmie. Cierpiał na problemy z sercem, często bolała go głowa.

20 lipca 1922 roku Andriej Andriejewicz Markov zmarł w Piotrogrodzie, w wieku 66 lat. Jego pogrzeb był skromny — czasy nie sprzyjały wielkim ceremoniom dla burżuazyjnych profesorów. Ale jego uczniowie i koledzy wiedzieli, że odszedł jeden z najwybitniejszych rosyjskich matematyków.

Łańcuchy, które podbiły świat

Po śmierci Markova jego teoria przez kilkadziesiąt lat pozostawała głównie akademicką ciekawostką. Matematycy doceniali jej elegancję, ale praktyczne zastosowania wydawały się ograniczone. To miało się zmienić wraz z pojawieniem się komputerów i rozwojem teorii informacji.

W latach pięćdziesiątych XX wieku Claude Shannon, twórca teorii informacji, pokazał, że łańcuchów Markova można używać do modelowania źródeł informacji. W latach sześćdziesiątych zaczęto je stosować w ekonomii do modelowania rynków finansowych. W latach siedemdziesiątych — w biologii do analizy sekwencji DNA.

Ale prawdziwe zastosowania nastąpiły wraz z rozwojem informatyki. Okazało się, że łańcuchy Markova to idealne narzędzie do modelowania systemów, gdzie przyszłość zależy od teraźniejszości (nie zaś od całej przeszłości). A takich systemów nie brakuje.

Dzisiaj łańcuchy Markova są wszędzie. Google używa ich w algorytmie PageRank do oceny stron internetowych (ranking wyników). Netflix stosuje je do rekomendowania filmów i seriali. Systemy rozpoznawania mowy bazują na ukrytych modelach Markova. Gry komputerowe generują realistyczne teksty używając łańcuchów Markova.

Sztuczna inteligencja Markova

W erze sztucznej inteligencji łańcuchy Markova zyskały nowe, fundamentalne znaczenie. Modele językowe, które potrafią pisać teksty, tłumaczyć języki, odpowiadać na pytania, to w istocie bardzo zaawansowane uogólnienia idei Markova.

GPT, ChatGPT, Claude, Gemini — wszystkie te systemy bazują na ideach, które można prześledzić aż do analizy Eugeniusza Oniegina przez Markova. Przewidują następne słowo w tekście na podstawie poprzednich słów — rozwijając ideę przewidywania następnego elementu na podstawie poprzedniego, którą Markov zastosował do liter.

Oczywiście współczesne modele językowe są nieporównywalnie bardziej skomplikowane niż pierwotne łańcuchy Markova. Używają sieci neuronowych, mechanizmów uwagi, zaawansowanych technik uczenia maszynowego. Ale fundamentalna idea pozostaje ta sama: przyszłość (następne słowo) zależy od teraźniejszości (kontekstu), ale nie od całej przeszłości.

Monte Carlo — metoda symulacji statystycznej używana wszędzie od fizyki po finanse — też bazuje na łańcuchach Markova. Algorytmy MCMC (Markov Chain Monte Carlo) pozwalają próbkować ze skomplikowanych rozkładów prawdopodobieństwa, rozwiązywać problemy optymalizacji, analizować modele statystyczne.

Proroczy geniusz z Riazania

Historia Andrieja Markova to opowieść o matematycznym proroku — człowieku, który przewidział przyszłość informatyki i sztucznej inteligencji o sto lat przed ich powstaniem. Jego łańcuchy, wymyślone do analizy literatury rosyjskiej, stały się fundamentem cyfrowej rewolucji XXI wieku.

Markov pokazał, że przypadek nie oznacza chaosu — że nawet w pozornie nieprzewidywalnych procesach można znaleźć matematyczne regularności. Że przyszłość, choć niepewna, nie jest całkowicie niezależna od teraźniejszości. Że można przewidywać, nie znając całej historii.

To była głęboka filozoficzna intuicja, ubrana w precyzyjny matematyczny język. Markov zrozumiał, że świat jest pełen procesów, gdzie pamięć jest ograniczona — gdzie ważne jest nie to, skąd przychodzimy, ale gdzie jesteśmy teraz.

Dziedzictwo, które żyje w algorytmach

Dzisiaj, gdy żyjemy w świecie algorytmów i sztucznej inteligencji, dziedzictwo Markova jest wszędzie wokół nas. Każde wyszukiwanie w Google, każda rekomendacja na Netflixie, każda prognoza pogody, każda symulacja komputerowa — wszystko to używa jego matematyki.

Samochody autonomiczne przewidują zachowanie innych pojazdów używając modeli Markova. Systemy handlu algorytmicznego na giełdach analizują rynki za pomocą łańcuchów Markova. Gry komputerowe tworzą realistyczne światy, generując tekstury, muzykę, dialogi metodami Markova.

W medycynie łańcuchy Markova służą do modelowania epidemii, analizy skuteczności leków, przewidywania przebiegu chorób. W biologii — do analizy ewolucji, sekwencjonowania genomów, modelowania ekosystemów. W ekonomii — do analizy rynków, prognozowania recesji, oceny ryzyka inwestycyjnego.

Lekcja nieprzewidywalnej przewidywalności

Może najważniejszą lekcją płynącą z życia i pracy Markova jest to, że najgłębsze odkrycia często pochodzą z najmniej oczekiwanych źródeł. Kto by pomyślał, że analiza poezji Puszkina doprowadzi do stworzenia podstaw sztucznej inteligencji?

Markov pokazał też, że matematyka nie jest abstrakcyjną grą, ale narzędziem do zrozumienia świata. Jego łańcuchy opisują wszystko — od ruchów cząsteczek w gazie po zachowania społeczne ludzi, od mutacji genetycznych po fluktuacje na giełdzie.

Historia tego rosyjskiego matematyka przypomina też o wartości fundamentalnych badań. Markov nie przewidywał, że jego teoria znajdzie zastosowanie w komputerach — komputery jeszcze nie istniały. Ale jego matematyczna ciekawość i dążenie do zrozumienia natury przypadku stworzyły narzędzia, które zmieniły świat.

W epoce, gdy nauka jest często oceniana przez pryzmat natychmiastowej użyteczności, przykład Markova pokazuje, że najwartościowsze odkrycia mogą czekać na swoje zastosowanie dziesięciolecia. Że prawdziwy postęp naukowy wymaga cierpliwości, wyobraźni i wiary w moc abstrakcyjnego myślenia.

Andriej Markov zmarł w 1922 roku, nie wiedząc, że jego łańcuchy będą kiedyś sterować robotami, tłumaczyć języki, komponować muzykę i pomagać ludziom rozumieć wszechświat. Ale pozostawił po sobie matematyczną teorię tak fundamentalną, że wciąż odkrywamy jej nowe zastosowania. To jest prawdziwa nieśmiertelność uczonego — życie w każdym algorytmie, w każdej symulacji, w każdej próbie zrozumienia, jak teraźniejszość kształtuje przyszłość.

18

Brak komentarzy. Napisz pierwszy