Niemożliwym jest wytrzymać dzień bez algorytmów, które zarządzają całym naszym internetowym życiem — to one podsuwają nam pod nos produkty do kupienia, książki, filmy i muzykę. Około 74 procent dorosłych ludzi w Stanach Zjednoczonych przynajmniej raz dziennie zagląda na Facebooka, a to, co na nim widzą, jest zależne jedynie od algorytmu. W życiu “offline” ten sam algorytm pozwala nam na podejmowanie podchwytliwych decyzji, przeglądanie ofert pracy, sprawdzanie wyników egzaminów, a nawet rozwiązywanie spraw kryminalnych.
Wszechobecne algorytmy wywołują zarówno sensację, jak i strach. Z jednej strony bywają one nieprzejrzyste i stronnicze; z drugiej podejmują się zadań, z jakimi nie poradziłby sobie człowiek — począwszy od zaawansowanej logistyki handlowej, a na wykrywaniu pierwszych oznak chorób skończywszy.
O co więc tak naprawdę chodzi z tymi algorytmami? Samo słowo “algorytm” ma wiele znaczeń i występuje w różnych dziedzinach życia — na których skupimy się w tym artykule.
MEDIA SPOŁECZNOŚCIOWE
Tablica Facebooka
Niewiele algorytmów równa się sile tych, które znajdziemy na Facebooku. Algorytmy w mediach społecznościowych kontrolują profile 2.8 miliarda użytkowników miesięcznie, decydując, czyje posty i jakie artykuły widzimy codziennie na tablicy.
Kiedy mowa o “algorytmie Facebooka”, mamy na myśli tuziny odłamów oprogramowania opartego na różnych technologiach i codziennie otrzymującego kolejne poprawki. Oprogramowanie to analizuje tak zwany “inwentarz”, czyli zbiór postów danych użytkowników oraz obserwowane przez nich strony i grupy. Następnie w ruch wchodzą stworzone na bazie sztucznej inteligencji sieci neuronowe, które tworzą ranking wszystkich tych postów oparty o różne czynniki. Jeszcze w 2014 roku Facebook brał pod uwagę 100 tysięcy takowych czynników. Od wyników rankingów zależy to, jakie posty będą nam się wyświetlać na głównej tablicy.
Facebook rzadko kiedy wspomina pracę algorytmów. Prawdę powiedziawszy, strona sama nie potrafi ich wyjaśnić — bynajmniej nie z poziomu pojedynczego użytkownika. Wiceprezes stosunków międzynarodowych Facebooka, Nick Clegg, oznajmił niedawno, że każdy użytkownik posiada algorytm tak unikatowy jak ich odciski palców.
Ta złożoność może się odbić na Facebooku w najbliższych latach. Od dłuższego czasu panuje atmosfera napięcia między modelem biznesowym firmy a moralnością oczekiwaną przez społeczeństwo. Facebook chce jak najdłużej zachować przy sobie użytkowników, by móc wyświetlić im więcej reklam. To stwierdzenie wywołało oburzenie, z racji że algorytmy wyświetlają więcej postów na tematy kontrowersyjne — takie jak Brexit — ponieważ to właśnie one najlepiej się klikają.
Przez dłuższy czas, firma wykorzystywała ludzkich moderatorów do kontrolowania kontrowersyjnych treści. Niedawno do użytku weszła niezależna Rada Nadzorcza zajmująca się wyjątkowo trudnymi tematami, złożona z dwudziestu dziennikarzy, polityków, działaczy oraz profesorów — jednym z nich jest specjalista od prawa technologicznego, Nicolas Suzor z Uniwersytetu Technologii Queensland w Brisbane, w Australii. — Musimy uporać się z problemami na szeroką skalę, takimi jak znalezienie sposobu na przekazywanie wiadomości poprzez media społecznościowe tak, by współgrały z naszymi celami społecznymi — mówi Suzor — By móc rozwiązać te problemy, Facebook musi dokładniej wyjaśnić, jak działają jego algorytmy — dodaje Matthew Sparkes.
74% dorosłych w Stanach Zjednoczonych przynajmniej raz dziennie zagląda na Facebooka
PROGNOZY POGODY
Algorytm “Unified Model”
Choć świat prześmiewczo spogląda na brytyjską obsesję na punkcie pogody to trzeba przyznać, że oferują nam prognozy pierwszej klasy. W sercu prognoz serwisu Met Office znajduje się algorytm o nazwie Unified Model. Przyjmuje on dane dotyczące stanu atmosfery ze stacji meteorologicznych oraz satelit, a następnie przelicza możliwe zmiany pogodowe. W efekcie wyświetlana jest ikonka słońca lub płatku śniegu.
Algorytm oparty jest na równaniach Naviera-Stokesa, które opisują ruch i pęd płynów oraz gazów. W ten sposób możemy przewidzieć ruch suchego lub wilgotnego powietrza w atmosferze — bo to właśnie od niego zależy pogoda. Równania same w sobie nigdy nie są w stu procentach pewne; taką pewność można osiągnąć dzięki ustaleniu przybliżonej serii zmian przyrostowych w danej atmosferze. I to właśnie tym zajmuje się Unified Model.
92% prognoz temperatury Met Office jest zgodna z różnicą do 2°C
Przez ostatnie dekady procesory komputerów stawały się coraz szybsze, pozwalając algorytmom takim jak Unified Model na przetwarzanie pomiarów coraz krótszych przyrostów, co skutkowało lepszymi i szybszymi prognozami. Bo choć nierzadko większość z nich bywa błędna to w 92 procentach przypadków prognozy temperatury Met Office są zgodne z różnicą do 2°C. Innymi słowy, algorytm sam w sobie jest nie do końca precyzyjny, ale rzetelny.
Co ciekawe, Unified Model ma wkrótce przejść przez duże zmiany. — Procesorów jest coraz więcej, ale nie są one szybsze — wyjaśnia Ben Shipway z Met Office, który wraz ze swoim zespołem pracuje nad ponownym projektem modelu, opartym o procesory równoległe.
UDOSTĘPNIANIE PLIKÓW
JPEG
Akronim JPEG kojarzy się ludziom z niczym innym jak z typem pliku. W rzeczywistości jest to algorytm wykorzystywany do kompresji danych w obrazie. Dzięki algorytmom kompresji, takim jak ten, jesteśmy w stanie dzielić się zdjęciami w zastraszającym tempie.
JPEG to skrót od Joint Photographic Experts Group (pl. Połączona Grupa Ekspertów Fotograficznych), czyli zespołu który zaprogramował ten algorytm w 1992 roku. Choć jego budowa wygląda na skomplikowaną to całość bazowano na prostym wglądzie w ludzką wizję. — Włożyliśmy dużo wysiłku w badania nad tym, jak ludzie spostrzegają obrazy i dźwięki. Okazuje się, że pliki nie są w stanie przenieść tak dużej ilości danych — ujawnia Jeff Waldock z Uniwersytetu Sheffield Hallam w Wielkiej Brytanii — Dlatego na potrzeby efektywności, algorytmy kompresji skupiają się na tym, co najważniejsze dla oka bądź ucha.
Czopki w ludzkich oczach, które rejestrują kolor, są od 500 do 1000 razy mniej wrażliwe na światło niż pręciki — te z kolei są wysoce wrażliwe na jasność. JPEG wykorzystuje to, porzucając niektóre dane na temat koloru, jednocześnie zachowując precyzyjną jasność.
W sieci co minutę ląduje 2.1 miliona obrazów
Są sytuacje, w których lepiej nie narażać się na straty związane z formatem JPEG — chociażby przy fotografiach medycznych lub sztuce cyfrowej. Algorytmy kompresji zawsze wiążą się z wymianą między jakością a szybkością transmisji. Co prawda prędkość przesyłania danych wzrosła od 1992 roku, jednak wraz z nią zwiększył się także popyt na wymagania. Istnieją jeszcze takie algorytmy kompresji, które mieszczą w sobie inne rodzaje plików — przykładowo MP3, wykorzystywane do muzyki.
Istnieje pełno potencjalnych następców JPEG, zaprojektowanych dla jeszcze skuteczniejszego przepływu danych. Jednym z nich jest JPEG XL, nad którym pracuje Jyrki Alakuijala z Google’a. — Obrazy są sercem Internetu. Chcemy przedstawić nowy sposób na modelowanie kolorów — mówi. Głównym zamysłem projektu jest stworzenie obrazów jeszcze bardziej nastawionych na ludzką wizję.
MIĘDZYNARODOWA SIEĆ
PageRank
W roku 1998, dwóch przedsiębiorców złożyło patent o algorytm znany jako PageRank. Byli to Larry Page oraz Sergey Brin, założyciele średniej wielkości przeglądarki internetowej Google. Od tamtej pory Google wspięło się na szczyt przeglądarkowej drabiny, a to wszystko za sprawą PageRank.
Zanim Page i Brin złożyli patent, algorytmy przeglądarkowe opierały się o analizowanie słów na stronie internetowej. Na tej podstawie użytkownikom sugerowano strony przy korzystaniu z wyszukiwarki. PageRank działało inaczej: algorytm tworzył ranking linków bazowany na numerze oraz autoryzacji każdej podpiętej pod taki link strony. Przykładowo, jeżeli strona A prowadzi do strony B to strona B przejmie część algorytmu PageRank ze strony A, tym samym wyskakując wyżej na liście wyników w wyszukiwarce Google. Rynek wyszukiwarek zmienił się o 180 stopni — właściciele stron nie potrzebowali już dziwnych sztuczek, które zawyżały ich pozycję na liście. Algorytm zapewnił nam lepsze i trafniejsze wyniki.
Google co sekundę przetwarza 40,000 nowych wyszukiwań
Algorytm PageRank nie jest już tak wpływowy jak kiedyś. Zamiast niego, Google wykorzystuje szereg innych algorytmów, które analizują setki różnych czynników wpływających na ranking stron, opierając się na wielu produktach Google’a. Możecie uwierzyć lub nie, ale wasza lokalizacja, strefa czasowa oraz urządzenie, z którego korzystacie, to tylko jedne z wielu takich przykładowych czynników. Tak jak przy wielu innych aspektach internetowych doświadczeń, tak i tutaj algorytmy personalizują to, co widzicie w ciężki do zrozumienia sposób.
Trudno jest ustalić jak indeksowanie algorytmów zmieniło świat. Przewaga Google’a pozwala na udaną sprzedaż ukierunkowanych reklam — zaledwie w trzecim kwartale przeglądarka zarobiła 46.2 miliardów dolarów. Jednocześnie pozbawiono wsparcia inne przemysły, w tym media, które swojego czasu zarabiały porządne pieniądze na reklamach. Z dziedzictwem PageRank będziemy się mierzyć jeszcze przez długie lata.
FINANSE
Wymiana algorytmów
Wymiana finansowa od zawsze zapewniała pole do popisu dla automatyzacji. Tu nie chodzi tylko o częste błędy i ludzką frustrację. To dekady kosztownych informacji gotowych do analizy oraz tworzenia zasad konsumpcji dyktujących nam co kupić, co lepiej zachować i co sprzedać. Na dzień dzisiejszy to algorytmy zarządzają sporą częścią międzynarodowej ekonomii.
— Dobry handlarz przestrzega dobrych zasad, jednak jako ludzie jesteśmy podatni na emocje, przez które panikujemy lub jesteśmy zbyt chciwi — wyjaśnia Nir Vulkan, ekonomista biznesowy z Uniwersytetu Oksfordzkiego — Algorytmy to ostateczność ucząca nas systematyczności.
Jednym z typów finansowego algorytmu jest tak zwany handel wysokich częstotliwości, w którym komputery dokonują transakcji w zastraszającym tempie. Choć każda transakcja przynosi dość małe zarobki to wszystkie sumują się w jedną całość. W przeszłości to właśnie na te algorytmy zrzucano winę za finansowe awarie; w rzeczywistości to tylko mała część rynku.
Bardziej powszechne algorytmy badają warunki, w których konkretne aktywa finansowe — przykładowo akcje i obligacje — są sprzedawane lub kupowane. Chodzi tu nie tyle o prędkość, co o minimalizowanie ludzkiej faworyzacji. Księgi zasad tego typu są w dużej mierze tworzone i używane przez kapitały o sporych zarobkach, z niepubliczną pracą wewnętrzną. Takie algorytmy są bazą dla coraz większej ilości międzynarodowych decyzji finansowych. — Ich skala cały czas rośnie — twierdzi Vulkan — Fundusze hedgingowe mają swoje sekrety, przez które ciężko jest je rozgryźć. Na oko przejęły jakąś połowę rynku.
Nie jest tajemnicą, że algorytmy handlowe rozwijają się coraz bardziej. Niektóre fundusze są ponad proste reguły, korzystając ze sztucznej inteligencji oraz nauki maszynowej. Systemy oparte o te mechaniki opierają się nie tylko na danych giełdy akcji, ale też na takich rzeczach jak liczba pozytywnych i negatywnych słów w wywiadzie medialnym dyrektora generalnego. Dajmy im trochę czasu, a staną się najmądrzejszym istniejącym algorytmem.
SZYFROWANIE
Algorytm RSA
Wiedzieliście, że korzystając z Internetu uruchamiacie kryptografię RSA? Jest to połączenie algorytmów z protokołami, dzięki którymi możemy przekazywać między komputerami prywatne informacje. Wśród takiej wiedzy tajemnej znajdują się m.in. adresy e-mail oraz szczegóły kont bankowych.
RSA polega na rozszyfrowywaniu wiadomości tak, by jedynie adresat mógł ją odszyfrować. Najprostszym sposobem jest pisanie przy użyciu wcześniejszych liter alfabetu. Możecie wysłać wiadomość o treści “Bydsc!”, którą druga osoba odczyta jako “Cześć!”.
Problem tkwi w fakcie, że adresata wypadałoby poinformować o istnieniu takiego systemu, co zmniejsza jego skuteczność. Na to też istnieje pewien sposób: jeśli klucz do szyfru składa się z dwóch części — publicznej i prywatnej — to możemy zaszyfrować wiadomość przy wykorzystaniu publicznego klucza tak, by adresat musiał skorzystać z prywatnego.
Metoda działa najlepiej, kiedy jest prosta do zaaplikowania przez autora (który zaszyfrowuje wiadomość) i jednocześnie trudna dla adresata (który musi ją odszyfrować). Algorytm RSA wykorzystuje do tego liczby pierwsze. Mnożenie ich jest łatwe i nie zajmuje tak dużo czasu jak przywracanie oryginalnych pierwszych.
W prawdziwym życiu, algorytm RSA wykorzystuje się przy naprawdę olbrzymich liczbach pierwszych, co utrudnia przebicie się przez system — przynajmniej na chwilę obecną. Samo zadanie jest trudne tylko dla klasycznych komputerów; dla komputerów kwantowych byłaby to bułka z masłem. Ale bez obaw — trwają prace nad kryptografią wykorzystującą bardziej oporną matematykę.
ZDROWIE
Algorytmy segregacyjne
Wyobraźcie sobie, że czujecie kujący ból w piersi i natychmiast dzwonicie po pogotowie. W wielu krajach po drugiej stronie telefonu będzie się znajdował, w pewnym sensie, algorytm. Głos prowadzący rozmowę zada wam serię ustalonych przez algorytm pytań, które mogą wykluczyć ryzyko zawału serca. To z kolei zadecyduje o potrzebie wezwania karetki oraz czasie oczekiwania na nią. — Jeśli wszystko postawimy na pierwszym miejscu, to nic nim tak naprawdę nie będzie — stwierdza Richard Webber z brytyjskiego Kolegium Ratowników Medycznych.
Powoli wchodzimy w erę, w której każda dziedzina medycyny zaczyna korzystać z algorytmów niewymagających ludzkiej interwencji. W internetowej wersji NHS 11, czyli brytyjskiego serwisu selekcyjnego oferującego nienaglące porady medyczne, użytkownicy otrzymują szereg zautomatyzowanych pytań prowadzących ich przez stronę. Oprócz tego istnieje kilka aplikacji sprawdzających symptomy, które na podstawie opisu problemów zdrowotnych wystawią możliwą diagnozę. Jak jednak twierdzi Królewskie Kolegium Lekarzy Ogólnych z Wielkiej Brytanii, aplikacje nie zastąpią rzeczywistej wizyty u lekarza, który diagnozę opiera o swoje doświadczenie, odpowiedni trening oraz, niekiedy, przeczucie.
Wykorzystywane są także bardziej rozwinięte algorytmy służące do nauki maszynowej. Istnieją systemy potrafiące odczytać fotografie medyczne tak, by zauważyć złamaną kość na zdjęciu rentgenowskim lub początki cukrzycowej ślepoty w skanie oka. Algorytmy tego typu testowane są na oprogramowaniach z tysiącem zdjęć wybranych przez lekarzy. W niektórych przypadkach bywały one skuteczniejsze od wyszkolonych profesjonalistów; istnieją szpitale, które już z nich korzystają przy dodatkowym wsparciu lekarzy, usprawniając wystawianie diagnoz.
INTERNET
Model TCP/IP
Wysyłając maila lub korzystając z wyszukiwarki, uruchamiamy w komputerze proces wymiany informacji z innym urządzeniem w dalekich krańcach Internetu. To niesamowite połączenie jest możliwe dzięki zestawie algorytmów i reguł znanych jako model TCP/IP. Nazwa ta jest skrótem od angielskiego “Transmission Control Protocol/Internet Protocol”.
Celem tych reguł jest zapewnienie właściwej trasy dla naszej akcji. Algorytmy nie posiadają określonych kablowych ścieżek w Internecie na wypadek, gdyby coś poszło nie tak. Zamiast tego, wiadomość jest rozdzielana na pliki, które algorytmy przeprowadzają przez dostępne drogi. Trajektoria każdego pliku znajdują się na sprężeniu zwrotnym pierwszego z nich. Pliki łączą się w całość, kiedy wszystkie dotrą na miejsce.
Zestaw reguł algorytmicznych został spisany przez naukowców komputerowych, Vinta Cerfa oraz Roberta Kahna. Wspólnie wprowadzili go w życie w roku 1974. Od tamtej pory reguły stanowią kręgosłup Internetu, nawet jeśli po drodze potrzebowały kilku poprawek.
Jedną z przyczyn była harmonia między algorytmem a systemem adresu IP, który przyznaje każdemu urządzeniu — od serwerów aż po telefony komórkowe — unikatowy numer, zdolny do odczytania przez maszynę. Świat zyskiwał coraz więcej takich urządzeń, aż w końcu w roku 2017 nie było żadnego dostępnego adresu IP. Powodem jest wersja czwarta IP, czyli pierwszy wariant dopuszczony do użytku publicznego, który mógł pomieścić jedynie 4.3 miliarda adresów.
Na szczęście Internet dało się usprawnić. Nowy system adresów, IPv6, posiada więcej możliwych do wykorzystania adresów niż powierzchnia Ziemi ma atomów. Innymi słowy, zanim ponownie skończą nam się adresy, jeszcze tryliony przyszłych urządzeń będzie w stanie podłączyć się pod Internet.
NAUKA
Algorytmy Monte Carlo
Naukowcy pracujący nad stworzeniem bomby atomowej podczas drugiej wojny światowej musieli zrozumieć jądrową reakcję łańcuchową — i nie było w tym miejsca na jakikolwiek błąd. Problem tkwił w skomplikowanej naturze fizyki, której nie dało się przeanalizować konwencjonalnymi metodami. Matematyk Stanisław Ulam zaprojektował zestaw algorytmów, który mógłby rozwiązać problem na inny sposób, przy wykorzystaniu dopiero co powstających komputerów.
Pomysł opierał się na sfałszowaniu działań fizycznych, by sprawdzić, jakie przyniosłyby rezultaty. Ulam nazwał swój algorytm na część gry karcianej Monte Carlo — znanej także jako pasjans — ponieważ to właśnie na podstawie tej gry go zaprojektował.
Na dzień dzisiejszy algorytmy Monte Carlo wykorzystuje się m.in. przy prognozach trendów na rynku akcji oraz przy produkcji elektrowni wiatrowych. — Te algorytmy pozwalają nam zrozumieć skomplikowane sytuacje, w których nie pomoże żaden analityczny wzór — wyjaśnia naukowiec komputerowy John Guttag z Instytutu Technologii w Massachusetts.
Algorytmy są szczególnie przydatne przy skomplikowanych zjawiskach. Przykładowo, regularnie wykorzystujemy je do określenia, jakie kształty molekuł tworzą najlepsze proteiny, co może przyczynić się do produkcji leków. Gdyby nie algorytmy Monte Carlo, nie mielibyśmy dostępu do znacznej ilości lekarstw, z których korzystamy na co dzień.
Wciąż wynajdujemy nowe sposoby na użycie algorytmów. Jednym z najtwardszych orzechów do zgryzienia w fizyce jest zrozumienie zachowania materiałów, których elektrony wpływają na siebie nawzajem. Matematyka na nic się nie zdaje, stąd też nie można określić jak jeszcze nieutworzone materiały będą się zachowywać. Roger Melko z Centrum Badawczego w Waterloo w Kanadzie wie, jak można obejść ten problem. Przy użyciu algorytmów Monte Carlo do wykonania pracy za niego, poluje na nowe formy materii.
Czym jest algorytm?
Gdyby to pytanie zadano naukowcowi komputerowemu, to odpowiedź brzmiałaby następująco: algorytm to sekwencja instrukcji, która analizuje pytanie, wykonuje serię powtarzalnych obliczeń i następnie przekazuje odpowiedź. Algorytm to taki bardzo precyzyjny przepis, napisany w duchu logicznego języka programistów.
Najprostszym przykładem jest sortowanie bąbelkowe, aranżujące listę numerów w kolejności rosnącej. Na początek porównywane są dwie pierwsze liczby. Jeśli pierwsza liczba jest większa od drugiej to następuje zamiana miejsc. W innym przypadku algorytm przenosi się do kolejnej pary. Czynność ta powtarza się do momentu, w którym zamiany nie będą potrzebne — wówczas lista zachowuje właściwą kolejność. Jeśli robicie zakupy przez Internet i będziecie przeglądać produkty według ceny, to właśnie sortowanie bąbelkowe zadba o wasz komfort.
Ostatnimi czasy słowo “algorytm” jest używane na przemian z “morfingiem”, by opisać praktycznie wszystkie możliwe dokonania komputera. W ich skład wchodzą sztuczna inteligencja (SI) oraz nauka maszynowa, w której punkty przepisu nie zawsze są jasne.
Przykładem jest sieć neuralna, czyli typ SI kopiujący funkcje ludzkiego mózgu, który da się wyszkolić tak, by podejmował się zadań polegających na sprawdzaniu poprawnych i błędnych wyników. “Algorytmy” tego typu mogą być naprawdę potężne, ciężko jednak przewidzieć ich zachowania oraz rzeczywistą pracę.
Są ludzie, którzy wierzą, że przypisywanie SI pod pojęcie algorytmu nie powinno mieć miejsca. — To tak, jakby słowo “algorytm” dało się przypisać do wszystkiego — twierdzi Martin Dyer z Uniwersytetu Leeds w Wielkiej Brytanii — Irytuje mnie to, jak często nadużywa się tego pojęcia.
Dyer ostrzega nas, że w przyszłości możemy za bardzo polegać na nauce maszynowej, idąc “na skróty” — rozwiązując problemy bez ich dogłębnego zrozumienia.
Dyer wierzy, że powinniśmy korzystać z określonych algorytmów we właściwych kontekstach. Są takie momenty, w których potrzebny jest zestaw przewidzianych kroków oraz takie, gdzie lepiej jest wykorzystać zdolną acz niejednoznaczną technologię SI. — Przeczytanie kiepskiej książki nam nie zaszkodzi, ale wypadek samochodowy już jak najbardziej — porównuje Dyer.
Źródło: New Scientist