Dane pochodzące z sieci mogą ujawnić intymne szczegóły milionów osób

Nowe badania wykazują, że nawet intymne, osobiste atrybuty jednostki mogą być przewidywane z trafnością na wysokim poziomie jedynie w oparciu o “ślady” pozostawiane w pozornie nieszkodliwych, cyfrowych zachowaniach. W tym wypadku naukowcy wzięli pod lupę kliknięcia “Lubię to” na Facebooku.

Badanie to budzi wątpliwości co do spersonalizowanego marketingu oraz naszej prywatności online.

Opracowanie i treść badań opublikował periodyk Proceedings of the National Academy of Sciences. Okazuje się, że z zaskakującą precyzją można określić rasę, wiek, poziom IQ, orientację seksualną, osobowość, zażywane substancje, poglądy polityczne użytkowników Facebooka. Dokonać tego można dzięki wnioskom z automatycznej analizy wyłącznie kliknięć “Lubię to”. Jest to przecież informacja i opcja powszechnie dostępna, nawet na naszej stronie.

W tym badaniu naukowcy opisują “Lubię to” Facebooka jako klasę generyczną cyfrowych danych – podobną do zapytań w wyszukiwarkach internetowych oraz historii odwiedzanych stron. Sugerują jednocześnie, że takie techniki mogą być wykorzystane do uzyskania poufnych informacji na temat osoby, która regularnie spędza czas w sieci.

Badacze z Psychometrics Centre w Cambridge wraz z Microsoft Research Cambridge przeanalizowali dane pochodzące z ponad 58000 użytkowników Facebooka znajdujących się na terenie Stanów Zjednoczonych. Zgodzili się oni na udostępnienie jakie strony, tematy kliknęli jako “Lubię to”, ich demograficznych profile oraz poddanie się testom psychometrycznym z wykorzystaniem aplikacji myPersonality. Użytkownicy wyrazili zgodę również na przekazanie informacji o ich profilach, w celu przeprowadzenia wspomnianej analizy.

Wybory “Lubię to” zostały wprowadzone do algorytmu i potwierdzone z informacjami pobranymi z profili użytkowników oraz testów osobowościowych. Naukowcom udało się stworzyć model statystyczny, który jest w stanie przewidzieć dane osobowe z wykorzystaniem jedynie kliknięć “Lubię to”.

Modele okazały się dokładne w 88% podczas określania płci męskiej, w 95% odróżniały Afroamerykanów od białych Amerykanów oraz w 85% rozróżniły, którzy z użytkowników sympatyzowali z Republikanami, a którzy z Demokratami. Określenia dotyczące wyznawanej wiary pomiędzy Chrześcijanami i Muzułmanami zostały poprawnie sklasyfikowane w 82% przypadków. Również dobrą dokładność osiągnięto odnośnie stanu cywilnego oraz nadużywania różnych substancji – od 65 do 73%.

Kilku użytkowników otwarcie w mniejszym stopniu wykazało swoje atrybuty w kliknięciach “Lubię to”. Przykładowo, mniej niż 5% użytkowników będących gejami kliknęło “Lubię to” w wydaje się oczywiste propozycje jak małżeństwa homoseksualistów. Jakość i trafność przewidywań są oparte o “wnioskowanie”. Stworzenie konkretnych profili osobowościowych możliwe jest dzięki skupieniu ogromnej ilości mniej czysto informacyjnych, a bardziej popularnych wyborów jak dotyczących muzyki, programów telewizyjnych, etc.

Nawet wydające się niezbyt oczywiste możliwości poznania danych osobowych, jak fakt czy rodzice użytkownika byli w separacji zanim osiągnął on wiek 21 lat były określone celnie aż w 60% przypadków. Jest to na tyle dobry rezultat, że jest on wartościowy marketingowo dla reklamodawców, twierdzą naukowcy.

Chociaż jednocześnie podkreślają potencjał spersonalizowanego marketingu w celu poprawienia usług online z wykorzystaniem modelów predykcyjnych, to jednocześnie ostrzegają przed zagrożeniami związanymi z prywatnością użytkowników.

Twierdzą oni, że wielu użytkowników sieci może czuć, że taki poziom cyfrowego otwarcia przekracza akceptowane przez nich limity. Korporacje, rząd, a nawet indywidualne jednostki mogą wykorzystywać predykcyjne oprogramowanie w celu wydobycia bardzo poufnych informacji z kliknięć “Lubię to” czy innych cyfrowych “śladów”.

Naukowcy przeprowadzili również testy w celu określenia cech osobowości jak inteligencja, stabilność emocjonalna, otwartość czy ekstrawersja.

Chociaż takie jakby bardziej utajnione cechy są znacznie trudniejsze do oceny, to trafność analiz była uderzająca. Badanie dotyczące cech otwartości – spektrum tych osobowości, które nie lubią zmian i tych, które je witają z radością – wykazało, że jedynie obserwacja wyborów “Lubię to” daje mniej więcej te same informacje co wynik przeprowadzonego testu osobowości.

Niektóre z kliknięć przejawiały istotne, aczkolwiek wydające się absurdalnym lub losowym powiązaniem z indywidualnymi preferencjami, jak wybór frytek w kształcie sprężynek (curly fries) u ludzi z wyższym IQ czy wybór stron typu “Ten pająk jest bardziej przerażający niż ty” u ludzi, którzy nie używają nikotyny.

Biorąc temat całościowo, naukowcy wierzą, że różne oceny atrybutów osobowościowych oraz indywidualnych predyspozycji uzyskanych z jedynie z analizy kliknięć “Lubię to” na Facebooku, mogą stworzyć zadziwiająco precyzyjne portrety osobowości potencjalnie milionów użytkowników na całym świecie. Naukowcy dodają również, że rezultaty mogą spowodować rewolucję w psychologicznych ocenach, które w oparciu o to badanie – mogą być prowadzone na niespotykaną dotąd skalę, bez kosztownych ośrodków oceny oraz kwestionariuszy.

“Wierzymy, że nasze wyniki, obecnie oparte na kliknięciach ‘Lubię to’, mogą mieć zastosowanie do szerszego zakresu zachowań internautów”, mówi Michał Kosiński z Psychometric Centre, który prowadził badania wraz ze swoim kolegą z Cambridge – Davidem Stillwellem oraz Thore Graepel z Microsoft Research.

“Podobne oceny mogą być przeprowadzone z wykorzystaniem wszelkiego rodzaju danych cyfrowych z niezwykłą dokładnością – statystycznie przewidując poufne informacje, których ludzie nie chcą wyjawić. Biorąc pod uwagę różnorodność cyfrowych śladów, które ludzie zostawiają za sobą, kontrolowanie tego staje się dla wielu osób coraz trudniejsze”.

“Jestem wielkim zwolennikiem oraz aktywnym użytkownikiem nowych, niesamowitych technologii, włączając w to Facebooka. Doceniam zautomatyzowane rekomendacje książek czy kiedy Facebook wybiera najbardziej odpowiednie tematy dla mojego kanału informacyjnego”, kontynuuje Kosiński. “Jednakże mogę sobie wyobrazić sytuacje, w których te same dane oraz technologia jest wykorzystywana do oceny politycznych poglądów, orientacji seksualnych, stwarzających zagrożenie do wolności czy nawet życia”.

“Jedynie możliwość, że coś takiego może się zdarzyć może odrzucić ludzi od wykorzystywania cyfrowych technologii oraz zmniejszyć zaufanie pomiędzy osobami oraz instytucjami – utrudniając technologiczny i ekonomiczny rozwój. Użytkownikom należy dostarczyć transparentność oraz kontrolę nad informacjami na ich temat”.

Thore Graepel z Microsoft Research powiedziała, że ma nadzieję, iż te badania zostaną włączone do ciągnącej się debaty na temat prywatności użytkowników. “Użytkownicy słusznie oczekują silnych zabezpieczeń ich prywatności wbudowanych w produkty i usługi z których korzystają. Te badania mogą służyć również jako przypomnienie dla konsumentów, aby w ostrożny sposób dzielić się informacjami online, wykorzystując opcje kontroli prywatności i nigdy nie dzielić się ich zawartością z nieznanymi stronami”.

David Stillwell z Cambridge University dodał na koniec – “Używam Facebooka od 2005 roku i dalej będę. Jednak mogę być bardziej ostrożny w wykorzystywaniu ustawień prywatności jakie oferuje Facebook”.

Źródło: University of Cambridge

 

 

Wesprzyj nasze działania w zakresie przeciwdziałania zanieczyszczeniu hałasem. Podaruj 1,5% podatku.

Wypełnij PIT przez internet i przekaż 1,5% podatku
blank

Alan Grinde

Społecznik od ponad 30 lat. Założyciel fundacji ORION Organizacja Społeczna oraz Fundacji Techya. Edukator z zakresu hałasu, praw człowieka, przemocy i zdrowia publicznego. Specjalista w zakresie nowych technologii, sztucznej inteligencji oraz projektowania graficznego. Inicjator kampanii "Niewidzialna ręka przemocy" oraz "Wiele hałasu o hałas".
blank
ORION Organizacja Społeczna
Instytut Ekologii Akustycznej
ul. Hoża 86 lok. 410
00-682 Warszawa
Email: instytut@yahoo.com
KRS: 0000499971
NIP: 7123285593
REGON: 061657570
Konto. Nest Bank:
92 2530 0008 2041 1071 3655 0001
Wszystkie treści publikowane w serwisie są udostępniane na licencji Creative Commons: uznanie autorstwa - użycie niekomercyjne - bez utworów zależnych 4.0 Polska (CC BY-NC-ND 4.0 PL), o ile nie jest to stwierdzone inaczej.