Sztuczna inteligencja możne dokładnie przetłumaczyć myśli na zdania, przynajmniej w zakresie słownika ograniczonego do 250 słów. Nowy system może przybliżyć nas do odzyskania możliwości mowy u osób, które straciły te możliwość na przykład ze względu na paraliż.
Joseph Makin z University of California (San Franciscko) wraz ze swoim zespołem użył algorytmów głębokiego uczenia, aby badać sygnały mózgu u czterech kobiet podczas mówienia.
Uczenie głębokie, czyli deep learning, to jedna z najszybciej rozwijających się gałęzi sztucznej inteligencji. Polega na tworzeniu sieci neuronowych, czyli takich systemów informatycznych, których budowa i funkcjonowanie przypomina pracę ludzkiego mózgu.
Kobiety biorące udział w eksperymencie cierpiały na epilepsję oraz posiadały już elektrody w swoich mózgach, aby monitorować ataki.
Każda z kobiet została poproszona, aby czytać na głos zestawy zdań, podczas kiedy naukowcy badali aktywności mózgu. Największa grupa zdań zawierała 250 niepowtarzalnych slow.
Zespól przesłał te aktywności mózgu do pierwszej sieci neuronalnej, trenując algorytm tak, aby był w stanie zidentyfikować regularnie powtarzające się wzorce, które mogły być powiązane z częściami mowy takimi jak samogłoski czy spółgłoski. Następnie wzorce te zostały przesłane do drugiej sieci sztucznej inteligencji, która próbowała zmienić te wzorce na słowa i budować z nich zdania.
Każda z kobiet powtarzała sentencje przynajmniej dwukrotnie, a ostatnie z powtórzeń nie stanowiło cześć danych do uczenia sztucznej inteligencji, pozwalając naukowcom testować system.
Za każdym razem, kiedy dana osoba mówiła to samo zdanie, powiązana z nim aktywność mózgu była podobna, ale nie identyczna. “Zapamiętywanie aktywności mózgu związanej z tymi zdaniami nie pomoże, a wiec sieć zamiast tego musi się dowiedzieć, co w nich jest podobnego, tak aby mogła uogólnić przekaz”, mówi Makin. W oparciu o współpracę z tymi czterema kobietami, poziom błędu w tłumaczeniach, jaki występował u AI w jej najlepszej wydajności, wynosił zaledwie 3%.
Mankin twierdzi, że użycie niewielkiej liczby zdań ułatwiło sztucznej inteligencji poznanie, które słowa mają tendencję do podążania za innymi.
Na przykład sztuczna inteligencja była w stanie, na podstawie samej aktywności mózgu, rozszyfrować, że słowo “Turner” zawsze mogło podążać – w tym zestawie zdań – za słowem “Tina”.
Zespół próbował dekodować dane sygnału mózgowego na pojedyncze słowa, zamiast całych zdań, ale to zwiększyło poziom błędu do 38%, nawet w najlepszej wydajności AI. “Sieć wyraźnie uczy się tego, które słowa pasują do siebie, a nie tylko tego, która aktywność neuronalna odwzorowuje dane słowa”, mówi Makin.
Utrudni to skalowanie systemu do większej ilości słów, ponieważ każde nowe słowo zwiększa liczbę możliwych zdań, zmniejszając jednocześnie dokładność pracy sztucznej inteligencji.
Makin twierdzi, że zakres 250 słów może być nadal przydatny dla osób, które nie mogą w ogóle mówić. “Chcemy to zastosować u pacjenta z faktycznym upośledzeniem mowy”, chociaż możliwe, że aktywność ich mózgów może być odmienna od tej, jaką prezentowały kobiety w tym badaniu. To znacznie może utrudnić skuteczne działanie.
Sophie Scott z University College London mówi, że jesteśmy daleko od zdolności, aby w kompleksowy sposób tłumaczyć dane sygnały mózgowe. “Prawdopodobnie znamy około 350 tysięcy słów, więc wciąż jest to niezwykle ograniczony zestaw w użyciu”. Nie mniej lepsze to niż nic, prawda?
Źródło: Nature Neuroscience