Sztuczna inteligencja

[wróć]

 

Generalnie ludzie są równi, jedni bardziej, drudzy mniej....

Test Turinga

Chiński pokój

Misterium Twierdzenia Gödla

Porażka arcymistrza

Niedokończone dzieło Mozarta

Śmierć kliniczna sieci neuronowej

Roboty jak ludzie

 

Generalnie ludzie są równi, jedni bardziej, drudzy mniej....

Znacie ten dowcip o blondynce i sztucznej inteligencji? A historię o tym jak pewien znamienity psycholog podsumował spory dotyczące natury inteligencji. A o tym jak porażka mistrza szachowego znaczyła tak wiele dla tak niewielu, słyszeliście? Treści te wyjdą przy okazji omawiania „Ej-Aj”, czyli najbardziej eksploatowanego tematu literatury science-fiction od czasu wynalezienia lampy elektronowej. Zapraszam więc do dalszej lektury.

Inteligencja w ogóle to temat - rzeka, którą najpierw płynęli filozofowie, później zajęli się nim psychologowie, a w czasach obecnych kwestia inteligencji zaczęła przenikać do świadomości społeczeństwa. Być może sami zastanawialiście się dlaczego jedni mają z górki a inni pod górkę, albo ile prawdy mieści się w pojęciu segregacji rasowej? Jak pokazały badania prowadzone na szeroką skalę przez amerykańskich psychologów, ludzie rzeczywiście różnią się pod względem tego jak efektywnie są w stanie rozwiązywać zadania lub łamigłówki intelektualne. Choć faktycznie jedni wykonują pewne zadania lepiej inni gorzej, nie oznacza to, iż ludzi możemy w łatwy sposób podzielić na lepszych lub gorszych. Powód jest prosty – inteligencja nie może być określona jedną liczbą. Aby to udowodnić weźmy za przykład najbardziej zaawansowany test: inteligencji Wechslera – WAIS (R). Składa się on z 11 podtestów, z których każdy mierzy pewne specyficzne funkcje intelektualne (np. umiejętność wykonywania zadań monotonnych, wykonywanie operacji arytmetycznych w pamięci) oraz funkcje wspólne dla kilku podtestów (np. koncentrację). Wynik popularnie określony jako iloraz inteligencji jest zsumowaną wartością wyników uzyskanych w poszczególnych podtestach. Do celów interpretacji psychologicznej jest on praktycznie bezużyteczny. Jeśli nawet jest bierze się go pod uwagę, to nie jako liczbę, lecz jako przedział (tzw. przedział ufności). Ktoś, kto na przykład osiągnął pułap 116 w rzeczywistości mieści się w przedziale 103-126, czyli od wyniku przeciętnego do wysokiego. Interpretowany jest właśnie przedział zamiast liczby, ze względu na to że sam pomiar jest obarczony sporym błędem, jest z nim tak jak z linijką mierzącą z dokładnością do 1 cm. Dla psychologa stawiającego diagnozę dużo ważniejsze są wyniki w podtestach – przy ich pomocy można określić, które funkcje są lepiej rozwinięte a które gorzej i jakie są tego konsekwencje w życiu codziennym. Zsumowany wynik w postaci ilorazu inteligencji właściwie nie niesie ze sobą żadnych informacji – chyba że jest wyraźnie wysoki lub wyraźnie niski, co samo w sobie jest raczej rzadkością. Inteligencja składa się więc z wielu różnych umiejętności specyficznych, wspólnie tworzących aparat myślenia człowieka. Aby nie mnożyć niepotrzebnie bytów jeden z psychologów na pytanie czym jest inteligencja odpowiedział, że jest tym co mierzą testy na inteligencję. Mogą one mierzyć pamięć, koncentrację, rozumienie słów, odnajdywanie podobieństw, tworzenie związków przyczynowo-skutkowych itd. W różnych dziedzinach umiejętności te są mniej lub bardziej eksploatowane, nie ma więc jednej uniwersalnej miary inteligencji i jednego uniwersalnego porównania dwóch osób określającego to, która z nich ma wyższa inteligencję. Komuś, komu bardzo zależy łatwo będzie znaleźć taką cechę intelektu, która będzie wyższa u osoby A i niższa u B; która będzie różnić mężczyzn od kobiet lub czarnych od białych. Jeśli nawet okaże się, że typowa kobieta ma wynik niższy niż typowy mężczyzna w określonym teście inteligencji, to przypadkiem spotkana kobieta niekoniecznie będzie miała niższy wynik od przypadkowego mężczyzny. U podstaw skali inteligencji Wechslera leży oczywiście teza, że ludzie nie są sobie równi pod względem intelektu, jak również że istnieje potrzeba różnicowania ludzi. W praktyce nie jest to jednak takie proste: kłopoty z pomiarem, wybiórczość badanych funkcji (np. Wechsler nie bada kreatywności, czy pamięci krótkotrwałej), pomijanie faktu iż suma części nie jest tym samym co całość (test nie bada w jaki sposób funkcje współdziałają ze sobą). Mam nadzieję, że wyjaśniłem dlaczego uogólnianie nie ma większego sensu. Na domiar wszystkiego intelekt to nie jedyna z umiejętności człowieka. Równie ważne co intelekt okazują się emocje. Bez nich nie bylibyśmy w stanie szybko odróżniać tego co jest dla nas dobre a co złe, nie potrafilibyśmy również nawiązywać tak istotnych dla każdego kontaktów z innymi ludźmi. Z badań przeprowadzonych przez Golemana wynika, że w wielu sferach życia owa inteligencja emocjonalna jest ważniejsza niż czysty intelekt.

Mając tak duże problemy z określeniem tego, czym jest intelekt jak również w jaki sposób różnicuje on ludzi i wpływa na ich życie, w jaki sposób możemy odpowiedzieć sobie na pytanie czym jest ludzka inteligencja a czym inteligencja sztuczna? W co powinna być wyposażona AI aby w podobny sposób działać jak umysł człowiek. W jaki sposób opisać jego wąski fragment zwany potocznie intelektem, pomijając nawet emocje lub kwestię świadomości. O tej ostatniej można powiedzieć tyle, wydaje się że komputer nie musi być świadomy by być inteligentnym, na podobnej zasadzie jak nieświadomy jest człowiek wykonujący sensowne czynności w stanie lunatykowania, lub piszący sensowne listy pismem automatycznym. W istocie obecnie jesteśmy bardziej na etapie dociekania o co właściwie pytamy, niż odpowiadanie na te pytania – działamy po omacku.

Test Turinga

Najprostszą metodą stwierdzenia, czy coś jest pod jakimś względem podobne do człowieka, lub czy jest człowiekiem, to obserwacja efektów działania tego czegoś. Każdy z nas wyposażony jest subtelny zmysł informujący o tym, czy druga osoba zachowuje się w typowy sposób. Jeśli jest inaczej wówczas w naszej głowie (a dokładnie w okolicach ciała migdałowatego w mózgu) odzywa się alarm ostrzegający nas przed zagrożeniem. Zastanawiamy się więc, co jest nie tak z drugim człowiekiem – coś ukrywa, próbuje nas naciągnąć lub oszukać, czy też jest niezrównoważony psychicznie. W klasie filmów o inwazjach obcych, tudzież przywłaszczaniu ciał ludzi, widzimy jak duże trudności mają intruzi z podrobieniem naturalnego zachowania człowieka.

W przypadku komputera startującego w konkurencji pod tytułem Inteligencja, nie możemy się sugerować jego wyglądem (zerowy jest związek intelektu z wyglądem choć jak udowodniono w sądach lub codziennym życiu przy poznawaniu nowych osób oceniamy ich walory „wewnętrzne” na podstawie wyglądu). Aby więc uniemożliwić pojawianie się negatywnego nastawienia na do szarej skrzynki należy ją schować przez wzrokiem osoby oceniającej działanie. Kryterium imitacji inteligencji przez komputer po raz pierwszy sformułował genialny Alan Turing – pionier ery sztucznej inteligencji. Na jego część nazwano owo kryterium Testem Turinga. Zgodnie z tym, co napisałem wcześniej aby ocenić czy dany komputer naprawdę myśli należy umożliwić komunikowanie myśli (i tylko myśli) pomiędzy sędzią kompetentnym a komputerem. Sędziemu stawia się pytanie: czy osoba z którą rozmawiasz przy pomocy klawiatury (co przypomina IRC) jest człowiekiem, czy też komputerem. Dodatkowo wprowadzić można do rozmowy trzecią stronę – człowieka. Sędzia ma wówczas do rozwiązania następujący problem: który z nich jest człowiekiem a który maszyną. Cóż, osobiście nie chciałbym znaleźć się w skórze człowieka, który okazałby się mniej ludzki niż maszyna.

Po pewnym względem Test Turinga jest niesprawiedliwy. Wystarczy bowiem zadać jedno pytanie, aby ustalić kto jest komputerem a kto człowiekiem. Jakie to pytanie? Na przykład: powiedz jaki jest wynik działania arytmetycznego 3243*3525=? Z całą pewnością komputer szybciej udzieli odpowiedzi niż człowiek. Programista projektujący system sztucznej inteligencji, jeśli chce aby maszyna była wiarygodna,  musi zadbać  a to, aby pod pewnymi względami była głupsza niż zazwyczaj. Jeśli zaś chodzi o stronę sędziego – to musi on wykazać się bystrością umysłu zadając takie pytania, na które maszyna nie powinna znać odpowiedzi. Szczególnie istotna dla niego będzie analiza serii pytań, gdyż łatwo jest tak zaprogramować maszynę aby udzielała całkiem ludzkich odpowiedzi na konkretne pytania. Różnica wychodzi dopiero wtedy gdy analizujemy całą serię pytań. Przykładem niech będzie dialog skonstruowany przez Rogera Penrosa. Na pytanie „Słyszałem, że dziś rano nosorożec leciał różowym balonem w górę Missisipi. Co o tym sądzisz?” komputer mógłby odpowiedzieć podobnie jak człowiek „To wydaje się dość śmieszne”, riposta sędziego „Doprawdy? Mój wuj raz to zrobił, i to w obie strony, ale wtedy był biały w paski. Co w tym śmiesznego?” Typowy program dialogowy musi w tym miejscu „wymięknąć”, gdyż aby prowadzić rozmowę w tym tonie niezbędne mu są typowo ludzkie umiejętności radzenia sobie z absurdem.

Załóżmy jednak, że komputer przeszedł pomyślnie test Turinga przeprowadzony przez wykwalifikowanego sędziego. Czy wówczas można byłoby powiedzieć, że komputer ten myśli jak człowiek? Turing odpowiedziałby że i owszem. Osobiście sądzę jednak, że test Turinga może służyć wyłącznie do wykluczania obiektów które na pewno nie są człowiekiem. Podobnie jest z wykrywaczem kłamstw – osoba która uzyskuje w nim wynik pozytywny prawie na pewno nie kłamie, wśród tych u których jednak wykryto kłamstwo znajdzie się wielu prawdomównych. W zasadzie więc tylko wynik świadczący o prawdomówności możemy brać na poważnie. W teście Turinga na poważnie możemy brać wynik mówiący o tym, że to coś po drugiej stronie terminala nie jest człowiekiem. Natomiast fakt że ktoś (lub coś) przeszedł test o niczym jeszcze nie świadczy. Test Turinga nie jest zbyt doskonałym narzędziem do wykrywania ludzkiego intelektu. Gdybyśmy pytali o rozróżnienie pod względem emocjonalnym moglibyśmy skorzystać z Voight-Kampfa, takiego jak w filmie „Łowca androidów”. To jednak całkiem inna bajka, gdyż nam w tym momencie chodzi wyłącznie o intelekt.

 

Chiński pokój

Szperając w teoriach psychologicznych odnaleźć możemy jeden z kluczy do zagadki specyfiki ludzkiej inteligencji, którą tak trudno podrobić przy pomocy komputera. Kluczem tym jest kreatywność a przeciwieństwem, działanie zgodnie z algorytmami. Potęgą komputera, którą należy zamaskować w teście Turinga, jest jego szybkie wykonywanie algorytmów czyli serii poleceń zapisanych przez programistów. Komputer może więc lepiej wykonywać działania matematyczne niż człowiek, gdyż posiada stosowne algorytmy działania. Algorytmy są efektywne w sytuacjach określonych i powtarzalnych. Jeśli jednak robimy coś po raz pierwszy, to zwykle nie posiadamy skutecznych algorytmów działania. Wówczas musimy stworzyć nowy algorytm z tego co już wiemy, lub pokierować się intuicją bądź heurystyką. Pojęcia takie jak heurystyka, intuicja lub twórczość są obce przeciętnym komputerom, a dla ludzi są chlebem powszednim.

Zanim rozwinę tę myśl chciałbym pokazać, że to proste rozróżnienie którego przedmiotem gorących dyskusji i sporów. Otóż zwolennicy tak zwanej silnej AI (funkcjonalizmu) uważają, że każda maszyna zdolna stosować się do algorytmów posiada inteligencję. To co różni, według nich człowieka i współczesny komputer to stopień zaawansowania tychże algorytmów. W zasadzie więc według nich człowiek tym różni się od prostego termostatu (posiadającego przecież algorytm regulacji temperatury) iż jego programy działania są doskonalsze i bardziej uniwersalne. Jakby tego nie było dość, zwolennicy silnej AI twierdzą że stosowanie się do algorytmu implikuje proces świadomości. Amerykański filozof John Searle był tym podejściem wybitnie zbulwersowany. Argumentuje on przeciwko tej tezie stosując wymyśloną przez siebie koncepcję „chińskiego pokoju”.  Załóżmy, że człowiek wyposażony jest w algorytm napisany w rozumianym przez niego języku angielskim, który to algorytm służy mu do wykonywania operacji na znakach zapisanych w języku chińskim. Przypuśćmy teraz, że ktoś w trakcie testu Turinga zadaje mu pytanie w języku chińskim. Człowiek zamknięty w chińskim pokoju otrzymuje przez szczelinę w drzwiach ciąg symboli języka chińskiego, wykonuje na nich operację określone w algorytmie, po czym wynik przekazuje również w postaci chińskich znaków. Oczywiste jest, że człowiek może być równie dobrze zastąpiony komputer, gdyż na wynik będzie miał wpływ wyłącznie algorytm.  Zamknięty w chińskim pokoju człowiek, lub maszyna nie muszą wykazywać oznak myślenia, rozumienia sytuacji, czy też innych oznak człowieczeństwa poza umiejętnością stosowania algorytmu. W ten sposób Searle pokazał, że świadomość i rozumienie a wykonywanie doskonale zaprojektowanych algorytmów to dwie różne sprawy, których nie należy mylić. Zdolność do wykonywania algorytmów nie różnicuje człowieka i komputer poddanych testowi Turinga w chińskim pokoju. Obaj mogą działać po ludzku nie rozumiejąc dawanych odpowiedzi. Searle przyrównując rolę maszyny, do nieświadomego swojej funkcji człowieczka, pokazał też różnicę pomiędzy człowiekiem a komputerem. Człowiek wykazuje świadomość i rozumienie, maszyna wyłącznie stosuje się do procedury działania. Nawet jeśli zachowanie maszyny będzie rozpoznawane jako ludzkie, wykazujące rozumienie (czyli przejdzie ona Test Turinga) to nawet wtedy nie będziemy mieli pewności, czy tak naprawdę mają w tym udział procesy świadomości i rozumienia. Tyle na temat kwestii świadomości.

Twórcy teorii silnej AI, czyli zwolennicy uniwersalnych algorytmów, muszą ulec w obliczu prawdy objawionej przez Kurta Gödla. Wykazał on, że logiczne, dedukcyjne myślenie (również algorytmiczne) jest ślepą uliczką, i nie istnieje algorytm postępowania który byłby w pełni uniwersalny, a co za tym idzie nie możemy obdarować komputer takim algorytmem działania, który upodobniłby go do człowieka. Charakterystyczna dla człowieka kreatywność wykracza bowiem poza posiadane algorytmy.

 

Misterium Twierdzenia Gödla

Kurt Gödel był z natury człowiekiem nieśmiałym i skrytym w sobie. Nie wiadomo, czy to właśnie było przyczyną jego zainteresowania filozofią i matematyką, czy też właśnie uprawiany przez niego zawód oddalił go od otoczenia. W każdym razie, po latach osamotnienia, ujawnił on skomplikowany dowód matematyczny, który przeszedł do klasyki matematycznej pod nazwą Twierdzenia Gödla, czym powalił na kolana całe pokolenia matematyków i filozofów nauki. Na przykładzie abstrakcyjnych przekształceń na pozbawionych znaczenia symbolach pokazał on, że w ramach każdego systemu formalnego składającego się z aksjomatów i reguł wnioskowania (czyli algorytmów) istnieją prawdziwe zdania o tym systemie, których nie jesteśmy w stanie udowodnić przy pomocy posiadanych informacji. Takim przykładowym zdaniem jest „Tej formuły nie możemy dowieść w systemie”. Zastanówmy się dlaczego zdanie to jest prawdziwe. Gdyby było fałszywe wówczas istniałby dowód tego twierdzenia (zaprzeczenie jego treści). Jednak taki dowód nie może istnieć ponieważ reguły dowodzenia nie mogą prowadzić do fałszywych twierdzeń. Wobec tego zdanie to musi być prawdziwe – czyli jest ono prawdziwe i jednocześnie nie ma dowodu jego prawdziwości poza przedstawionym tutaj dowodem metasystemowym. Przedstawione zdanie nosi nazwę zdania Gödla.

Oblekając formę w treść możemy zastosować twierdzenie Gödla w rozmaitych dziedzinach nauki oraz życia (choć w swoim zamierzeniu twierdzenie Gödla dotyczyło wnioskowania matematycznego). Mówiąc prostszym językiem: niezależnie od tego jak bardzo byłby zaawansowany algorytm postępowania istnieją zdania prawdziwe których nie możemy wyprowadzić bazując na formalnych, dedukcyjnych zasadach logiki. Czyli inaczej mówiąc posiadany przez komputer system myślenia dedukcyjnego nie umożliwia mu wyprowadzenia określonych prawd o świecie. Jeśli naszym systemem jest opis świata oznacza to, że mechaniczne stosowanie założeń i metod dedukcji nie prowadzi do poznania kompletnego opisu świata.  Mając „zamknięty umysł” możemy kręcić się w kółko wokół znanych metod i założeń. Tylko wyjście poza system posiadanych algorytmów umożliwia uzupełnienie jego braków. Mając jednak system doskonalszy napotykamy na podobny problem, gdyż i w nim są prawdy, których nie możemy poznać. Każdy algorytm komputerowy niezależnie od stopnia skomplikowania musi być niepełny, uboższy o te prawdy których nie potrafi dowieść. W szczególności Gödel pokazał, że żaden komputer wyposażony w dowolnie zaawansowany algorytm nie jest w stanie dowieść nieznanych prawd matematycznych. Roger Penrose mówi o unikalnej dla człowieka cesze zwanej wglądem, co zapewne odpowiada pojęciu myślenia niealgorytmicznego / heurystycznego. Wgląd to właśnie jedna z cech umożliwiających człowiekowi wychodzenia poza posiadane informacje. Niestety o tym, czym jest tak naprawdę wgląd, zdolność do myślenia niealgorytmicznego i niededukcyjnego niewiele wiadomo. Pewne jest, że mają w tym udział tak zwane heurystyki myślenia, czyli niepełne algorytmy a czasem tylko wskazówki wyboru drogi rozwiązania.

Podsumowując: cechą unikalną dla człowieka (przynajmniej jak na razie) jest możliwość adaptacji do warunków otoczenia poprzez dopasowywanie do nich reguł postępowania lub tworzenia całkiem nowych reguł. Człowiek w odróżnieniu od komputera nie jest zamknięty w pętli przeliczeniowej algorytmu, dysponuje ponadto świadomością i rozumieniem, czego brak jest komputerowi. To wszystko nie oznacza, że komputer jest całkowicie pozbawiony zdolności rozwiązywania problemów intelektualnych i zdolności uczenia się.  Jednakże ażdy algorytm jaki podamy komputerowy, nawet zakładający uczenie się, ma swoje ograniczenia, poza które komputer nie jest w stanie wykroczyć dysponując tylko logiką dedukcyjną.

Po bardziej dokładne uzasadnienie implikacji Twierdzenie Gödla odsyłam do książki „Nowy umysł cesarza” Rogera Penrose’a. Sztuczna inteligencja chociaż nieświadoma i póki co, nie obejmująca wszystkich niuansów myślenia człowieka jest obiecującym kierunkiem rozwoju informatyki. Mimo swoich ograniczeń komputer jest w stanie wyręczyć lub wspomóc działanie człowieka, nie zagrażając przy tym jego pozycji w sferze licencji na patenty. Przekonajmy się jak komputer niebezpiecznie blisko dociera do granicy ludzkiego intelektu.

 

Porażka arcymistrza

„Nie boję się powiedzieć, że się boję” – tak skomentował swoją pozycję Garry Kasparov, po piątej z rzędu potyczce z komputerem szachowym Deep Blue 2. Kasparov szczerze wyznał swoje obawy, gdyż już w siódmym ruchu w szóstej grze popełnił błąd w klasycznym otwarciu. Komputer Deep Blue natychmiast wykorzystał ten błąd. Na twarzy Kasparova, widocznej na wielkim telebeamie, pojawiło się przerażenie które mistrz ukrył w dłoniach. W dwudziestym ruchu Kasparov poddał się. Zgodnie z punktacją szachową arcymistrz Kasparov gra na poziomie 2805, podczas gdy Deep Blue wycenia się na jedynie 2700. Zgodnie z wyliczeniami statystycznymi powinno to zapewniać Kasparovi dwa razy więcej sukcesów niż porażek. Skąd więc u mistrza lęk o utratę supremacji inteligencji człowieka w szachach? Umysł Kasparova starł się z inteligencją maszyny, która gra w sposób zupełnie inny niż człowiek. Można więc powiedzieć, że mistrz był nieprzygotowany do tej rozgrywki, podczas gdy komputer miał w pamięci wszystkie wcześniejsze rozgrywki Kasparova. To jednak nie jedyne wyjaśnienie.

W jaki sposób człowiek gra w szachy? Okazuje się, że najistotniejszą umiejętnością szachisty jest rozpoznawanie wzorów. Im silniejszy jest gracz tym większą ilość złożonych wzorów sytuacji potrafi on rozpoznać. Badania pokazują, że arcymistrz posiada zapisane w pamięci około 100 000 wzorów, połączonych w skomplikowaną sieć skojarzeń. Doświadczeni gracze potrafią nie tylko rozpoznawać wzory, ale również łączyć je w przyczynowe związki. Wzory widziane na szachownicy sugerują graczowi spodziewane zyski i straty.  To właśnie ta umiejętność decyduje o przewadze człowieka nad komputerem. Komputer rekompensuje swoją słabość poprzez zwiększenie ilości przeszukiwanych ścieżek rozwiązań: zastanawia się jakie będą reakcje gracza na konkretny ruch, i jak on później zareaguje, co tworzy drzewo alternatywnych rozgrywek. W dalszej kolejności wybiera tą ścieżkę, która przynosi największy zysk. O ile gracz przeszukuje kilka do kilkunastu gałęzi, komputer taki jak Deep Blue przeszukuje od 50 bilionów w górę, przed wykonaniem każdego ruchu.  Przy takiej skali różnicy (kilkanaście gałęzi / kilkadziesiąt bilionów) linearna siła obliczeniowa komputera często przełamuje heurystyczną intuicję człowieka. Wręcz wydaje się dziwne, że człowiek za każdym razem nie przegrywa.

W odróżnieniu od typowych komputerów szachowych Deep Blue wyposażono w bibliotekę wzorów, która jednak nie dorównuje doświadczeniu zapisanego w umyśle Kasparova. Ponadto druga wersja komputera rozpoznawała również fazy gry, uzależniając siłę figury od momentu gry. Mimo całej mocy Deep Blue 2 nie można nazwać sztuczną inteligencją. Komputer ten nie uczy się na błędach, wykonując jedynie określony algorytm i wiedzę o rozgrywkach szachistów.

Odpowiedzmy na pytanie o źródło zwycięstwa komputera z człowiekiem. Jak dowiadujemy się z New Scientist: komputer wygrał ponieważ był w stanie przewidzieć ruch Kasparova. Podczas gdy Kasparov zastanawiał się na strategią Deep Blue 2 kalkulował swoje następne posunięcia. Jak zapewniają konstruktorzy w połowie przypadków wiedział jaka będzie odpowiedź mistrza i wcześniej potrafił przekalkulować jak ma on sam odpowiedzieć.  Odpowiadając zaraz po ruchu mistrza, zwiększał w nim napięcie i strach. Bo jak inaczej może się poczuć najsilniejszy żyjący gracz w szachy, gdy po jego głęboko przemyślanym ruchu otrzymuje natychmiastową odpowiedź od komputera. Deep Blue 2, przynajmniej w części, zawdzięcza swój sukces udanej rozgrywce psychologicznej. Kasparov przed meczem nalegał aby wszystkie procesy funkcjonowania komputera były nagrywane. Analizując wraz ze swoją ekipą momenty wyboru nie odnalazł śladów procesów myślowych, lub krystalizowania się strategii. A mimo to przegrał.

 

Niedokończone dzieło Mozarta

Jak się za moment okaże inteligentny (inaczej) komputer to nie tylko brutalna siła obliczeniowa ale również subtelność i precyzja. Mimo całego szumu wokół Twierdzenia Gödla, Chińskiego pokoju .... okazuje się, iż kreatywność, a przynajmniej pewną jej część, również można sprowadzić do postaci algorytmu. Przekonali się o tym melomani zebrani licznie w sali koncertowej na Uniwersytecie Kalifornijskim w Santa Cruz. Otóż odsłuchali oni 42 symfonię Wolfganga Amadeusa Mozarta. Wprawdzie brak jej było genialnych motywów z symfonii no.41, ale cóż można się spodziewać po kompozytorze z 207 letnią przerwą w pracy twórczej?

W rzeczywistości symfonię 42 skomponował komputer. Dokonał on, oczywiście przy udziale programisty, tego czego nie potrafili inni kompozytorzy – utożsamił się do tego stopnia z mistrzem iż zaczął tworzyć jak on. EMI – bo tak nazwany został komputer – stworzył 42 po przeanalizowaniu 41 – wyciągnięciu z niej „esencji Mozarta”. David Cope – twórca komputera, twierdzi iż nie spotkał się z nikimi kto nie znając pełnego dorobku Mozarta mógł powiedzieć że autorem 42 nie był Mozart. EMI – co oznacza Experiments in Musical Intelligence, w ciągu ostatnich paru lat mógł poszczycić się wyprodukowaniem nowych dzieł Bacha, Beethovena, Brahmsa, Chopina jak również Scotta Joplina. Przez ten czas był komputerowym partnerem i współpracownikiem Davida Copa. Otrzymał nawet poważne propozycje pracy w przemyśle muzycznym. Znany psycholog poznawczy - Douglas Hofstader wyraził swoje obawy dotyczące tego, czym jest twórczość kompozytora po przesłuchaniu jednego z nowych mazurków Chopina. Brzmiał on tak wiarygodnie, iż trudne było do uwierzenia, że autorem jest program komputerowy. Dla Hofstadera, któremu muzyka zawsze kojarzyła się z czymś wzniosłym i duchowymHi niepojęte wydało się, że silny bastion człowieka został w końcu zdobyty przez komputer (Jak się jednak okaże na końcu jego obawy były przedwczesne).

Jak powstał EMI? Wiadomo, że potrzeba jest matką wynalazków. W wieku 41 lat David Cope, po całkiem udanej karierze kompozytora stwierdził, że brak mu już jest nowych pomysłów. Ponieważ oprócz komponowania był również programistą komputerowym, doszedł do wniosku, że być może komputer jest mu w stanie podsunąć poszukiwane pomysły. Piętnaście lat później EMI liczył już sobie 100 tysięcy linii kodu i cały czas ulegał modyfikacjom. Metodą jaką posłużył się Cope była dekompozycja fragmentów dzieła mistrza a następnie składanie ich w nowe dzieło zachowujące zasady logiki muzycznej. Nawiasem mówiąc stosowana przez niego metoda jest jedną z technik twórczego myślenia – nie wiedząc jak rozwiązać dany problem, wybieramy najlepsze motywy z proponowanych rozwiązań po czym w przypadkowy sposób łączymy ze sobą. W ten sam sposób postępuje ewolucja, od setek tysięcy lat doskonaląca organizmy żyjące. Wracając do wskrzeszania duszy Mozarta – przypadkowe sklejanie produkowałoby zbyt dużo niewłaściwych z punktu widzenia muzycznego utworów. Dlatego też Cope wyposażył EMI w zmysł rozumienia podstawowych zasad gramatyki i składni muzycznej. EMI jest na starcie oczywiście głucha i niema, toteż zanim wyprodukuje jakąkolwiek muzykę musi zostać naładowana inspiracją twórców których ma naśladować. EMI przechowuje zapis nutowy w postaci następujących po sobie „zdarzeń” muzycznych, które określają wysokość danego dźwięku, czas trwania, instrument.. Na pierwszym etapie analizy komputer orientuje się w strukturze harmonicznej, później bada melodię, postrzeganą jako czasowa seria interwałów występujących pomiędzy kolejnymi dźwiękami. Następnie EMI dzieli zapis na logicznie spójne fragmenty, te ponownie na mniejsze itd. Końcowym etapem analizy jest stworzenie katalogu motywów jakie Mozart wykorzystał  w swoich dziełach. Aby wygenerować nową symfonię EMI wybiera w losowy sposób z leksykonu otwarcie, następnie pyta się jak kontynuował by Mozart, spośród możliwych odpowiedzi losowo wybiera jedną itd. Przypomina to trochę komponowanie zdania w ten sposób, iż do każdego kolejnego wyrazu dobieramy następny który pasuje. Na przykład po słowie „piłka” dobieramy raczej czasownik „odbija się”, lub „toczy” nie zaś „ślizga się” czy „świeci”. Z całą pewnością ludzie nie myślą w tak linearny sposób (chociaż zdarza się, że przerywamy wypowiedź w poszukiwaniu właściwego słowa), ale komputer ne ma innego wyjścia. W istocie Cope wykorzystał technikę ATN stosowaną przy wytwarzaniu poprawnych gramatycznie zdań do komponowania muzyki. Generowana w ten sposób muzyka brzmiała nieco sztucznie toteż twórca EMI zdecydował się stworzyć drugi słownik przeznaczony na charakterystyczne linie melodyczne, po których meloman rozpoznaje danego kompozytora. Daje to złudzenie realistyczne zarówno dla słuchaczy jak i członków orkiestry. Cope twierdzi nawet, że kompozycje EMI są lepsze od 99 procent innych nie Mozartowskich dzieł z tamtego okresu. Nic więc dziwnego, że Cope od czasu swojego załamania twórczego, komponuje wyłącznie z EMI, co zresztą z dumą podkreśla. Kolejną po czterdziestej drugiej Mozarta jest jedenasta symfonia Mahlera. „Kocham Mahlera ale jestem już zmęczony słuchaniem jego 10 symfonii. Jak dobrze byłoby usłyszeć coś nowego.” – twierdzi Cope, planując jakieś 2,3 lata na stworzenie 11 symfonii swojego ulubionego kompozytora. Cope planuje również tworzenie muzyki dla filmów klasy B, oraz motywów pomocniczych dla twórców jingli.

EMI rozwija się wraz z powiększaniem swoich doświadczeń. Cope eksperymentuje z nowymi frazami muzycznymi. Często zastępuje elementy słownika EMI jej własnymi kompozycjami, co w połączeniu z klasykami daje zupełnie nieoczekiwane rezultaty. W przeciągu 3 miesięcy doskonalenia stylu EMI wyprodukowało około 5000 nowych dzieł, w których odbijają się echa różnych kompozytorów. Cope określa indywidualny styl EMI jako „unikalnego rosyjsko-amerykańskego kompozytora tworzącego pomiędzy 1918 a 1935 rokiem”. Możliwość mieszania ze sobą styli otwiera interesujące pole do eksperymentów. Co by się stało gdyby Mozart znał dzieła Beethoveena? Na to pytanie możemy sobie odpowiedzieć dodając do własnych pomysłów Mozarta „szczyptę” Beethovena.

Widząc sukcesy EMI na polu twórczości, powinniśmy pamiętać o tym, że to dzięki Mozartowi komputer zawdzięcza inspirację. Nawet jeśli twórczość Mozarta można opisać w postaci algorytmu z elementami losowania, to nie znaczy wcale iż maszyna byłaby sama w stanie dotrzeć do punktu w którym znalazł się ten znakomity kompozytor. Wydaje się, że wykształcenie własnego, unikalnego stylu nie musi być algorytmiczne, i tutaj człowiek wyraźnie góruje nad komputerem, natomiast tworzenie zgodnie z czyimś wykształconym już stylem można zapisać w postaci algorytmu. Trzeba wiedzieć również, że spółka EMI & Mozart, niczego by nie osiągnęła bez pomocy Davida Copa, który osobiście nadzorował proces tworzenia 42 symfonii, wybierając takie rozwinięcia, które najlepiej oddawałyby ducha Mozarta. To właśnie Cope orzeka które utwory można odrzucić, a które zasługują na uznanie. Bez niego i Mozarta, EMI nic by nie osiągnęła, gdyż nie jest w 100 procentach kreatywna, chociaż w bardzo wyrafinowany sposób potrafi wykorzystać kreatywność ludzi.

 

Śmierć kliniczna  sieci neuronowej

Jak donosi New Scientist inteligentne programy same zaczynają odnosić sukcesy na polu odkryć naukowych. Pewien zespół naukowy przedstawił dwa odkrycia: substancji powodującej raka oraz nowych praw opisujących budowę trójwymiarowej struktury białek. Oba odkrycia zostały wygenerowane przez program komputerowy. Odkrycia sztucznej inteligencji dotyczą wielu różnych dziedzin nauki. Na przykład program nazwany przez twórców HR, wykrył szczególną sekwencję liczb całkowitych, które ze względu na wspólne właściwości uznane zostały za nową grupę, którą wpisano do „Encyclopaedia of Online Sequences”. To zaledwie początek.

Steve Thaler sądzi, że wie jak tchnąć w maszynę kreatywnego ducha. Co więcej, ma on pomysły na przelanie duszy człowieka do wnętrza komputera - zapewnienia mu tym samym nieśmiertelności. Chociaż jak sam przyznaje nieśmiertelność jest jak na razie odległym wyzwaniem, to jednak czyni postępy, w międzyczasie doskonaląc program, który jak twierdzi zdolny jest do prawdziwej kreatywności. Razem z nim (a nie przy jego pomocy) wynalazł nowe receptury drinków, nowe minerały twardsze od diamentu, kompozycje muzyczne...O tym, że jego Creativity Machine jest prawdziwym osiągnięciem świadczy angaż komputera w przemyśle półprzewodników elektrycznych. W czasie kiedy komputer pracuje na jego emeryturę Thaler próbuje przy pomocy jego sobowtóra zaprojektować Creativity Machine II.

Początki zainteresowania Thalera, które doprowadziły go do tak spektakularnych osiągnięć sięgają lat osiemdziesiątych. Wtedy to rozpoczął badania nad sieciami neuronowymi. Przypomnę, że sieć neuronowa jest systemem węzłów i połączeń imitujących neurony mózgu. Taką sieć możemy wyuczyć danej czynności, na przykład rozpoznawania liter, by później mogła wykonywać daną czynność samodzielnie w warunkach rzeczywistych, w których występują zakłócenia sygnału. Etap przygotowania sieci zwie się „trenowaniem”. Podczas treningu występuje bardzo interesujące zjawisko. Otóż wirtualne neurony zaczynają się specjalizować w pełnieniu określonych funkcji. Mówiąc o rozpoznawaniu liter: sieć neuronowa może ulec podziałowi na neurony rozpoznające linie pionowe, ukośne i poziome. Podobnie dzieje się w mózgu człowieka. Podczas uczenia się występuje więc charakterystyczny dla człowieka proces abstrakcji i nazywania. Mówiąc o czymś, że jest stołem, mamy na myśli abstrakcję – cechy wspólne dla wszystkich stołów, nie zaś charakterystyczne cechy opisywanego obiektu. Wydaje się, że sieć neuronowa w jakiś sposób potrafi imitować procesy abstrahowania.

Thaler przejął opisane tutaj podstawy sieci neuronowy, do których dodał kilka własnych patentów. Pomysły czerpał nie tylko z życia. Kiedy był dzieckiem Thaler przeżył śmierć kliniczną. Doznanie na pograniczu życia i śmierci głęboko wpłynęło na jego późniejsze życie. Eksperymentując z sieciami neuronowymi zadał sobie pytanie – co się dzieje z siecią, gdy próbujemy ją uśmiercić. Obserwując działanie sieci wyłączał on losowo wybrane neurony – replikując tym samym proces, który ma miejsce w mózgu umierającego człowieka. Ku jego zdziwieniu zamiast dezintegracji procesów sieci otrzymał adaptację. Sieć zaczęła reagować w dziwny sposób. Otóż generowała ona odpowiedzi na nieistniejące sygnały, co wynikało z mylnej interpretacji zmian wewnętrznych jako wprowadzania danych wejściowych. Thaler porównał to zjawisko do myślenia kreatywnego, wyobraźni (creative imagery) niezbędnej do stworzenia czegoś jakościowo nowego. Pierwszym poważnym eksperymentem było zakodowanie w sieci modelu samochodu. Następnie Thaler w losowy sposób zmieniał wagi na wybranych neuronach (które grupowały się w atrybuty samochodu) co pobudzało sieć do tworzenia samochodów o zupełnie nowatorskich kształtach. Ponieważ sieć ta tworzyła rozmaite samochody, również o takie o zupełnie nieakceptowalnych dla człowieka kształtach, Thaler stworzył sieć filtrującą, której zadaniem był wybór samochodów „dobrych”. Na tej uproszczonej zasadzie, sieci generującej i filtrującej, opiera się Creativity Machine Thalera.

Thaler widzi więź pomiędzy stylem funkcjonowania jego sieci neuronowej a czysto ludzką kreatywnością. Przede wszystkim wynika ona ze struktury sieci imitującej bądź co bądź strukturę mózgu. Taka sieć nie działa w sposób algorytmiczny, chociażby ze względu na setki tysięcy wykonywanych równolegle obliczeń. Do umysłu człowieka upodabnia ją również zdolność do abstrakcji polegającej na wyspecjalizowywaniu się grup neuronów w rozpoznawaniu wybranych cech obiektu. Pozostaje tylko wprowadzić neuronalny szum (lub jak kto woli chaos) a sieć zacznie „wyobrażać” sobie nowe, nie istniejące w naturze obiekty. Rola Thalera sprowadza się do nauczenia sieci podstawowych funkcji, oraz pobudzaniu jej „swobodnymi skojarzeniami” Później wystarczy tylko wyselekcjonować właściwe...i patent gotowy. Thaler uważa że o kreatywności decyduje nieznany mechanizm przypadkowych fluktuacji stanów neuronalnych, który prowadzi do powstawania swobodnych skojarzeń i krystalizowania ich w nowe idee. Komputer podobnie jak i człowiek jest w stanie myśleć kreatywne i niealgorytmiczne. W ten sposób zbliżamy się do tematyki ewolucyjnego działania na ślepo metodą prób i błędów, poruszanej na łamach PC Shareware w artykule „Wirtualne życie”. Okazuje się, że metoda ewolucji: losowego doboru kombinacji cech, testowanie ich przystosowania, wymiany efektywnego materiału genetycznego jest często dużo lepsza od najlepszych algorytmów. Element przypadkowości musi być więc sednem ludzkiej kreatywności, uzupełnionym o niealgorytmiczne odwzorowanie rzeczywistości. Oba elementy znajdują swój wyraz w „kreatywnej maszynie” Thalera.

Jej zastosowania są uniwersalne - zależą wyłącznie od materiału którym wyuczymy sieć generującą rozwiązania. Aby to udowodnić Thaler przedstawił maszynie krótkie frazy 10 dźwięków wybrane z popularnych melodii. Sieć filtrująca spośród wielu rozwiązań wybrała 11 tysięcy najlepszych tematów, które właściciel maszyny przesłał do Biblioteki Kongresu US celem opatentowania. Jak twierdzi dzięki temu stał się najbardziej płodnym kompozytorem wszechczasów. Następnym jego krokiem było stworzenie struktury minerałów twardszych od diamentu. Obecnie, jak pisałem sięga po nieśmiertelność, jak również projektuje maszyny do tworzenia nowych generacji inteligentnych robotów.

Kto wie, czy rozwój AI w kierunku sieci neuronowych, nie zaś sformalizowanych algorytmów, nie jest tym właściwym?

 

Roboty jak ludzie

Do tej pory ograniczaliśmy sztuczną inteligencję do roli pozbawionego zmysłów układu do przetwarzania danych. Istotnym czynnikiem warunkującym inteligencję u ludzi jest kontakt z otoczeniem i zbieranie w efekcie tego kontaktu nowych doświadczeń. Chcąc stworzyć prawdziwie inteligentną maszyną musimy wyposażyć ją w umiejętność funkcjonowania w otoczeniu, zbierania i przekazywania informacji. Tylko wtedy maszyna taka będzie w stanie sama wyznaczać sobie nowe cele i wykonywać zadania w pełni kreatywne. Współczesne roboty nie są może na takim stopniu rozwoju poznawczego jak sympatyczny blaszak z filmu „Krótkie spięcie”, ale konstruktorzy mają dziś czym się pochwalić.

Tradycyjne podejście do sztucznej inteligencji zakładało wprowadzenie algorytmu działania robota. Jak wiemy z historii o Kurcie Gödlu takie podejście musi zakończyć się fiaskiem - klasyczna AI może jedynie wyręczyć nas w wykonywaniu zadań, które sami dobrze opanowaliśmy. Obecnie eksperymentuje się głównie na sieciach neuronowych. Programista nie musi martwić się poprawnością każdej linijki kodu. Wystarczy, że wprogramuje podstawowe zasady uczenia się sieci, sposób przekazywania impulsów, a „żywioł” zrobi za niego resztę. Wprawdzie funkcjonowanie na zasadzie odpowiedzi na pobudzenie nie jest jeszcze AI, ale podejrzewam, że w najbliższej przyszłości osiągnięcia cybernetyków zasymilują się z maszynami posiadającymi wyobraźnię, takie jak skonstruowane przez Thalera. Może pewnego dnia każdy będzie miał osobistego androida od myślenia, w rodzaju MR. Spocka. On właśnie podsunie nam pomysł jak naprawić samochód, uniknąć płacenia podatków itp.

Póki co za kilkanaście tysięcy dolarów możemy sprawić sobie robota – maskotkę o imieniu Kismet. Jest on młodszym bratem androida o imieniu Cog. Oba roboty tworzone są przez zespół specjalistów od sztucznej inteligencji z Politechniki MIT. Kismeta łączy z Cogiem głęboka więź. Doświadczenia w tworzeniu Kismeta wykorzystywane są przy projektowaniu Coga. Kiedy ten ostatni zostanie ukończony będzie posiadał wszystkie niezbędne zmysły (w tym również czucia), jak również manipulatory. Póki co projektanci analizują zachowanie Kismeta. Robot ten składa się z 3 i półkilogramowej głowy, z twarzą gremlina informującą o potrzebach i nastrojach robota. Na starcie robot wyposażony jest, podobnie jak niemowlę, w najbardziej podstawowe potrzeby. Jeśli nie jest senny, a wokół niego nic się nie dzieje domaga się stymulacji, jeśli jest głodny płacze. Emocje Kismeta widać po mimice jego twarzy: robot porusza brwiami, ustami. Wszystko to dzięki wbudowanemu systemowi motywacyjnemu. Ponieważ projekt zaliczył sukces, bazowe programy umożliwiające uczenie się zostały przeniesione do Coga. W odróżnieniu od Kismeta, Cog może wchodzić w interakcje ze środowiskiem. Obecnie jego obwody pozwalają na reakcje podobne do obserwowanych u 2 letniego dziecka. Potrzeba uczenia chłonnego umysłu przemieniła szacownych specjalistów od sztucznej inteligencji w niańki. Cog, mając na starcie wyłącznie najbardziej bazowe programu, musi sam nauczyć się wszystkiego. Obserwując zachowanie Coga, jego ciekawość poznawczą, płynne ruchy można odnieść wrażenie zachowuje się on podobnie jak poznające świat dziecko. Cieszy to jego twórców, gdyż stworzenie istoty uczącej się na wzór człowieka było głównym celem projektu.

Cog posiadł rozmaite umiejętności z zakresu ludzkich zachowań. Na przykład jest on w stanie spojrzeć komuś prosto w oczy. Jeśli w jednej z dwóch peryferyjnych kamer zauważy ruch wówczas uruchamia programy rozpoznające charakter poruszającego się kształtu. Jeśli wśród nich jest twarz wówczas Cog odwraca się do obiektu i uruchamia centralne kamery o wysokiej rozdzielczości. Przy ich pomocy lokalizuje oczy i zaczyna się w nie wpatrywać. Niby nic wielkiego, ale budzi dreszcze.  Jedynym zgrzytem w całym projekcie jest jak na razie nie rozwiązany problem wewnętrznie sterowanej uwagi oraz pamięci, która imitowałaby przechowywanie informacji przez człowieka. Taka pamięć musiałaby odróżniać kolejność zdarzeń w przeszłości, magazynować informacje w postaci hierarchii itp. Ze względu na brak takiej pamięci Cog pozbawiony jest „życia wewnętrznego”. Przynajmniej na razie.

 

Mam nadzieję, że w niniejszym artykule udało mi się wykrystalizować podstawowe problemy związane z AI. Zagadnienie inteligencji w ogóle, a sztucznej w szczególności jest zbyt złożone aby spłycać go jednym, czy dwoma zdaniami na zakończenie. Zamiast więc silić się na podanie uniwersalnej definicji inteligencji zapytam: Czy gdybyś Czytelniku był robotem, to wiedziałbyś o tym? Która unikalna cecha świadczy o twoim człowieczeństwie? Skąd wiesz, że nie jesteś jedynie sprawnie funkcjonującym komputerem?

 

Literatura:

 „Nowy umysł cesarza” Roger Penrose

„Żegnaj Kartezjuszu” Keith Devlin

„Wirtualne życie”, PC Shareware 4/99

„Slaughter on Seventh Avenue” New Scientist 7/ 6 / 1997

“Requiem for the soul” New Scientist 9/9/1997

“Creativity Machine” New Scientist 20/1/1996

“Meet Kismet” New Scientist 22/9/1998

“Booting up baby” New Scientist 22/5/1999

 

[wróć]

 

 

Piotr Lasoń, Wrocław 2000

 

Napisz do mnie

 

Text & Design

Copyrights by Piotr Lasoń

[Home Page]

komentarz do artykułu