Sztuczna
inteligencja
[wróć]
Generalnie
ludzie są równi, jedni bardziej, drudzy mniej....
Test Turinga
Chiński pokój
Misterium Twierdzenia Gödla
Porażka arcymistrza
Niedokończone dzieło Mozarta
Śmierć kliniczna sieci
neuronowej
Roboty jak ludzie
Znacie
ten dowcip o blondynce i sztucznej inteligencji? A historię o tym jak pewien
znamienity psycholog podsumował spory dotyczące natury inteligencji. A o tym
jak porażka mistrza szachowego znaczyła tak wiele dla tak niewielu, słyszeliście?
Treści te wyjdą przy okazji omawiania „Ej-Aj”, czyli najbardziej
eksploatowanego tematu literatury science-fiction od czasu wynalezienia lampy
elektronowej. Zapraszam więc do dalszej lektury.
Inteligencja
w ogóle to temat - rzeka, którą najpierw płynęli filozofowie, później zajęli
się nim psychologowie, a w czasach obecnych kwestia inteligencji zaczęła
przenikać do świadomości społeczeństwa. Być może sami zastanawialiście
się dlaczego jedni mają z górki a inni pod górkę, albo ile prawdy mieści
się w pojęciu segregacji rasowej? Jak pokazały badania prowadzone na szeroką
skalę przez amerykańskich psychologów, ludzie rzeczywiście różnią się
pod względem tego jak efektywnie są w stanie rozwiązywać zadania lub łamigłówki
intelektualne. Choć faktycznie jedni wykonują pewne zadania lepiej inni
gorzej, nie oznacza to, iż ludzi możemy w łatwy sposób podzielić na
lepszych lub gorszych. Powód jest prosty – inteligencja nie może być
określona jedną liczbą. Aby to udowodnić weźmy za przykład najbardziej
zaawansowany test: inteligencji Wechslera – WAIS (R). Składa się on z 11
podtestów, z których każdy mierzy pewne specyficzne funkcje intelektualne
(np. umiejętność wykonywania zadań monotonnych, wykonywanie operacji
arytmetycznych w pamięci) oraz funkcje wspólne dla kilku podtestów (np.
koncentrację). Wynik popularnie określony jako iloraz inteligencji jest
zsumowaną wartością wyników uzyskanych w poszczególnych podtestach. Do celów
interpretacji psychologicznej jest on praktycznie bezużyteczny. Jeśli nawet
jest bierze się go pod uwagę, to nie jako liczbę, lecz jako przedział (tzw.
przedział ufności). Ktoś, kto na przykład osiągnął pułap 116 w
rzeczywistości mieści się w przedziale 103-126, czyli od wyniku przeciętnego
do wysokiego. Interpretowany jest właśnie przedział zamiast liczby, ze względu
na to że sam pomiar jest obarczony sporym błędem, jest z nim tak jak z linijką
mierzącą z dokładnością do 1 cm. Dla psychologa stawiającego diagnozę dużo
ważniejsze są wyniki w podtestach – przy ich pomocy można określić,
które funkcje są lepiej rozwinięte a które gorzej i jakie są tego
konsekwencje w życiu codziennym. Zsumowany wynik w postaci ilorazu inteligencji
właściwie nie niesie ze sobą żadnych informacji – chyba że jest wyraźnie
wysoki lub wyraźnie niski, co samo w sobie jest raczej rzadkością.
Inteligencja składa się więc z wielu różnych umiejętności specyficznych,
wspólnie tworzących aparat myślenia człowieka. Aby nie mnożyć
niepotrzebnie bytów jeden z psychologów na pytanie czym jest inteligencja
odpowiedział, że jest tym co mierzą testy na inteligencję. Mogą one mierzyć
pamięć, koncentrację, rozumienie słów, odnajdywanie podobieństw, tworzenie
związków przyczynowo-skutkowych itd. W różnych dziedzinach umiejętności te
są mniej lub bardziej eksploatowane, nie ma więc jednej uniwersalnej miary
inteligencji i jednego uniwersalnego porównania dwóch osób określającego
to, która z nich ma wyższa inteligencję. Komuś, komu bardzo zależy łatwo będzie
znaleźć taką cechę intelektu, która będzie wyższa u osoby A i niższa u
B; która będzie różnić mężczyzn od kobiet lub czarnych od białych. Jeśli
nawet okaże się, że typowa kobieta ma wynik niższy niż typowy mężczyzna w
określonym teście inteligencji, to przypadkiem spotkana kobieta niekoniecznie
będzie miała niższy wynik od przypadkowego mężczyzny. U podstaw skali
inteligencji Wechslera leży oczywiście teza, że ludzie nie są sobie równi
pod względem intelektu, jak również że istnieje potrzeba różnicowania
ludzi. W praktyce nie jest to jednak takie proste: kłopoty z pomiarem, wybiórczość
badanych funkcji (np. Wechsler nie bada kreatywności, czy pamięci krótkotrwałej),
pomijanie faktu iż suma części nie jest tym samym co całość (test nie bada
w jaki sposób funkcje współdziałają ze sobą). Mam nadzieję, że wyjaśniłem
dlaczego uogólnianie nie ma większego sensu. Na domiar wszystkiego intelekt to
nie jedyna z umiejętności człowieka. Równie ważne co intelekt okazują się
emocje. Bez nich nie bylibyśmy w stanie szybko odróżniać tego co jest dla
nas dobre a co złe, nie potrafilibyśmy również nawiązywać tak istotnych
dla każdego kontaktów z innymi ludźmi. Z badań przeprowadzonych przez
Golemana wynika, że w wielu sferach życia owa inteligencja emocjonalna jest ważniejsza
niż czysty intelekt.
Mając
tak duże problemy z określeniem tego, czym jest intelekt jak również w jaki
sposób różnicuje on ludzi i wpływa na ich życie, w jaki sposób możemy
odpowiedzieć sobie na pytanie czym jest ludzka inteligencja a czym inteligencja
sztuczna? W co powinna być wyposażona AI aby w podobny sposób działać jak
umysł człowiek. W jaki sposób opisać jego wąski fragment zwany potocznie
intelektem, pomijając nawet emocje lub kwestię świadomości. O tej ostatniej
można powiedzieć tyle, wydaje się że komputer nie musi być świadomy by być
inteligentnym, na podobnej zasadzie jak nieświadomy jest człowiek wykonujący
sensowne czynności w stanie lunatykowania, lub piszący sensowne listy pismem
automatycznym. W istocie obecnie jesteśmy bardziej na etapie dociekania o co właściwie
pytamy, niż odpowiadanie na te pytania – działamy po omacku.
Najprostszą
metodą stwierdzenia, czy coś jest pod jakimś względem podobne do człowieka,
lub czy jest człowiekiem, to obserwacja efektów działania tego czegoś. Każdy
z nas wyposażony jest subtelny zmysł informujący o tym, czy druga osoba
zachowuje się w typowy sposób. Jeśli jest inaczej wówczas w naszej głowie
(a dokładnie w okolicach ciała migdałowatego w mózgu) odzywa się alarm
ostrzegający nas przed zagrożeniem. Zastanawiamy się więc, co jest nie tak z
drugim człowiekiem – coś ukrywa, próbuje nas naciągnąć lub oszukać,
czy też jest niezrównoważony psychicznie. W klasie filmów o inwazjach
obcych, tudzież przywłaszczaniu ciał ludzi, widzimy jak duże trudności mają
intruzi z podrobieniem naturalnego zachowania człowieka.
W
przypadku komputera startującego w konkurencji pod tytułem Inteligencja, nie
możemy się sugerować jego wyglądem (zerowy jest związek intelektu z wyglądem
choć jak udowodniono w sądach lub codziennym życiu przy poznawaniu nowych osób
oceniamy ich walory „wewnętrzne” na podstawie wyglądu). Aby więc
uniemożliwić pojawianie się negatywnego nastawienia na do szarej skrzynki
należy ją schować przez wzrokiem osoby oceniającej działanie. Kryterium
imitacji inteligencji przez komputer po raz pierwszy sformułował genialny Alan
Turing – pionier ery sztucznej inteligencji. Na jego część nazwano owo
kryterium Testem Turinga. Zgodnie z tym, co napisałem wcześniej aby ocenić
czy dany komputer naprawdę myśli należy umożliwić komunikowanie myśli (i
tylko myśli) pomiędzy sędzią kompetentnym a komputerem. Sędziemu stawia się
pytanie: czy osoba z którą rozmawiasz przy pomocy klawiatury (co przypomina
IRC) jest człowiekiem, czy też komputerem. Dodatkowo wprowadzić można do
rozmowy trzecią stronę – człowieka. Sędzia ma wówczas do rozwiązania
następujący problem: który z nich jest człowiekiem a który maszyną. Cóż,
osobiście nie chciałbym znaleźć się w skórze człowieka, który okazałby
się mniej ludzki niż maszyna.
Po
pewnym względem Test Turinga jest niesprawiedliwy. Wystarczy bowiem zadać
jedno pytanie, aby ustalić kto jest komputerem a kto człowiekiem. Jakie to
pytanie? Na przykład: powiedz jaki jest wynik działania arytmetycznego
3243*3525=? Z całą pewnością komputer szybciej udzieli odpowiedzi niż człowiek.
Programista projektujący system sztucznej inteligencji, jeśli chce aby maszyna
była wiarygodna, musi zadbać
a to, aby pod pewnymi względami była głupsza niż zazwyczaj. Jeśli zaś
chodzi o stronę sędziego – to musi on wykazać się bystrością umysłu
zadając takie pytania, na które maszyna nie powinna znać odpowiedzi. Szczególnie
istotna dla niego będzie analiza serii pytań, gdyż łatwo jest tak
zaprogramować maszynę aby udzielała całkiem ludzkich odpowiedzi na konkretne
pytania. Różnica wychodzi dopiero wtedy gdy analizujemy całą serię pytań.
Przykładem niech będzie dialog skonstruowany przez Rogera Penrosa. Na pytanie
„Słyszałem, że dziś rano nosorożec leciał różowym balonem w górę
Missisipi. Co o tym sądzisz?” komputer mógłby odpowiedzieć podobnie
jak człowiek „To wydaje się dość śmieszne”, riposta sędziego
„Doprawdy? Mój wuj raz to zrobił, i to w obie strony, ale wtedy był biały
w paski. Co w tym śmiesznego?” Typowy program dialogowy musi w tym
miejscu „wymięknąć”, gdyż aby prowadzić rozmowę w tym tonie
niezbędne mu są typowo ludzkie umiejętności radzenia sobie z absurdem.
Załóżmy
jednak, że komputer przeszedł pomyślnie test Turinga przeprowadzony przez
wykwalifikowanego sędziego. Czy wówczas można byłoby powiedzieć, że
komputer ten myśli jak człowiek? Turing odpowiedziałby że i owszem. Osobiście
sądzę jednak, że test Turinga może służyć wyłącznie do wykluczania
obiektów które na pewno nie są człowiekiem. Podobnie jest z wykrywaczem kłamstw
– osoba która uzyskuje w nim wynik pozytywny prawie na pewno nie kłamie,
wśród tych u których jednak wykryto kłamstwo znajdzie się wielu prawdomównych.
W zasadzie więc tylko wynik świadczący o prawdomówności możemy brać na
poważnie. W teście Turinga na poważnie możemy brać wynik mówiący o tym,
że to coś po drugiej stronie terminala nie jest człowiekiem. Natomiast fakt
że ktoś (lub coś) przeszedł test o niczym jeszcze nie świadczy. Test
Turinga nie jest zbyt doskonałym narzędziem do wykrywania ludzkiego intelektu.
Gdybyśmy pytali o rozróżnienie pod względem emocjonalnym moglibyśmy
skorzystać z Voight-Kampfa, takiego jak w filmie „Łowca androidów”.
To jednak całkiem inna bajka, gdyż nam w tym momencie chodzi wyłącznie o
intelekt.
Szperając
w teoriach psychologicznych odnaleźć możemy jeden z kluczy do zagadki
specyfiki ludzkiej inteligencji, którą tak trudno podrobić przy pomocy
komputera. Kluczem tym jest kreatywność a przeciwieństwem, działanie zgodnie
z algorytmami. Potęgą komputera, którą należy zamaskować w teście
Turinga, jest jego szybkie wykonywanie algorytmów czyli serii poleceń
zapisanych przez programistów. Komputer może więc lepiej wykonywać działania
matematyczne niż człowiek, gdyż posiada stosowne algorytmy działania.
Algorytmy są efektywne w sytuacjach określonych i powtarzalnych. Jeśli jednak
robimy coś po raz pierwszy, to zwykle nie posiadamy skutecznych algorytmów
działania. Wówczas musimy stworzyć nowy algorytm z tego co już wiemy, lub
pokierować się intuicją bądź heurystyką. Pojęcia takie jak heurystyka,
intuicja lub twórczość są obce przeciętnym komputerom, a dla ludzi są
chlebem powszednim.
Zanim
rozwinę tę myśl chciałbym pokazać, że to proste rozróżnienie którego
przedmiotem gorących dyskusji i sporów. Otóż zwolennicy tak zwanej silnej AI
(funkcjonalizmu) uważają, że każda maszyna zdolna stosować się do algorytmów
posiada inteligencję. To co różni, według nich człowieka i współczesny
komputer to stopień zaawansowania tychże algorytmów. W zasadzie więc według
nich człowiek tym różni się od prostego termostatu (posiadającego przecież
algorytm regulacji temperatury) iż jego programy działania są doskonalsze i
bardziej uniwersalne. Jakby tego nie było dość, zwolennicy silnej AI twierdzą
że stosowanie się do algorytmu implikuje proces świadomości. Amerykański
filozof John Searle był tym podejściem wybitnie zbulwersowany. Argumentuje on
przeciwko tej tezie stosując wymyśloną przez siebie koncepcję „chińskiego
pokoju”. Załóżmy, że człowiek wyposażony jest w algorytm
napisany w rozumianym przez niego języku angielskim, który to algorytm służy
mu do wykonywania operacji na znakach zapisanych w języku chińskim. Przypuśćmy
teraz, że ktoś w trakcie testu Turinga zadaje mu pytanie w języku chińskim.
Człowiek zamknięty w chińskim pokoju otrzymuje przez szczelinę w drzwiach ciąg
symboli języka chińskiego, wykonuje na nich operację określone w algorytmie,
po czym wynik przekazuje również w postaci chińskich znaków. Oczywiste jest,
że człowiek może być równie dobrze zastąpiony komputer, gdyż na wynik będzie
miał wpływ wyłącznie algorytm. Zamknięty
w chińskim pokoju człowiek, lub maszyna nie muszą wykazywać oznak myślenia,
rozumienia sytuacji, czy też innych oznak człowieczeństwa poza umiejętnością
stosowania algorytmu. W ten sposób Searle pokazał, że świadomość i
rozumienie a wykonywanie doskonale zaprojektowanych algorytmów to dwie różne
sprawy, których nie należy mylić. Zdolność do wykonywania algorytmów nie różnicuje
człowieka i komputer poddanych testowi Turinga w chińskim pokoju. Obaj mogą
działać po ludzku nie rozumiejąc dawanych odpowiedzi. Searle przyrównując
rolę maszyny, do nieświadomego swojej funkcji człowieczka, pokazał też różnicę
pomiędzy człowiekiem a komputerem. Człowiek wykazuje świadomość i
rozumienie, maszyna wyłącznie stosuje się do procedury działania. Nawet jeśli
zachowanie maszyny będzie rozpoznawane jako ludzkie, wykazujące rozumienie
(czyli przejdzie ona Test Turinga) to nawet wtedy nie będziemy mieli pewności,
czy tak naprawdę mają w tym udział procesy świadomości i rozumienia. Tyle
na temat kwestii świadomości.
Twórcy
teorii silnej AI, czyli zwolennicy uniwersalnych algorytmów, muszą ulec w
obliczu prawdy objawionej przez Kurta Gödla. Wykazał on, że logiczne,
dedukcyjne myślenie (również algorytmiczne) jest ślepą uliczką, i nie
istnieje algorytm postępowania który byłby w pełni uniwersalny, a co za tym
idzie nie możemy obdarować komputer takim algorytmem działania, który
upodobniłby go do człowieka. Charakterystyczna dla człowieka kreatywność
wykracza bowiem poza posiadane algorytmy.
Kurt
Gödel był z natury człowiekiem nieśmiałym i skrytym w sobie. Nie wiadomo,
czy to właśnie było przyczyną jego zainteresowania filozofią i matematyką,
czy też właśnie uprawiany przez niego zawód oddalił go od otoczenia. W każdym
razie, po latach osamotnienia, ujawnił on skomplikowany dowód matematyczny, który
przeszedł do klasyki matematycznej pod nazwą Twierdzenia Gödla, czym powalił
na kolana całe pokolenia matematyków i filozofów nauki. Na przykładzie
abstrakcyjnych przekształceń na pozbawionych znaczenia symbolach pokazał on,
że w ramach każdego systemu formalnego składającego się z aksjomatów i
reguł wnioskowania (czyli algorytmów) istnieją prawdziwe zdania o tym
systemie, których nie jesteśmy w stanie udowodnić przy pomocy posiadanych
informacji. Takim przykładowym zdaniem jest „Tej formuły nie możemy
dowieść w systemie”. Zastanówmy się dlaczego zdanie to jest prawdziwe.
Gdyby było fałszywe wówczas istniałby dowód tego twierdzenia (zaprzeczenie
jego treści). Jednak taki dowód nie może istnieć ponieważ reguły
dowodzenia nie mogą prowadzić do fałszywych twierdzeń. Wobec tego zdanie to
musi być prawdziwe – czyli jest ono prawdziwe i jednocześnie nie ma
dowodu jego prawdziwości poza przedstawionym tutaj dowodem metasystemowym.
Przedstawione zdanie nosi nazwę zdania Gödla.
Oblekając
formę w treść możemy zastosować twierdzenie Gödla w rozmaitych dziedzinach
nauki oraz życia (choć w swoim zamierzeniu twierdzenie Gödla dotyczyło
wnioskowania matematycznego). Mówiąc prostszym językiem: niezależnie od tego
jak bardzo byłby zaawansowany algorytm postępowania istnieją zdania prawdziwe
których nie możemy wyprowadzić bazując na formalnych, dedukcyjnych zasadach
logiki. Czyli inaczej mówiąc posiadany przez komputer system myślenia
dedukcyjnego nie umożliwia mu wyprowadzenia określonych prawd o świecie. Jeśli
naszym systemem jest opis świata oznacza to, że mechaniczne stosowanie założeń
i metod dedukcji nie prowadzi do poznania kompletnego opisu świata.
Mając „zamknięty umysł” możemy kręcić się w kółko
wokół znanych metod i założeń. Tylko wyjście poza system posiadanych
algorytmów umożliwia uzupełnienie jego braków. Mając jednak system
doskonalszy napotykamy na podobny problem, gdyż i w nim są prawdy, których
nie możemy poznać. Każdy algorytm komputerowy niezależnie od stopnia
skomplikowania musi być niepełny, uboższy o te prawdy których nie potrafi
dowieść. W szczególności Gödel pokazał, że żaden komputer wyposażony w
dowolnie zaawansowany algorytm nie jest w stanie dowieść nieznanych prawd
matematycznych. Roger Penrose mówi o unikalnej dla człowieka cesze zwanej wglądem,
co zapewne odpowiada pojęciu myślenia niealgorytmicznego / heurystycznego. Wgląd
to właśnie jedna z cech umożliwiających człowiekowi wychodzenia poza
posiadane informacje. Niestety o tym, czym jest tak naprawdę wgląd, zdolność
do myślenia niealgorytmicznego i niededukcyjnego niewiele wiadomo. Pewne jest,
że mają w tym udział tak zwane heurystyki myślenia, czyli niepełne
algorytmy a czasem tylko wskazówki wyboru drogi rozwiązania.
Podsumowując:
cechą unikalną dla człowieka (przynajmniej jak na razie) jest możliwość
adaptacji do warunków otoczenia poprzez dopasowywanie do nich reguł postępowania
lub tworzenia całkiem nowych reguł. Człowiek w odróżnieniu od komputera nie
jest zamknięty w pętli przeliczeniowej algorytmu, dysponuje ponadto świadomością
i rozumieniem, czego brak jest komputerowi. To wszystko nie oznacza, że
komputer jest całkowicie pozbawiony zdolności rozwiązywania problemów
intelektualnych i zdolności uczenia się.
Jednakże ażdy algorytm jaki podamy komputerowy, nawet zakładający
uczenie się, ma swoje ograniczenia, poza które komputer nie jest w stanie
wykroczyć dysponując tylko logiką dedukcyjną.
Po
bardziej dokładne uzasadnienie implikacji Twierdzenie Gödla odsyłam do książki
„Nowy umysł cesarza” Rogera Penrose’a. Sztuczna inteligencja
chociaż nieświadoma i póki co, nie obejmująca wszystkich niuansów myślenia
człowieka jest obiecującym kierunkiem rozwoju informatyki. Mimo swoich
ograniczeń komputer jest w stanie wyręczyć lub wspomóc działanie człowieka,
nie zagrażając przy tym jego pozycji w sferze licencji na patenty. Przekonajmy
się jak komputer niebezpiecznie blisko dociera do granicy ludzkiego intelektu.
„Nie
boję się powiedzieć, że się boję” – tak skomentował swoją
pozycję Garry Kasparov, po piątej z rzędu potyczce z komputerem szachowym
Deep Blue 2. Kasparov szczerze wyznał swoje obawy, gdyż już w siódmym ruchu
w szóstej grze popełnił błąd w klasycznym otwarciu. Komputer Deep Blue
natychmiast wykorzystał ten błąd. Na twarzy Kasparova, widocznej na wielkim
telebeamie, pojawiło się przerażenie które mistrz ukrył w dłoniach. W
dwudziestym ruchu Kasparov poddał się. Zgodnie z punktacją szachową
arcymistrz Kasparov gra na poziomie 2805, podczas gdy Deep Blue wycenia się na
jedynie 2700. Zgodnie z wyliczeniami statystycznymi powinno to zapewniać
Kasparovi dwa razy więcej sukcesów niż porażek. Skąd więc u mistrza lęk o
utratę supremacji inteligencji człowieka w szachach? Umysł Kasparova starł
się z inteligencją maszyny, która gra w sposób zupełnie inny niż człowiek.
Można więc powiedzieć, że mistrz był nieprzygotowany do tej rozgrywki,
podczas gdy komputer miał w pamięci wszystkie wcześniejsze rozgrywki
Kasparova. To jednak nie jedyne wyjaśnienie.
W
jaki sposób człowiek gra w szachy? Okazuje się, że najistotniejszą umiejętnością
szachisty jest rozpoznawanie wzorów. Im silniejszy jest gracz tym większą ilość
złożonych wzorów sytuacji potrafi on rozpoznać. Badania pokazują, że
arcymistrz posiada zapisane w pamięci około 100 000 wzorów, połączonych w
skomplikowaną sieć skojarzeń. Doświadczeni gracze potrafią nie tylko
rozpoznawać wzory, ale również łączyć je w przyczynowe związki. Wzory
widziane na szachownicy sugerują graczowi spodziewane zyski i straty.
To właśnie ta umiejętność decyduje o przewadze człowieka nad
komputerem. Komputer rekompensuje swoją słabość poprzez zwiększenie ilości
przeszukiwanych ścieżek rozwiązań: zastanawia się jakie będą reakcje
gracza na konkretny ruch, i jak on później zareaguje, co tworzy drzewo
alternatywnych rozgrywek. W dalszej kolejności wybiera tą ścieżkę, która
przynosi największy zysk. O ile gracz przeszukuje kilka do kilkunastu gałęzi,
komputer taki jak Deep Blue przeszukuje od 50 bilionów w górę, przed
wykonaniem każdego ruchu. Przy
takiej skali różnicy (kilkanaście gałęzi / kilkadziesiąt bilionów)
linearna siła obliczeniowa komputera często przełamuje heurystyczną intuicję
człowieka. Wręcz wydaje się dziwne, że człowiek za każdym razem nie
przegrywa.
W
odróżnieniu od typowych komputerów szachowych Deep Blue wyposażono w
bibliotekę wzorów, która jednak nie dorównuje doświadczeniu zapisanego w
umyśle Kasparova. Ponadto druga wersja komputera rozpoznawała również fazy
gry, uzależniając siłę figury od momentu gry. Mimo całej mocy Deep Blue 2
nie można nazwać sztuczną inteligencją. Komputer ten nie uczy się na błędach,
wykonując jedynie określony algorytm i wiedzę o rozgrywkach szachistów.
Odpowiedzmy
na pytanie o źródło zwycięstwa komputera z człowiekiem. Jak dowiadujemy się
z New Scientist: komputer wygrał ponieważ był w stanie przewidzieć ruch
Kasparova. Podczas gdy Kasparov zastanawiał się na strategią Deep Blue 2
kalkulował swoje następne posunięcia. Jak zapewniają konstruktorzy w połowie
przypadków wiedział jaka będzie odpowiedź mistrza i wcześniej potrafił
przekalkulować jak ma on sam odpowiedzieć.
Odpowiadając zaraz po ruchu mistrza, zwiększał w nim napięcie i
strach. Bo jak inaczej może się poczuć najsilniejszy żyjący gracz w szachy,
gdy po jego głęboko przemyślanym ruchu otrzymuje natychmiastową odpowiedź
od komputera. Deep Blue 2, przynajmniej w części, zawdzięcza swój sukces
udanej rozgrywce psychologicznej. Kasparov przed meczem nalegał aby wszystkie
procesy funkcjonowania komputera były nagrywane. Analizując wraz ze swoją
ekipą momenty wyboru nie odnalazł śladów procesów myślowych, lub
krystalizowania się strategii. A mimo to przegrał.
Jak
się za moment okaże inteligentny (inaczej) komputer to nie tylko brutalna siła
obliczeniowa ale również subtelność i precyzja. Mimo całego szumu wokół
Twierdzenia Gödla, Chińskiego pokoju .... okazuje się, iż kreatywność, a
przynajmniej pewną jej część, również można sprowadzić do postaci
algorytmu. Przekonali się o tym melomani zebrani licznie w sali koncertowej na
Uniwersytecie Kalifornijskim w Santa Cruz. Otóż odsłuchali oni 42 symfonię
Wolfganga Amadeusa Mozarta. Wprawdzie brak jej było genialnych motywów z
symfonii no.41, ale cóż można się spodziewać po kompozytorze z 207 letnią
przerwą w pracy twórczej?
W
rzeczywistości symfonię 42 skomponował komputer. Dokonał on, oczywiście
przy udziale programisty, tego czego nie potrafili inni kompozytorzy – utożsamił
się do tego stopnia z mistrzem iż zaczął tworzyć jak on. EMI – bo tak
nazwany został komputer – stworzył 42 po przeanalizowaniu 41 –
wyciągnięciu z niej „esencji Mozarta”. David Cope – twórca
komputera, twierdzi iż nie spotkał się z nikimi kto nie znając pełnego
dorobku Mozarta mógł powiedzieć że autorem 42 nie był Mozart. EMI –
co oznacza Experiments in Musical Intelligence, w ciągu ostatnich paru lat mógł
poszczycić się wyprodukowaniem nowych dzieł Bacha, Beethovena, Brahmsa,
Chopina jak również Scotta Joplina. Przez ten czas był komputerowym partnerem
i współpracownikiem Davida Copa. Otrzymał nawet poważne propozycje pracy w
przemyśle muzycznym. Znany psycholog poznawczy - Douglas Hofstader wyraził
swoje obawy dotyczące tego, czym jest twórczość kompozytora po przesłuchaniu
jednego z nowych mazurków Chopina. Brzmiał on tak wiarygodnie, iż trudne było
do uwierzenia, że autorem jest program komputerowy. Dla Hofstadera, któremu
muzyka zawsze kojarzyła się z czymś wzniosłym i duchowymHi niepojęte wydało się, że silny bastion człowieka
został w końcu zdobyty przez komputer (Jak się jednak okaże na końcu jego
obawy były przedwczesne).
Jak
powstał EMI? Wiadomo, że potrzeba jest matką wynalazków. W wieku 41 lat
David Cope, po całkiem udanej karierze kompozytora stwierdził, że brak mu już
jest nowych pomysłów. Ponieważ oprócz komponowania był również programistą
komputerowym, doszedł do wniosku, że być może komputer jest mu w stanie
podsunąć poszukiwane pomysły. Piętnaście lat później EMI liczył już
sobie 100 tysięcy linii kodu i cały czas ulegał modyfikacjom. Metodą jaką
posłużył się Cope była dekompozycja fragmentów dzieła mistrza a następnie
składanie ich w nowe dzieło zachowujące zasady logiki muzycznej. Nawiasem mówiąc
stosowana przez niego metoda jest jedną z technik twórczego myślenia –
nie wiedząc jak rozwiązać dany problem, wybieramy najlepsze motywy z
proponowanych rozwiązań po czym w przypadkowy sposób łączymy ze sobą. W
ten sam sposób postępuje ewolucja, od setek tysięcy lat doskonaląca
organizmy żyjące. Wracając do wskrzeszania duszy Mozarta – przypadkowe
sklejanie produkowałoby zbyt dużo niewłaściwych z punktu widzenia muzycznego
utworów. Dlatego też Cope wyposażył EMI w zmysł rozumienia podstawowych
zasad gramatyki i składni muzycznej. EMI jest na starcie oczywiście głucha i
niema, toteż zanim wyprodukuje jakąkolwiek muzykę musi zostać naładowana
inspiracją twórców których ma naśladować. EMI przechowuje zapis nutowy w
postaci następujących po sobie „zdarzeń” muzycznych, które określają
wysokość danego dźwięku, czas trwania, instrument.. Na pierwszym etapie
analizy komputer orientuje się w strukturze harmonicznej, później bada melodię,
postrzeganą jako czasowa seria interwałów występujących pomiędzy kolejnymi
dźwiękami. Następnie EMI dzieli zapis na logicznie spójne fragmenty, te
ponownie na mniejsze itd. Końcowym etapem analizy jest stworzenie katalogu
motywów jakie Mozart wykorzystał w
swoich dziełach. Aby wygenerować nową symfonię EMI wybiera w losowy sposób
z leksykonu otwarcie, następnie pyta się jak kontynuował by Mozart, spośród
możliwych odpowiedzi losowo wybiera jedną itd. Przypomina to trochę
komponowanie zdania w ten sposób, iż do każdego kolejnego wyrazu dobieramy
następny który pasuje. Na przykład po słowie „piłka” dobieramy
raczej czasownik „odbija się”, lub „toczy” nie zaś
„ślizga się” czy „świeci”. Z całą pewnością
ludzie nie myślą w tak linearny sposób (chociaż zdarza się, że przerywamy
wypowiedź w poszukiwaniu właściwego słowa), ale komputer ne ma innego wyjścia.
W istocie Cope wykorzystał technikę ATN stosowaną przy wytwarzaniu poprawnych
gramatycznie zdań do komponowania muzyki. Generowana w ten sposób muzyka
brzmiała nieco sztucznie toteż twórca EMI zdecydował się stworzyć drugi słownik
przeznaczony na charakterystyczne linie melodyczne, po których meloman
rozpoznaje danego kompozytora. Daje to złudzenie realistyczne zarówno dla słuchaczy
jak i członków orkiestry. Cope twierdzi nawet, że kompozycje EMI są lepsze
od 99 procent innych nie Mozartowskich dzieł z tamtego okresu. Nic więc
dziwnego, że Cope od czasu swojego załamania twórczego, komponuje wyłącznie
z EMI, co zresztą z dumą podkreśla. Kolejną po czterdziestej drugiej Mozarta
jest jedenasta symfonia Mahlera. „Kocham Mahlera ale jestem już zmęczony
słuchaniem jego 10 symfonii. Jak dobrze byłoby usłyszeć coś nowego.”
– twierdzi Cope, planując jakieś 2,3 lata na stworzenie 11 symfonii
swojego ulubionego kompozytora. Cope planuje również tworzenie muzyki dla filmów
klasy B, oraz motywów pomocniczych dla twórców jingli.
EMI
rozwija się wraz z powiększaniem swoich doświadczeń. Cope eksperymentuje z
nowymi frazami muzycznymi. Często zastępuje elementy słownika EMI jej własnymi
kompozycjami, co w połączeniu z klasykami daje zupełnie nieoczekiwane
rezultaty. W przeciągu 3 miesięcy doskonalenia stylu EMI wyprodukowało około
5000 nowych dzieł, w których odbijają się echa różnych kompozytorów. Cope
określa indywidualny styl EMI jako „unikalnego rosyjsko-amerykańskego
kompozytora tworzącego pomiędzy 1918 a 1935 rokiem”. Możliwość
mieszania ze sobą styli otwiera interesujące pole do eksperymentów. Co by się
stało gdyby Mozart znał dzieła Beethoveena? Na to pytanie możemy sobie
odpowiedzieć dodając do własnych pomysłów Mozarta „szczyptę”
Beethovena.
Widząc
sukcesy EMI na polu twórczości, powinniśmy pamiętać o tym, że to dzięki
Mozartowi komputer zawdzięcza inspirację. Nawet jeśli twórczość Mozarta można
opisać w postaci algorytmu z elementami losowania, to nie znaczy wcale iż
maszyna byłaby sama w stanie dotrzeć do punktu w którym znalazł się ten
znakomity kompozytor. Wydaje się, że wykształcenie własnego, unikalnego
stylu nie musi być algorytmiczne, i tutaj człowiek wyraźnie góruje nad
komputerem, natomiast tworzenie zgodnie z czyimś wykształconym już stylem można
zapisać w postaci algorytmu. Trzeba wiedzieć również, że spółka EMI &
Mozart, niczego by nie osiągnęła bez pomocy Davida Copa, który osobiście
nadzorował proces tworzenia 42 symfonii, wybierając takie rozwinięcia, które
najlepiej oddawałyby ducha Mozarta. To właśnie Cope orzeka które utwory można
odrzucić, a które zasługują na uznanie. Bez niego i Mozarta, EMI nic by nie
osiągnęła, gdyż nie jest w 100 procentach kreatywna, chociaż w bardzo
wyrafinowany sposób potrafi wykorzystać kreatywność ludzi.
Jak
donosi New Scientist inteligentne programy same zaczynają odnosić sukcesy na
polu odkryć naukowych. Pewien zespół naukowy przedstawił dwa odkrycia:
substancji powodującej raka oraz nowych praw opisujących budowę trójwymiarowej
struktury białek. Oba odkrycia zostały wygenerowane przez program komputerowy.
Odkrycia sztucznej inteligencji dotyczą wielu różnych dziedzin nauki. Na
przykład program nazwany przez twórców HR, wykrył szczególną sekwencję
liczb całkowitych, które ze względu na wspólne właściwości uznane zostały
za nową grupę, którą wpisano do „Encyclopaedia of Online
Sequences”. To zaledwie początek.
Steve
Thaler sądzi, że wie jak tchnąć w maszynę kreatywnego ducha. Co więcej, ma
on pomysły na przelanie duszy człowieka do wnętrza komputera - zapewnienia mu
tym samym nieśmiertelności. Chociaż jak sam przyznaje nieśmiertelność jest
jak na razie odległym wyzwaniem, to jednak czyni postępy, w międzyczasie
doskonaląc program, który jak twierdzi zdolny jest do prawdziwej kreatywności.
Razem z nim (a nie przy jego pomocy) wynalazł nowe receptury drinków, nowe
minerały twardsze od diamentu, kompozycje muzyczne...O tym, że jego Creativity
Machine jest prawdziwym osiągnięciem świadczy angaż komputera w przemyśle półprzewodników
elektrycznych. W czasie kiedy komputer pracuje na jego emeryturę Thaler próbuje
przy pomocy jego sobowtóra zaprojektować Creativity Machine II.
Początki
zainteresowania Thalera, które doprowadziły go do tak spektakularnych osiągnięć
sięgają lat osiemdziesiątych. Wtedy to rozpoczął badania nad sieciami
neuronowymi. Przypomnę, że sieć neuronowa jest systemem węzłów i połączeń
imitujących neurony mózgu. Taką sieć możemy wyuczyć danej czynności, na
przykład rozpoznawania liter, by później mogła wykonywać daną czynność
samodzielnie w warunkach rzeczywistych, w których występują zakłócenia
sygnału. Etap przygotowania sieci zwie się „trenowaniem”. Podczas
treningu występuje bardzo interesujące zjawisko. Otóż wirtualne neurony
zaczynają się specjalizować w pełnieniu określonych funkcji. Mówiąc o
rozpoznawaniu liter: sieć neuronowa może ulec podziałowi na neurony rozpoznające
linie pionowe, ukośne i poziome. Podobnie dzieje się w mózgu człowieka.
Podczas uczenia się występuje więc charakterystyczny dla człowieka proces
abstrakcji i nazywania. Mówiąc o czymś, że jest stołem, mamy na myśli
abstrakcję – cechy wspólne dla wszystkich stołów, nie zaś
charakterystyczne cechy opisywanego obiektu. Wydaje się, że sieć neuronowa w
jakiś sposób potrafi imitować procesy abstrahowania.
Thaler
przejął opisane tutaj podstawy sieci neuronowy, do których dodał kilka własnych
patentów. Pomysły czerpał nie tylko z życia. Kiedy był dzieckiem Thaler
przeżył śmierć kliniczną. Doznanie na pograniczu życia i śmierci głęboko
wpłynęło na jego późniejsze życie. Eksperymentując z sieciami neuronowymi
zadał sobie pytanie – co się dzieje z siecią, gdy próbujemy ją uśmiercić.
Obserwując działanie sieci wyłączał on losowo wybrane neurony –
replikując tym samym proces, który ma miejsce w mózgu umierającego człowieka.
Ku jego zdziwieniu zamiast dezintegracji procesów sieci otrzymał adaptację.
Sieć zaczęła reagować w dziwny sposób. Otóż generowała ona odpowiedzi na
nieistniejące sygnały, co wynikało z mylnej interpretacji zmian wewnętrznych
jako wprowadzania danych wejściowych. Thaler porównał to zjawisko do myślenia
kreatywnego, wyobraźni (creative imagery) niezbędnej do stworzenia czegoś
jakościowo nowego. Pierwszym poważnym eksperymentem było zakodowanie w sieci
modelu samochodu. Następnie Thaler w losowy sposób zmieniał wagi na wybranych
neuronach (które grupowały się w atrybuty samochodu) co pobudzało sieć do
tworzenia samochodów o zupełnie nowatorskich kształtach. Ponieważ sieć ta
tworzyła rozmaite samochody, również o takie o zupełnie nieakceptowalnych
dla człowieka kształtach, Thaler stworzył sieć filtrującą, której
zadaniem był wybór samochodów „dobrych”. Na tej uproszczonej
zasadzie, sieci generującej i filtrującej, opiera się Creativity Machine
Thalera.
Thaler
widzi więź pomiędzy stylem funkcjonowania jego sieci neuronowej a czysto
ludzką kreatywnością. Przede wszystkim wynika ona ze struktury sieci imitującej
bądź co bądź strukturę mózgu. Taka sieć nie działa w sposób
algorytmiczny, chociażby ze względu na setki tysięcy wykonywanych równolegle
obliczeń. Do umysłu człowieka upodabnia ją również zdolność do
abstrakcji polegającej na wyspecjalizowywaniu się grup neuronów w
rozpoznawaniu wybranych cech obiektu. Pozostaje tylko wprowadzić neuronalny
szum (lub jak kto woli chaos) a sieć zacznie „wyobrażać” sobie
nowe, nie istniejące w naturze obiekty. Rola Thalera sprowadza się do
nauczenia sieci podstawowych funkcji, oraz pobudzaniu jej „swobodnymi
skojarzeniami” Później wystarczy tylko wyselekcjonować właściwe...i
patent gotowy. Thaler uważa że o kreatywności decyduje nieznany mechanizm
przypadkowych fluktuacji stanów neuronalnych, który prowadzi do powstawania
swobodnych skojarzeń i krystalizowania ich w nowe idee. Komputer podobnie jak i
człowiek jest w stanie myśleć kreatywne i niealgorytmiczne. W ten sposób
zbliżamy się do tematyki ewolucyjnego działania na ślepo metodą prób i błędów,
poruszanej na łamach PC Shareware w artykule „Wirtualne życie”.
Okazuje się, że metoda ewolucji: losowego doboru kombinacji cech, testowanie
ich przystosowania, wymiany efektywnego materiału genetycznego jest często dużo
lepsza od najlepszych algorytmów. Element przypadkowości musi być więc
sednem ludzkiej kreatywności, uzupełnionym o niealgorytmiczne odwzorowanie
rzeczywistości. Oba elementy znajdują swój wyraz w „kreatywnej
maszynie” Thalera.
Jej
zastosowania są uniwersalne - zależą wyłącznie od materiału którym
wyuczymy sieć generującą rozwiązania. Aby to udowodnić Thaler przedstawił
maszynie krótkie frazy 10 dźwięków wybrane z popularnych melodii. Sieć
filtrująca spośród wielu rozwiązań wybrała 11 tysięcy najlepszych tematów,
które właściciel maszyny przesłał do Biblioteki Kongresu US celem
opatentowania. Jak twierdzi dzięki temu stał się najbardziej płodnym
kompozytorem wszechczasów. Następnym jego krokiem było stworzenie struktury
minerałów twardszych od diamentu. Obecnie, jak pisałem sięga po nieśmiertelność,
jak również projektuje maszyny do tworzenia nowych generacji inteligentnych
robotów.
Kto
wie, czy rozwój AI w kierunku sieci neuronowych, nie zaś sformalizowanych
algorytmów, nie jest tym właściwym?
Do
tej pory ograniczaliśmy sztuczną inteligencję do roli pozbawionego zmysłów
układu do przetwarzania danych. Istotnym czynnikiem warunkującym inteligencję
u ludzi jest kontakt z otoczeniem i zbieranie w efekcie tego kontaktu nowych doświadczeń.
Chcąc stworzyć prawdziwie inteligentną maszyną musimy wyposażyć ją w
umiejętność funkcjonowania w otoczeniu, zbierania i przekazywania informacji.
Tylko wtedy maszyna taka będzie w stanie sama wyznaczać sobie nowe cele i
wykonywać zadania w pełni kreatywne. Współczesne roboty nie są może na
takim stopniu rozwoju poznawczego jak sympatyczny blaszak z filmu „Krótkie
spięcie”, ale konstruktorzy mają dziś czym się pochwalić.
Tradycyjne
podejście do sztucznej inteligencji zakładało wprowadzenie algorytmu działania
robota. Jak wiemy z historii o Kurcie Gödlu takie podejście musi zakończyć
się fiaskiem - klasyczna AI może jedynie wyręczyć nas w wykonywaniu zadań,
które sami dobrze opanowaliśmy. Obecnie eksperymentuje się głównie na
sieciach neuronowych. Programista nie musi martwić się poprawnością każdej
linijki kodu. Wystarczy, że wprogramuje podstawowe zasady uczenia się sieci,
sposób przekazywania impulsów, a „żywioł” zrobi za niego resztę.
Wprawdzie funkcjonowanie na zasadzie odpowiedzi na pobudzenie nie jest jeszcze
AI, ale podejrzewam, że w najbliższej przyszłości osiągnięcia cybernetyków
zasymilują się z maszynami posiadającymi wyobraźnię, takie jak
skonstruowane przez Thalera. Może pewnego dnia każdy będzie miał osobistego
androida od myślenia, w rodzaju MR. Spocka. On właśnie podsunie nam pomysł
jak naprawić samochód, uniknąć płacenia podatków itp.
Póki
co za kilkanaście tysięcy dolarów możemy sprawić sobie robota –
maskotkę o imieniu Kismet. Jest on młodszym bratem androida o imieniu Cog. Oba
roboty tworzone są przez zespół specjalistów od sztucznej inteligencji z
Politechniki MIT. Kismeta łączy z Cogiem głęboka więź. Doświadczenia w
tworzeniu Kismeta wykorzystywane są przy projektowaniu Coga. Kiedy ten ostatni
zostanie ukończony będzie posiadał wszystkie niezbędne zmysły (w tym również
czucia), jak również manipulatory. Póki co projektanci analizują zachowanie
Kismeta. Robot ten składa się z 3 i półkilogramowej głowy, z twarzą
gremlina informującą o potrzebach i nastrojach robota. Na starcie robot wyposażony
jest, podobnie jak niemowlę, w najbardziej podstawowe potrzeby. Jeśli nie jest
senny, a wokół niego nic się nie dzieje domaga się stymulacji, jeśli jest głodny
płacze. Emocje Kismeta widać po mimice jego twarzy: robot porusza brwiami,
ustami. Wszystko to dzięki wbudowanemu systemowi motywacyjnemu. Ponieważ
projekt zaliczył sukces, bazowe programy umożliwiające uczenie się zostały
przeniesione do Coga. W odróżnieniu od Kismeta, Cog może wchodzić w
interakcje ze środowiskiem. Obecnie jego obwody pozwalają na reakcje podobne
do obserwowanych u 2 letniego dziecka. Potrzeba uczenia chłonnego umysłu
przemieniła szacownych specjalistów od sztucznej inteligencji w niańki. Cog,
mając na starcie wyłącznie najbardziej bazowe programu, musi sam nauczyć się
wszystkiego. Obserwując zachowanie Coga, jego ciekawość poznawczą, płynne
ruchy można odnieść wrażenie zachowuje się on podobnie jak poznające świat
dziecko. Cieszy to jego twórców, gdyż stworzenie istoty uczącej się na wzór
człowieka było głównym celem projektu.
Cog
posiadł rozmaite umiejętności z zakresu ludzkich zachowań. Na przykład jest
on w stanie spojrzeć komuś prosto w oczy. Jeśli w jednej z dwóch
peryferyjnych kamer zauważy ruch wówczas uruchamia programy rozpoznające
charakter poruszającego się kształtu. Jeśli wśród nich jest twarz wówczas
Cog odwraca się do obiektu i uruchamia centralne kamery o wysokiej rozdzielczości.
Przy ich pomocy lokalizuje oczy i zaczyna się w nie wpatrywać. Niby nic
wielkiego, ale budzi dreszcze. Jedynym zgrzytem w całym projekcie jest jak na razie nie
rozwiązany problem wewnętrznie sterowanej uwagi oraz pamięci, która imitowałaby
przechowywanie informacji przez człowieka. Taka pamięć musiałaby odróżniać
kolejność zdarzeń w przeszłości, magazynować informacje w postaci
hierarchii itp. Ze względu na brak takiej pamięci Cog pozbawiony jest „życia
wewnętrznego”. Przynajmniej na razie.
Mam
nadzieję, że w niniejszym artykule udało mi się wykrystalizować podstawowe
problemy związane z AI. Zagadnienie inteligencji w ogóle, a sztucznej w szczególności
jest zbyt złożone aby spłycać go jednym, czy dwoma zdaniami na zakończenie.
Zamiast więc silić się na podanie uniwersalnej definicji inteligencji
zapytam: Czy gdybyś Czytelniku był robotem, to wiedziałbyś o tym? Która
unikalna cecha świadczy o twoim człowieczeństwie? Skąd wiesz, że nie jesteś
jedynie sprawnie funkcjonującym komputerem?
Literatura:
„Nowy
umysł cesarza” Roger Penrose
„Żegnaj
Kartezjuszu” Keith Devlin
„Wirtualne
życie”, PC Shareware 4/99
„Slaughter on Seventh Avenue” New
Scientist 7/ 6 / 1997
“Requiem for the soul” New
Scientist 9/9/1997
“Creativity Machine” New
Scientist 20/1/1996
“Meet Kismet” New Scientist
22/9/1998
“Booting up baby” New Scientist
22/5/1999
[wróć]
Piotr
Lasoń, Wrocław 2000

Text
& Design
Copyrights
by Piotr
Lasoń
[Home
Page]
|