Mi a jó döntés?
A mesterséges intelligenciáról szóló beszélgetésekben gyakran felbukkan az a várakozás, hogy a gépek majd racionálisabb döntéseket tudnak hozni, mint mi, mert optimalizálni tudják, amit kell. De mit is kell, azaz mi számít jó döntésnek? Járjuk egy kicsit körbe a témát! Nézzük meg közelebbről, miért nem egyszerű ez még akkor sem, ha valaki nagyon szeretné képletekké és számolássá egyszerűsíteni.
A világ bizonytalan
Az első gond az, hogy az észlelésünk és az információink hibákkal és bizonytalanságokkal terheltek. Ezt nemcsak úgy kell elképzelni, hogy néha félreértünk valamit, vagy rossz adatot kapunk, hanem úgy is, hogy maga a helyzet gyakran eleve többféleképpen értelmezhető.
Erre nagyon jó példa maga a látás, ami az agyunk nagy részét leköti minden pillanatban. A retinánkra a három dimenziós világnak csak egy kétdimenziós vetülete jut el. Ebből a képből elvileg rengeteg különböző háromdimenziós magyarázatot lehetne felépíteni, mi mégis kiválóan érzékeljük a valódi háromdimenziós világot magunk körül. Ez azért működik, mert az agyunk nem egyszerűen befogadja a látványt, hanem folyamatosan következtet: korábbi tapasztalatok alapján – már babakorunktól kezdve – felépít egy belső világmodellt, és ezt kombinálja az aktuális érzékszervi jelekkel, hogy végeredményben a legvalószínűbb értelmezést érzékeljük.
Ezt a belső modell alapján előállított érzékelést nem is szoktuk megkérdőjelezni, mert a hétköznapokban megbízhatóan működik. Amikor mégis becsap minket, az többnyire nem valamiféle hiba, hanem a módszer mellékhatása: az agy a környezetünkben megszokott statisztikák alapján választja ki a legvalószínűbb értelmezést. Az optikai illúziók éppen ezt teszik láthatóvá, mert olyan mesterkélt helyzeteket teremtenek, ahol egy kisebb valószínűségű magyarázat a valóság és a szokásos, amúgy nagyon hasznos feltételezéseink (például a megvilágítás szokásos iránya, felületek folytonossága) félrevezetnek. Vagyis az illúziók nem az agy hibás működését bizonyítják, hanem épp azt, hogy a rendszer a megszokott, tipikus környezetben optimálisan működik.
Az információhiány és a bizonytalanság viszont nem csak a látásnál lép fel, az élet minden területén felbukkan. Látjuk tehát, hogy egy intelligens rendszernek alapvető velejárója kell legyen, hogy valószínűségeket kezeljen, ez már az érzékelésnél is megjelenik, és ennek következményeként valószínűségi alapon kell következtetéseket levonjon és döntsön.
Tegyük fel, hogy mindent tudunk
Most tegyük fel egy pillanatra mégis, hogy minden információnk megvan, ami egy döntéshez kellhet. Például lakást keresünk, és az összes szóba jöhető lakást megnéztük, minden paramétert ismerünk, semmit nem titkoltak előlünk. Ettől egyértelmű és könnyű lesz a döntés? Több okból sem.
Az egyik, hogy hiába tudjuk, milyen a lakás most, a jövőt nem látjuk előre. Ami ma csendes, lehet, hogy fél év múlva zajos lesz, mert megváltozik a forgalom, építkezés indul, átalakul a környék. Vagyis a bizonytalanság nem tűnik el attól, hogy alaposan körbenéztünk: legfeljebb a jelenről tudunk többet, de a jövő ugyanúgy kérdőjel, és ha ismernénk is a folyamatokat leíró törvényeket, nincs rá elegendő számítási kapacitásunk és időnk, hogy minden forgatókönyvet végig tudjunk számolni vagy gondolni.
A másik gond a sok szempont. Hiába ismerjük az árat, a négyzetmétert, a rezsiköltséget, az alaprajzot, a környéket, a közlekedést, és minden mást, ezeket nagyon különböző mennyiségekkel tudjuk kifejezni, amik közvetlenül nem hasonlíthatók össze egymással. Valahogyan mégis összegeznünk kell ezeket a szempontokat egyetlen döntésbe. Ha valaki adna egy képletet, hogy mennyit ér meg nekünk a napfényes órák száma a nappaliban a négyzetméterhez képest, vagy súlyozni tudná a csendet a közlekedéshez képest, akkor egy matematikus már tudna optimalizálni. De tudatosan nincs egy ilyen képlet a fejünkben, ha egyáltalán leírhatók a preferenciáink ilyen módon.
Ha van egy célfüggvény
Lépjünk tovább: tegyük fel, hogy valaki mégis össze tudja sűríteni a célt egyetlen számba. Szemléletes példa lehet erre mondjuk egy társasjáték, amiben több pontot szeretnénk szerezni, mint az ellenfeleink, és több módon is lehet ugyan pontot szerezni, de a szabály pontosan leírja, hogy mi mennyit ér a végső számolásnál.
Igen ám, de a bizonytalanság egy társasjátékban sem csak a kockadobásokból és a kevert pakliból adódik, hanem abból is, hogy más élő szereplőkkel játszunk, akik saját logikával és stratégiával játszanak, esetleg még az érzelmük is befolyásolja a döntéseiket. Ha tudnánk, hogy a másik fél milyen valószínűséggel mit fog lépni, akkor máris lehetne számolni, de általában még ezt se tudjuk.
De még ha ismernénk is pontosan a stratégiájukat, még akkor is mérlegelnünk kéne, hogy a különböző valószínűséggel bekövetkező különböző hasznot hajtó események között hogyan mérlegeljünk. Például el kell döntenünk, mennyire vagyunk kockázatvállalók, ahogy az élet nagy társasjátékában is. Kis valószínűséggel nagy nyereségre hajtunk, vagy a biztonságosabb, nagyobb valószínűséggel bekövetkező kisebb nyereséggel megelégszünk. Ez már nem csak számolás, hanem hozzáállás kérdése is.
Különböző válaszok ugyanarra a dilemmára
Egy kockadobás valószínűségét tudjuk kalkulálni, de miért is tudnánk pontosan, hogy egy másik ember milyen stratégiát követ, számára mi mennyire fontos, vagy épp milyen kedve van? Még a nyereség sem mindenkinek egyforma, ez még a számokkal jól kifejezhető pénz esetében is így van, hiszen ugyanaz a tízezer forint egy milliomosnak szinte semmi, egy hajléktalannak viszont nagyon sokat számítana.
Mit lehet ilyenkor tenni? Mi az okos döntés egy információhiányos helyzetben? Ezzel nem csak az emberek szembesülnek. Egy mesterséges intelligenciának vagy bármilyen intelligenciának pont ugyanilyen problémás a döntés. Itt elvi kérdések vannak: mik a céljaink, mik a szempontjaink, mi a fontosabb számunkra, és mit tekintünk elfogadható kockázatnak. Tegyük fel, hogy egy játékban minden döntés lehetséges kimeneteleit és a hozzá tartozó valószínűséget ismerjünk, csak a szereplők, vagy ellenfelek stratégiáit nem. Ekkor milyen stratégiákat követhetünk? Nézzünk néhány lehetséges megközelítési módot!
A minimax stratégia lényege, hogy minimalizáljuk a maximális veszteséget. Ez persze felfogható a minimális nyereség maximalizálásaként is. Képzeld el, hogy a világ vagy az ellenfél számodra a lehető legrosszabbat lépi, vagy a világ a lehető legrosszabb módon alakul, és válaszd azt a lépést, amelyik ebben a legrosszabb esetben is a legjobb eredményre vezet. Ez persze néha túl óvatos, de akkor nagyon hasznos stratégia, amikor egyetlen rossz kimenetel is vállalhatatlan.
A Nash-egyensúly azt mondja több szereplő esetén: keressünk olyan stratégiakombinációt, ahol senkinek nem éri meg egyoldalúan változtatni, mert a többiek stratégiája mellett az rosszabb lenne neki. Ez nem feltétlenül ideális, de ha mindenki részéről feltételezzük a racionalitást, hogy nem akar magának rosszat, akkor ez az a stabil pont, amiből senki nem akar kilépni.
Van egy pszichológiailag nagyon természetes elv is, ami a döntés kimenetele utáni érzetünket próbálja optimalizálni. Ez a minimax megbánás (Leonard Savage, 1951), amiben nem a nyereséget akarjuk maximalizálni, hanem a legnagyobb utólagos megbánást akarjuk minimalizálni. Minden lehetséges kimenetelnél megnézzük, mennyivel jártunk volna jobban az optimális döntéssel, amit annak függvényében hozhattunk volna meg, ha ismerjük az ellenfél vagy a világ reagálását a mi választásunkra, majd azt a lehetőséget választjuk, aminél az optimumhoz képesti különbség, azaz a megbánás, a legkisebb.
Ha pedig egy hosszabb folyamatról van szó, amiben tanulni is tudunk, akkor nagyon hasznos lehet a bayesiánus megközelítés, ami azt mondja, nem ismerjük ugyan a valószínűségeket, de felállítunk valamilyen kezdeti, szubjektív becslést, majd amikor új információ érkezik, frissítjük a becslésünket a matematika, azaz a valószínűség számítás pontos szabályai szerint. A szóban forgó szabály a Bayes-tétel, innen jön az elnevezés. Így működik a mindennapi gondolkodás is: van egy előzetes benyomásunk mindenről, és ahogy új információt kapunk, finomítjuk a képünket. A bayesiánus módszer ezt a természetes tanulási folyamatot teszi formálissá. A módszer hátránya, hogy számít, milyen kezdeti feltevésből indultunk, de minél több tapasztalatot gyűjtünk, annál kevésbé függ az eredmény az induló becsléstől.
Vannak még más elvek és lehetőségek is, amik szerint lehet gondolkodni, például a Hurwicz-kritérium, ami a pesszimizmus és optimizmus keveréke: nem feltételezi sem a legrosszabb esetet, sem a legjobbat, hanem a kettő között keres egy egészséges arányt attól függően, mennyire vagyunk óvatosak. És épp ez mutat rá a lényegre: ezek a módszerek különböző szempontok szerint adnak választ. Nincs feltétlenül egyetlen helyes döntés, előbb tisztázni kell, hogy mit feltételezünk a világról magunk körül, hogyan formalizáljuk a célunkat, mi milyen mértékben értékes számunkra és mit merünk kockáztatni.
Most pedig nézzünk egy konkrét feladatot! Korábban beszéltünk arról, hogyan sűríthetnénk esetleg össze több, egymással versengő szempontot egyetlen döntésbe, ami egy lakásvásárlási döntésnél például nagyon hasznos lenne.
286. feladvány: Lakásvásárlás szempontjai
Angelika lakást keres, és nagyon akkurátusan értékel minden szóba jöhető lehetőséget. Három szempont szerint értékeli a lakásokat 0-tól 10-ig terjedő skálán. Az első szempont az ár (A), a második szempont a környék (B), a harmadik szempont a szobák és elrendezésük (C).
Az egyik héten matematikus barátjának ecsetelte, hogy van két teljesen különböző lakás, amikre az alábbi értékeléseket adta: (5, 3, 9) és (8, 7, 4), és egész nap azon dilemmázott, hogy melyiket válassza, de nem tudott közöttük dönteni, mert összességében egyformán jónak tartotta ezt a két lehetőséget. Viszont olyan sokáig gondolkodott ezen, hogy közben mindkét lakás elkelt.
Másik héten két másik lakás között dilemmázott, amikre ezeket az értékeléseket adta: (3, 9, 6) és (7, 1, 10). Ezek között sem tudott dönteni, mert összességében egyformán jónak tartotta ezt a két lehetőséget is, és sajnos megint addig dilemmázott, hogy a lakások idő közben elkeltek.
Tegyük fel, hogy Angelika preferenciája egyértelműen kifejezhető egyetlen S számmal, amiket a szempontok (lineáris) súlyozásával kapunk, Angelikára jellemző x, y és z súlyokkal: S = x·A + y·B + z·C, ahol x + y + z = 1. Minél nagyobb egy lakásra S értéke, annál jobb Angelika számára a lakás.
Tegyük fel továbbá, hogy Angelika nem a jelleméből fakadóan dilemmázott, hanem pontosan azért mert a fent említett esetekben S értéke az összehasonlított lakások esetében pont ugyanaz volt.
Harmadik héten egy (2, 8, 8) értékelésű lakás merül fel. Ha ezt a lakást választja Angelika, akkor jobban jár-e, mint a korábbi lakásokkal járt volna?
Tipp
Kezdjük a második héttel, abból y értéke könnyen kikalkulálható az z = 1 - x - y összefüggés felhasználásával.
Megoldás
A második hétre vonatkozó egyenlőség szerint:
3·x + 9·y + 6·(1-x-y) = 7·x + y + 10·(1-x-y).
Amiből egyszerűsítés után x kiesik, átrendezés után pedig azt kapjuk, hogy 12·y = 4, amiből y = 1/3 adódik. Ezt az első hétre vonatkozó egyenlőségbe helyettesítve kapjuk, hogy:
5·x + 3·(1/3) + 9·(2/3-x) = 8·x + 7·(1/3) + 4·(2/3-x),
amit x-re megoldva adódik, hogy x = 1/4, eszerint pedig z = 5/12. Ha most visszahelyettesítjük x, y és z értékét, akkor azt kapjuk, hogy az első héten S = 6 volt, második héten S = 6,25, harmadik héten pedig S = 2·(1/4) + 8·(1/3) + 8·(5/12) = 6,5. Eszerint tehát Angelika jól jár, ha a (2, 8, 8) értékelésű lakást veszi meg.
De mindez csak akkor van, ha elfogadjuk, hogy az értékelések véletlenül pont egész számok. Ha viszont azt gondoljuk, hogy A, B és C értékei akár nem egész számok is lehettek a valóságban, csak Angelika kerekített értékeket írt le, akkor kiderül, hogy előfordulhat az is, hogy nem járna jól a kerekítve (2, 8, 8) értékelésű lakással. Ennek belátását már a kedves olvasóra bízzuk!
Ha szereted a fejtörőket, tekintsd meg korábbi feladványainkat is! Ha megjegyzésed lenne, vagy feladványt javasolnál, írj az eszventura@qubit.hu e-mail címre! Ha pedig tetszik a rovat, ezt a Vendégkönyvben kifejezésre juttathatod.
Az Ész Ventura feladványügyi rovat gazdája: Gáspár Merse Előd fizikus, kognitív kutató, társasjáték-fejlesztő és bűvész.