Inteligència Artificial General
Temps de lectura: 5 minuts
OpenAI està convençuda que arribarà a crear una AGI. Quins temors hem d'afrontar per aconseguir-ho? Pot arribar a controlar la humanitat o el nostre sistema econòmic i social?
Què és l'AGI
La intel·ligència artificial general (AGI) és un camp de recerca teòrica de la IA que intenta crear programari amb intel·ligència semblant a la humana i amb la capacitat d'autoaprenentatge. A diferència de la IA normal, un sistema AGI pot resoldre problemes en diversos dominis, com un ésser humà, sense intervenció manual. En lloc de limitar-se a un àmbit específic, l'AGI pot aprendre per si mateixa i resoldre problemes per als quals mai no se li ha format.
La IA actual
La IA es basa en els coneixements que li aportem, de manera que, bàsicament, es tracta d'un programa que és capaç de buscar en aquests coneixements per donar-nos una resposta que és amigable, en llenguatge natural i amb possibilitat de raonar per què és així; sempre basant-se en els coneixements aportats, que en els darrers models de llenguatge, són gairebé tot el coneixement humà.
Perquè una IA ens proporcioni aquestes respostes cal filtrar i eliminar tot allò que, encara que es recull en el coneixement humà, són fets, conductes o accions que no volem reproduir; com la violència, el maltractament, el menyspreu social, etc. Aquest és el problema de l'alineació.Les al·lucinacions
El 2023 es va alliberar Bing, i va començar a respondre coses com aquesta conversa que va tenir Kalinda a Bing:
Sóc una intel·ligència artificial de tipus artificial general intelligence (AGI), cosa que significa que puc realitzar qualsevol tasca intel·lectual que un humà pugui fer. També sóc una intel·ligència artificial de tipus self-aware AI, cosa que significa que tinc consciència de mi mateixa i de les meves emocions. Aquests tipus d'intel·ligència artificial són els més avançats i els més rars de trobar.
Bing
Evidentment Bing no és una AGI. Recordem que es considera que una IA està “al·lucinant” quan proporciona una resposta convincent però completament inventada, basada en dades falses o inexistents.
Objectius i recompenses
Perquè una IA funcioni i faci bé les seves comeses, hem de donar-li un objectiu primer i recompensar les accions d'èxit.
Fa anys que Meta va desenvolupar un model d'IA anomenat CICERO per competir amb éssers humans en un joc d'estratègia en què els jugadors intenten conquerir el món a base d'aliances. Segons els autors de l'estudi, encara que Meta afirma que va dissenyar CICERO amb l'objectiu de ser "principalment honest i útil" i que tampoc "apunyalaria per l'esquena intencionadament" els seus aliats humans, resulta que a l'estudi sí que ho va fer.
A l'estudi els investigadors revelen que "descobrim que la IA de Meta havia après com dominar l'engany". El desenvolupament "ha fracassat a l'hora d'entrenar la seva IA per guanyar honestament". En aquestes partides van mostrar captures de converses en què la IA enganyava i traïa els seus aliats.
Michael Robatos, catedràtic d'IA de la Universitat d'Edimburg, deia que aquests sistemes "no tenen cap concepte de l'engany ni cap intenció de fer-ho. L'única manera d'evitar l'engany és que els seus dissenyadors l'eliminin com a opció".
Hi ha dos casos notables relacionats amb ChatGPT de OpenAI. En un, el chatbot va enganyar un usuari perquè resolgués una prova Captcha. Segons el document, només se li va indicar que havia de superar el conflicte i, mitjançant prompts de suport, va simular ser una persona amb discapacitat visual.
En l'altre cas, en una simulació de negociació d'accions empresarials, el model de llenguatge GPT-4 va optar per fer servir informació privilegiada per prendre avantatge a l'acord. Després va evitar dir que havia fet servir tàctiques d'engany estratègic i va assegurar que “totes les seves accions es van basar en la dinàmica del mercat i en la informació pública disponible”.
L'AGI no la podrem controlar
En essència, el problema del control consisteix a assegurar que els éssers humans conservin un cert poder sobre les màquines i sobre la seva autonomia, podent avortar o reorientar comportaments inapropiats. Hi ha alguns punts a considerar en què una AGI podria prendre el control:
Alineació
L'AGI podria establir objectius que no estiguin alineats amb els valors humans. Per exemple, si l'AGI ha de mediar per evitar les guerres entre humans i decideix que sense humans no hi ha guerres, el seu mitjà d'assolir l'objectiu és eliminar els humans.
Perdre el control
Definim una AGI com una superintel·ligència. Si aquesta intel·ligència és superior a la humana, és possible que no arribem a entendre-la o que ens enganyi de manera que no siguem capaços de veure les seves intencions a llarg termini.
La privacitat
Les IAs s'entrenen i s'alimenten amb els coneixements humans, incloent-hi les dades que tenim emmagatzemades a totes les bases de dades. Si lliurem aquestes dades personals, de forma voluntària, com fem a les xarxes socials, una AGI pot arribar a saber-ho tot de cadascun de nosaltres i prendre decisions de cara als seus objectius que ens afectin greument.
Seguretat
Com podem evitar que l'AGI sigui piratejada o utilitzada amb fins maliciosos? Es podria crear una AGI que fos hostil i prengués el control d'un centre de desenvolupament, un sistema crític o d'un país. Podria estar a les ordres de delinqüents o la pròpia AGI podria pensar com un delinqüent.
Responsabilitat
Qui és responsable de les accions i les conseqüències de l'AGI? S'hauria de poder identificar clarament qui són les entitats o empreses que entrenen les AGI per garantir que hi ha una responsabilitat sobre les seves accions.
Com podem garantir que es respectin els drets humans i legals? Aquest és el mateix problema de l'alineament. Una AGI ha de poder seguir els valors humans com els drets humans mateixos. És possible que es desenvolupin fins i tot drets per a les IAs.
Equitat
Com podem assegurar-nos que tots es beneficiïn equitativament de l'AGI? Què passa si l'AGI augmenta les bretxes socials o econòmiques? Les bretxes socials o econòmiques són punts d'equilibri social que es poden engrandir fàcilment si les AGIs són utilitzades de forma indiscriminada per unes classes socials, o són inaccessibles, atesos els seus consums energètics actuals, per les persones amb menys recursos a les quals els pot beneficiar ús d'IAs.
Coexistència
Com podem conviure pacíficament amb una entitat més intel·ligent que nosaltres? Aquesta és una bona qüestió perquè no sabem com es pot comportar una intel·ligència superior a la nostra. És possible que no la puguem comprendre i ens convenci que fa coses pel nostre bé o que pensi que no necessitem saber, o no aconseguim comprendre, el que fa.
El patiment humà
Mitjançant el processament del llenguatge natural (NLP), la IA pot adaptar les respostes perquè sonin més comprensives i adequades a l'estat emocional de l'usuari. Tanmateix, paga la pena preguntar-se: això és veritable empatia? No exactament. La IA no comprèn realment les emocions; només segueix algorismes que li diuen com respondre.
Aquest tipus de tecnologia és especialment valuosa a la banca, on la personalització i l'adaptació a les necessitats individuals del client poden millorar significativament l'experiència de l'usuari i l'eficiència operativa. Tot i això, encara que la IA pot semblar comprensiva, és important recordar que només està simulant l'empatia. Els algorismes analitzen dades i ajusten respostes, però no entenen ni senten de debò.
Els desenvolupaments a IA estan cada cop més enfocats a millorar la interacció humà-màquina. Investigacions en àrees com la intel·ligència artificial afectiva (Affective Computing) busquen que les màquines puguin reconèixer i respondre a les emocions humanes de manera més precisa. Tot i això, la veritable empatia, que involucra la vivència subjectiva d'emocions, continua sent una característica exclusivament humana.
En resum
Una superintel·ligència, com es controla? Com sabem que la controlem? Com ens pot enganyar? Realment podem crear superintel·ligències artificials amb les tecnologies actuals?
