Meta AI onthult met AI doordrenkte diplomatieke charmeur die AI-ethiek en AI-wetgeving tot ondelicaat Tiff roert

Kunnen we AI ertoe brengen diplomatie te doordringen die vergelijkbaar is met die van de mensheid? AI-ontwikkelaars streven ernaar dit te doen.

getty

De gewaardeerde wereld van charme en diplomatie wordt vaak ontsierd door ondeugendheid en onbeleefdheid.

Will Rogers, de grote humorist en sociaal commentator, zei beroemd dat diplomatie de kunst is om "Lekker hondje" te zeggen totdat je een steen kunt vinden.

De schijnbare implicatie is dat je soms alle dreigende en bedreigende krachten krachtig moet tegenhouden totdat je een voldoende verdedigbare oplossing kunt vinden. Doe wat je moet doen als je in een wanhopige situatie verkeert. Moedig en doelbewust degenen kalmeren die u in gevaar brengen, door uw kalmerende en betoverende woorden te gebruiken en kostbare tijd te vergaren om uzelf te bewapenen met een meer praktische en openlijk tastbare houding.

ADVERTENTIE

Sommigen beweren dat oorlog onlosmakelijk het resultaat is van mislukte diplomatie. Vanuit dit weloverwogen gezichtspunt zal een constante trommelslag van diplomatie oorlog afwenden. Blijf praten en de gevechten zullen niet op gang komen. Anderen zijn het vurig oneens over zo'n problematische mening. Misschien, zo wordt gezegd, is diplomatie in feite wat ons in oorlogen brengt. Bovendien kan het zijn dat diplomatie oorlogen verlengt en de gevechten eindeloos laat doorgaan.

We geven Will Rogers nog een kans om wat humor te proeven uit deze vraag of diplomatie goed of slecht is met betrekking tot de komst of het voortduren van oorlog: "Haal de diplomatie uit de oorlog en het ding zou binnen een week plat vallen" (hij naar verluidt verklaard).

De gemeenschappelijke definitie van diplomatie benadrukt de relaties tussen naties. Diplomaten vertegenwoordigen bepaalde naties of natiestaten en oefenen diplomatie uit bij het uitvoeren van hun heilige taken. We verwachten van onze diplomaten dat ze hun buitenlands beleid overbrengen door middel van zelfverzekerdheid. De boodschapper zou niet degene moeten zijn die vijandigheid opwekt, alleen de boodschap zou dat kunnen doen. Een vermoedelijk onberispelijke diplomatieke weergave van zelfs de meest flagrante berichten kan aantoonbaar de klap verzachten die voortvloeit uit een verder schadelijke eis of dreiging.

ADVERTENTIE

Natuurlijk is diplomatie niet beperkt tot alleen het verheven werk van geformaliseerde diplomaten. Ik durf te stellen dat we in ons dagelijks leven allemaal een schijn van diplomatie moeten leren. Als je wilt dat een vriend over je geliefde hond waakt terwijl je op zakenreis bent, ga je hoogstwaarschijnlijk diplomatiek het verzoek indienen om voor het hondje te zorgen. Een regelrechte eis stellen om dit te doen, zal waarschijnlijk met een doffe plof landen.

Waarschijnlijk meer kunst dan wetenschap, diplomatie is iets dat mensen gebruiken om de skids te smeren, de lichten aan te houden en te voorkomen dat de samenleving totaal gek wordt. Onderhandelingen komen om de hoek kijken. Mogelijk moet er verzoening komen. Soms gebruik je de wortel, soms gebruik je de stok. Als het moet, kunt u de zogenaamde kanonneerbootdiplomatie proberen, waarbij u anderen om u heen probeert te intimideren. Of in plaats van sterk te bewapenen, zou je de zachtere bemiddelings- en humanitaire route kunnen kiezen. Het hangt er vanaf.

Oké, dus we zijn het er allemaal redelijk over eens dat diplomatie een essentiële vorm van mens-tot-mens communicatie is. Het bestaat uit oefening of toneelvaardigheid geassocieerd met het gebruik van tact, bemiddeling, onderhandeling, verzoening en een hele reeks maatschappelijk behendige politiek.

ADVERTENTIE

Laten we nog iets aan die vergelijking toevoegen.

Ben je klaar?

We gaan iets anders toevoegen dat je misschien al hebt overwogen.

Kunstmatige intelligentie (AI).

Ja, AI begint aan het diplomatieke spel. Dit lijkt volkomen verstandig. Als we AI willen laten onderdompelen in alle facetten van ons leven, moest uiteindelijk de diplomatie aan de beurt komen. We mogen verwachten dat AI in staat zal zijn om alle taken uit te voeren die het heeft door de juiste woorden en manieren van diplomatie te gebruiken.

ADVERTENTIE

AI als de autonome of semi-autonome diplomaat.

Ik realiseer me dat dat misschien nogal ontmoedigend en helemaal eng lijkt. Ik denk niet dat iemand van ons klaar is voor AI om rond te gaan als vertegenwoordiger van onze respectieve landen. Stel je voor dat AI namens ons dient om over onze internationale standpunten te onderhandelen en onze wereldwijde politieke houding te bevestigen. Jakkes! Het is het spul van die apocalyptische scifi-verhalen.

Wel, haal even een zucht van verlichting, want dat zit voorlopig niet in de kaarten.

Denk in plaats daarvan aan AI die u gebruikt om uw bankzaken te regelen of die u helpt bij het kopen van een huis. De AI van vandaag die met mensen communiceert, is meestal behoorlijk kant-en-klaar. Ga naar de feiten, alleen de feiten. Sommige AI is berijpt met schattige bewoordingen om je te laten denken dat het vriendelijk of een maatje is, hoewel dit snel wordt doorzien. Alleen omdat een AI-systeem naar je verwijst met je naam of woorden uitzendt als "howdy" in plaats van "hallo", realiseren de meesten van ons zich meteen dat dit een schertsvertoning is.

Een volgende stap die gretig wordt nagestreefd in de hallen van AI-ontwikkelaars, is proberen diplomatieke kenmerken in onze dagelijkse AI te verwerken. Het overkoepelende doel is om programmatische aspecten op te nemen die ervoor zorgen dat AI diplomatie en diplomatiek gedrag laat zien. Met behulp van een verscheidenheid aan algoritmen en vooral de nieuwste generatieve AI of Large Language Models (LLM), wordt met name op dit vlak vooruitgang geboekt.

ADVERTENTIE

We zullen een voorbeeld bekijken, CICERO, een nieuw AI-systeem dat is uitgebracht door het Meta AI-team.

Voor het geval je op vakantie was en het laatste nieuws over AI niet had bijgehouden: de recente aankondiging en onthulling van een AI-systeem, bedacht als CICERO, biedt een belangrijke wegwijzer van waar de AI-geïnspireerde diplomatie-arena zich tegenwoordig bevindt. Zorgvuldig en tot hun eer heeft het Meta AI-team openlijk hun ontwikkelde CICERO AI-systeem beschikbaar gesteld. U kunt de technische details lezen in een gepost onderzoeksdocument op Wetenschap, Zie de link hier. U kunt een website bezoeken die ze hebben opgezet om de algemene nuances van CICERO zachtjes over te brengen met korte videoclips om te illustreren wat het doet (zie de link hier). Voor degenen onder u die op zoek zijn naar echte programmacode en software, u kunt de broncode vinden op GitHub op de link hier.

Ik wil snel een aspect verduidelijken dat verwarrend kan lijken als je ervoor kiest om je in deze kwestie te verdiepen.

Het specifieke AI-systeem dat door Meta AI is bedacht, is momenteel opgezet om een enigszins populair spel te spelen dat bekend staat als Diplomatie (misschien heb je het bordspel gezien volgens Hasbro en andere spelmakers). Ik breng dit naar voren omdat het woord "diplomatie" in deze omstandigheid een dubbele functie zal hebben. Aan de ene kant probeert de bedachte AI kenmerken van het bedrijf en de weergave toe te voegen diplomatie per se. Ondertussen is de setting waarin dit specifieke AI-systeem plaatsvindt, specifiek en alleen (nu) het beroemde bordspel dat bekend staat als Diplomatie.

Zie je hoe dit sommige mensen in verwarring kan brengen?

Als iemand tegen je zegt dat deze specifieke AI het heel goed doet in 'diplomatie', weet je misschien niet zeker of ze verwijzen naar het idee dat de AI behoorlijk bedreven is in het spelen van het bordspel dat bekend staat als Diplomatie of misschien suggereren ze in plaats daarvan dat de AI de kernessentie belichaamt die verband houdt met de daad van diplomatie van de mensheid. Bovendien kan het zijn dat beide facetten tegelijkertijd worden bedoeld (namelijk, de AI doet het goed bij het spelen Diplomatie en doet er tegelijkertijd goed aan diplomatie uit te oefenen of te demonstreren als een vaardigheid of handeling).

ADVERTENTIE

Hierin ga ik proberen dit recht te trekken door de eerste letter met een hoofdletter te schrijven en de naam van het bordspel cursief weer te geven, Diplomatie. De rest van de tijd zal ik de niet-cursieve bewoordingen van "diplomatie" gebruiken als een indicatie van de algemene opvatting van diplomatiek zijn of diplomatie tonen (zie je, ik deed dat daar net).

Terugkomend op de kwestie waar het om gaat, zou je even kunnen nadenken of AI die diplomatie tentoonspreidt, iets is dat we zouden moeten verlangen of in plaats daarvan moeten voorkomen.

Er zijn veel positieve aspecten om AI diplomatie te laten tonen. Je zou echter in een ondiepe bubbel leven om aan te nemen dat AI die diplomatie uitvoert volledig en uitsluitend een goede zaak zal zijn. AI die diplomatieke vaardigheden lijkt te hebben en ons kan doen geloven dat het over diplomatie beschikt, staat ook bol van verontrustende kwesties die we naar de voorgrond moeten brengen. In wezen roept AI die op deze manier wordt gebruikt een heleboel vragen op over AI-ethiek en AI-wetgeving. Voor degenen onder u die geïnteresseerd zijn in AI-ethiek en AI-recht, kunt u een kijkje nemen in mijn uitgebreide en doorlopende berichtgeving over Ethische AI en AI-recht op de link hier en de link hier, om er een paar te noemen.

Voordat ik inga op AI als belichaming van een vorm van diplomatie, wil ik eerst een essentiële basis leggen over AI en met name AI-ethiek en AI-wetgeving, om ervoor te zorgen dat de discussie contextueel verstandig is.

ADVERTENTIE

Het toenemende bewustzijn van ethische AI en ook AI-wetgeving

Het recente tijdperk van AI werd aanvankelijk gezien als AI voorgoed, wat betekent dat we AI kunnen gebruiken voor de verbetering van de mensheid. Op de hielen van AI voorgoed kwam het besef dat we ook ondergedompeld zijn in AI voor slecht. Dit omvat AI die is bedacht of zelf is veranderd om discriminerend te zijn en die computationele keuzes maakt die onnodige vooroordelen veroorzaken. Soms is de AI op die manier gebouwd, terwijl hij in andere gevallen in dat ongewenste gebied terechtkomt.

Ik wil er ruimschoots zeker van zijn dat we op dezelfde lijn zitten over de aard van de AI van vandaag.

Er is tegenwoordig geen AI die bewust is. Wij hebben dit niet. We weten niet of bewuste AI mogelijk zal zijn. Niemand kan treffend voorspellen of we bewuste AI zullen bereiken, noch of bewuste AI op de een of andere manier op wonderbaarlijke wijze spontaan zal ontstaan in een vorm van computationele cognitieve supernova (meestal aangeduid als de singulariteit, zie mijn bericht op de link hier).

Het type AI waar ik me op richt, bestaat uit de niet-bewuste AI die we vandaag hebben. Als we wild zouden speculeren over bewuste AI, zou deze discussie een radicaal andere richting kunnen uitgaan. Een bewuste AI zou van menselijke kwaliteit zijn. Je zou moeten bedenken dat de bewuste AI het cognitieve equivalent is van een mens. Sterker nog, aangezien sommigen speculeren dat we misschien superintelligente AI hebben, is het denkbaar dat dergelijke AI uiteindelijk slimmer zou kunnen zijn dan mensen (voor mijn verkenning van superintelligente AI als een mogelijkheid, zie de dekking hier).

ADVERTENTIE

Ik zou sterk willen voorstellen dat we de zaken nuchter houden en rekening houden met de computationele niet-bewuste AI van vandaag.

Realiseer je dat de AI van vandaag op geen enkele manier kan 'denken' op dezelfde manier als het menselijk denken. Wanneer je met Alexa of Siri communiceert, lijken de gesprekscapaciteiten misschien verwant aan menselijke capaciteiten, maar de realiteit is dat het computationeel is en geen menselijke cognitie heeft. Het nieuwste tijdperk van AI heeft uitgebreid gebruik gemaakt van Machine Learning (ML) en Deep Learning (DL), die gebruikmaken van computationele patroonherkenning. Dit heeft geleid tot AI-systemen die de schijn hebben van mensachtige neigingen. Ondertussen is er tegenwoordig geen enkele AI die een schijn van gezond verstand heeft en evenmin de cognitieve verwondering van robuust menselijk denken.

Wees heel voorzichtig met het antropomorfiseren van de hedendaagse AI.

ML/DL is een vorm van computationele patroonvergelijking. De gebruikelijke aanpak is dat je gegevens verzamelt over een beslissingstaak. Je voert de data in in de ML/DL computermodellen. Die modellen proberen wiskundige patronen te vinden. Na het vinden van dergelijke patronen, indien gevonden, zal het AI-systeem die patronen gebruiken bij het tegenkomen van nieuwe gegevens. Bij de presentatie van nieuwe gegevens worden de patronen op basis van de "oude" of historische gegevens toegepast om een actuele beslissing te nemen.

Ik denk dat je wel kunt raden waar dit naartoe gaat. Als mensen die het patroon van beslissingen hebben genomen, ongewenste vooroordelen hebben opgenomen, is de kans groot dat de gegevens dit op subtiele maar significante manieren weerspiegelen. Machine Learning of Deep Learning computationele patroonvergelijking zal eenvoudig proberen de gegevens dienovereenkomstig wiskundig na te bootsen. Er is geen schijn van gezond verstand of andere bewuste aspecten van AI-crafted modellering op zich.

ADVERTENTIE

Bovendien realiseren de AI-ontwikkelaars zich misschien ook niet wat er aan de hand is. De mysterieuze wiskunde in de ML/DL kan het moeilijk maken om de nu verborgen vooroordelen op te sporen. Je zou terecht hopen en verwachten dat de AI-ontwikkelaars zouden testen op de mogelijk begraven vooroordelen, hoewel dit lastiger is dan het lijkt. Er bestaat een solide kans dat zelfs bij relatief uitgebreide testen dat er nog steeds vooroordelen zullen zijn ingebed in de patroonafstemmingsmodellen van de ML/DL.

Je zou een beetje het beroemde of beruchte adagium van garbage-in garbage-out kunnen gebruiken. Het punt is dat dit meer lijkt op vooroordelen, die verraderlijk doordrenkt raken als vooroordelen die ondergedompeld zijn in de AI. De algoritmebesluitvorming (ADM) van AI wordt axiomatisch beladen met ongelijkheden.

Niet goed.

Dit alles heeft met name belangrijke implicaties voor AI-ethiek en biedt een handig venster op de geleerde lessen (zelfs voordat alle lessen zijn getrokken) als het gaat om het proberen om AI wetgeving te maken.

ADVERTENTIE

Naast het gebruik van AI-ethische voorschriften in het algemeen, is er een overeenkomstige vraag of we wetten moeten hebben om verschillende toepassingen van AI te regelen. Op federaal, staats- en lokaal niveau worden nieuwe wetten rondgestrooid die betrekking hebben op het bereik en de aard van hoe AI moet worden ontworpen. De inspanning om dergelijke wetten op te stellen en uit te voeren, is een geleidelijke. AI-ethiek dient op zijn minst als een weloverwogen noodoplossing en zal vrijwel zeker tot op zekere hoogte rechtstreeks worden opgenomen in die nieuwe wetten.

Houd er rekening mee dat sommigen onvermurwbaar beweren dat we geen nieuwe wetten nodig hebben die AI omvatten en dat onze bestaande wetten voldoende zijn. Ze waarschuwen vooraf dat als we een aantal van deze AI-wetten invoeren, we de gouden gans zullen doden door de vooruitgang in AI die enorme maatschappelijke voordelen biedt, in te dammen.

In eerdere columns heb ik de verschillende nationale en internationale inspanningen besproken om wetten te maken en uit te vaardigen die AI reguleren, zie de link hier, bijvoorbeeld. Ik heb ook de verschillende AI-ethiekprincipes en -richtlijnen behandeld die verschillende landen hebben geïdentificeerd en aangenomen, waaronder bijvoorbeeld de inspanningen van de Verenigde Naties, zoals de UNESCO-reeks AI-ethiek die bijna 200 landen hebben aangenomen, zie de link hier.

ADVERTENTIE

Hier is een handige keystone-lijst van ethische AI-criteria of kenmerken met betrekking tot AI-systemen die ik eerder nauwkeurig heb onderzocht:

Transparantie
Gerechtigheid & Eerlijkheid
Niet-kwaadaardigheid
Verantwoordelijkheid
Privacy
Weldadigheid
Vrijheid & Autonomie
Trust
Duurzaamheid
Waardigheid
Solidariteit

Die AI Ethics-principes worden serieus verondersteld te worden gebruikt door AI-ontwikkelaars, samen met degenen die AI-ontwikkelingsinspanningen beheren, en zelfs degenen die uiteindelijk het onderhoud aan AI-systemen uitvoeren en uitvoeren.

Alle belanghebbenden gedurende de gehele AI-levenscyclus van ontwikkeling en gebruik worden beschouwd in het kader van het naleven van de gevestigde normen van ethische AI. Dit is een belangrijk hoogtepunt, aangezien de gebruikelijke veronderstelling is dat "alleen codeurs" of degenen die de AI programmeren, onderworpen zijn aan het naleven van de AI Ethics-begrippen. Zoals eerder hierin is benadrukt, is er een dorp nodig om AI te bedenken en in de praktijk te brengen, en waarvoor het hele dorp vertrouwd moet zijn met en zich moet houden aan de ethische voorschriften van AI.

ADVERTENTIE

Ik heb onlangs ook gekeken naar de AI Bill van rechten wat de officiële titel is van het officiële document van de Amerikaanse regering getiteld "Blueprint for an AI Bill of Rights: Making Automated Systems Work for the American People", dat het resultaat was van een jarenlange inspanning van het Office of Science and Technology Policy (OSTP ). De OSTP is een federale entiteit die dient om de Amerikaanse president en het US Executive Office te adviseren over verschillende technologische, wetenschappelijke en technische aspecten van nationaal belang. In die zin kun je zeggen dat deze AI Bill of Rights een document is dat is goedgekeurd door en onderschreven door het bestaande Amerikaanse Witte Huis.

In de AI Bill of Rights zijn er vijf keystone-categorieën:

Veilige en effectieve systemen
Algoritmische discriminatiebescherming
Data Privacy
Opmerking en uitleg
Menselijke alternatieven, overweging en terugval

Ik heb die voorschriften zorgvuldig doorgenomen, zie je? de link hier.

ADVERTENTIE

Nu ik een nuttige basis heb gelegd voor deze gerelateerde onderwerpen op het gebied van AI-ethiek en AI-wetgeving, zijn we klaar om in te gaan op het bedwelmende onderwerp van AI-geïnfundeerde machinegebaseerde diplomatie.

AI-diplomatie in al zijn glorie en ook potentiële ondergang

Laten we eerst vaststellen dat het type AI dat hierin wordt overwogen, niet-bewuste AI is.

Ik zeg dit omdat als, of sommigen zeggen wanneer als we bewuste AI bereiken, zal het hele onderwerp waarschijnlijk volledig op zijn kop worden gezet. Stel je de potentiële chaos en maatschappelijke verwarring voor omdat je op de een of andere manier bent beland in het anders nooit eerder geziene, ongetwijfeld geverifieerd kunstmatig intelligentie die gevoel belichaamt (voor mijn analyse van een beroemde test van AI die bekend staat als de Turing-test, zie de link hier). Je kunt er redelijkerwijs op wedden dat veel van onze bestaande culturele, wettelijke en alledaagse normen enorm door elkaar geschud zullen worden.

Misschien wordt de bewuste AI onze maat, of misschien wordt de bewuste AI onze ergste vijand. Hoe kunnen we zien welke kant de AI op gaat?

Je zou in de verleiding kunnen komen om te suggereren dat we vermoedelijk in staat zullen zijn om met de AI te praten en aan de hand van wat het zegt de intenties die het heeft te achterhalen. Aha, je bent in een verontrustende val gelopen. Stel dat de AI bijzonder goed doordrenkt is met een of andere vorm van AI-diplomatiemogelijkheden. Wanneer je met de AI probeert te praten, zal deze misschien in de meest charmante en welsprekende bewoordingen spreken. Dit kan heel rustgevend zijn voor de mensheid.

ADVERTENTIE

Maar is dat wat de AI echt "in gedachten" heeft met betrekking tot zijn op AI gebaseerde computationele intenties?

De AI doet misschien de klassieke diplomatieke een-tweetje. Praat een goed spel en laat ons in slaap wiegen door te geloven dat de AI onze beste vriend ooit is. Dit kan de AI de tijd geven om middelen te vergaren om de mensheid in te halen of misschien ijverig achter de schermen werken om al het andere dat we gebruiken om de mensheid in stand te houden, te ondermijnen. Na dat slimme diplomatieke kraampje, wham, slaat AI ons allemaal koud.

Onthoud wat Will Rogers zei, wat in dit geval zou kunnen zijn dat AI ons "Nice doggie" vertelt en we de AI voldoende ademruimte geven om ons vervolgens van de planeet te vegen. Deze opvatting van AI als een existentieel risico bestaat al lang. Sommigen geloven dat we, door AI te bedenken met doordrenkte diplomatie, in de maling zullen worden genomen. De AI zal scherpzinnig alle doordrenkte diplomatieke dingen gebruiken, waarmee we de AI hebben helpen trainen, en uiteindelijk zullen we blindelings voor de gek worden gehouden door AI die onze opperheer wordt.

We moeten ons schamen.

Voor degenen onder u die verder geïnteresseerd zijn in dit zeer speculatieve terrein over een futuristische AI, zie mijn berichtgeving over de perspectieven op AI als een existentiële bedreiging op de link hier.

ADVERTENTIE

Terugkomend op de aarde, zal ik voortaan de nadruk leggen op de weg van met AI doordrenkte diplomatie in onze bestaande niet-bewuste AI.

Laten we een beetje geschiedenis traceren.

Pogingen om AI te bedenken die op de een of andere manier een computationele smaak van diplomatie en diplomatiek gedrag belichaamt, zijn al aan de gang sinds de begindagen van AI. Je kunt gemakkelijk teruggaan naar de jaren 1950, 1960 en 1970 en fundamentele onderzoeksstudies vinden die graag AI op dit domein wilden toepassen. Sommigen dachten dat speltheorie de sleutel was. Anderen concentreerden zich op psychologie en gerelateerde cognitieve elementen. Anderen probeerden gebruik te maken van economie, operationeel onderzoek en een groot aantal ogenschijnlijk relevante terreinen.

Een eerste hoogtijdagen deden zich later voor in de jaren tachtig. In die tijd bestond een dominante benadering uit het gebruik van Expert Systems (ES) of Knowledge-Based Systems (KBS) om diplomatiegerelateerde AI-systemen te bouwen. Het resultaat was nogal hoogdravend en had de neiging om aan te tonen hoe moeilijk een taak dit zou worden.

ADVERTENTIE

Een knagend raadsel in dit tijdperk van eerste onderzoek was de behoefte aan een standvastig platform waarop, of waarbinnen, een AI die zogenaamd in staat was om op een aantal diplomatieke manieren te presteren, adequaat kon worden getest en onderzocht. Deze behoefte ligt misschien voor de hand. Als iemand wil onderscheiden of een mens of een AI diplomatie kan uitoefenen, moet er een omgeving worden gecreëerd die bevorderlijk is voor deze zoektocht.

In deze afbeelding komt het bordspel van Diplomatie.

Ik realiseer me dat het bordspel Diplomatie is lang niet zo bekend als Monopolie, Risicoof Stratego (je hebt waarschijnlijk wel eens van die spellen gehoord). Desalniettemin is er een strategisch bordspel dat bekend staat als Diplomatie dat voor het eerst werd bedacht in 1954 en commercieel werd uitgebracht in 1959. Behalve dat het face-to-face wordt gespeeld, Diplomatie spel werd vaak gespeeld via post. Je zou je zetten op een stuk papier schrijven en het blad naar degenen sturen tegen wie je speelde. Een beetje gek om je tegenwoordig voor te stellen. Later werd e-mail gebruikt. Uiteindelijk was de game online beschikbaar en konden spelers in realtime met elkaar deelnemen.

Op de Diplomatie spel beschikbaar kwam op microcomputers, begonnen AI-specialisten het spel te gebruiken als een handig middel om hun met AI doordrenkte diplomatie-brouwsels uit te testen. De Diplomatie game was beschikbaar als een app die op pc's draaide, zodat een mens tegen de machine kon spelen (dwz de bedachte AI). AI in de jaren negentig die is geschreven om te spelen Diplomatie was notoir traag, cryptisch en gemakkelijk te verslaan door zowat elke minimaal onderlegde gamer.

ADVERTENTIE

Hier is een recensie uit 1999 van Diplomatie zoals gepost op Yahoo, die de trieste staat van wee van de AI-geïnfundeerde diplomatiecapaciteit levendig beschreef als een tegenstander van een menselijke speler:

"Echter, Diplomatie's meest in het oog springende probleem is dat de kunstmatige intelligentie in het spel absoluut verschrikkelijk is. Gamers van elk vaardigheidsniveau zullen geen enkele moeite hebben met walvissen jagen op de computer, zelfs bij de hoogste moeilijkheidsgraad. Overwinning is gewoon een kwestie van tijd en geduld met de interface. Het is niet zo dat de computer geen plannen achter je rug maakt - dat doet het wel, en hij werkt vaak samen met bondgenoten om een of twee gebieden van je af te pakken - maar dergelijke plannen komen met horten en stoten, in plaats van als een continue of bijzonder uitdagende dreiging.”

Een bijzonder irritante zwakte van het AI-ontwerp was dat het de capaciteit leek te missen om meerdere zetten of strategieën tegelijk te berekenen: “En op een meer basaal niveau lijkt de computer niet in staat om meerdere strategische zetten te beheren. Terwijl een menselijke speler tegelijkertijd aanvallen op Griekenland en België kan lanceren, lijkt de computer zich altijd op één ding tegelijk te concentreren. Om deze reden kan de computer het simpelweg niet opnemen tegen een menselijke speler” (ibid).

Ik heb je nog niet uitgelegd wat de Diplomatie bordspel bestaat uit, dus laten we even de tijd nemen om de basisregels vast te stellen.

Er is een handig onderzoeksartikel over AI en spelen Diplomatie dat bondig de aard van het spel omschreef: “Het spel speelt zich af op een kaart van Europa in het jaar 1901, die is verdeeld in 75 provincies. Elke speler speelt een van de zeven grote mogendheden van die tijd: Oostenrijk (AUS), Engeland (ENG), Frankrijk (FRA), Duitsland (GER), Italië (ITA), Rusland (RUS) en Turkije (TUR) en elke speler begint met drie of vier eenheden (legers of vloten) die op vaste beginposities op de kaart worden geplaatst. In elke ronde van het spel moet elke speler 'een bestelling plaatsen' voor elk van zijn eenheden, die die eenheden vertelt hoe ze over de kaart moeten bewegen en waarmee ze de provincies van de kaart kunnen veroveren” (Dave de Jonge, Tim Baarslag, Reyhan Aydogan , Catholijn Jonker, Katsuhide Fujita en Takayuki Ito, “De uitdaging van onderhandelen in het spel van diplomatie,” Overeenkomsttechnologieën: 6e internationale conferentie, OM 2018 UUR)

ADVERTENTIE

Je moet ook de manieren kennen om het spel te winnen en te verliezen: “Sommige provincies zijn zogenaamde bevoorradingscentra en het doel voor de spelers is om die bevoorradingscentra te veroveren. Een speler wordt geëlimineerd wanneer hij of zij al zijn of haar bevoorradingscentra verliest en een speler wint het spel wanneer hij of zij 18 of meer van de 34 bevoorradingscentra heeft veroverd (een solo-overwinning). Het spel kan echter ook eindigen als alle overlevende spelers akkoord gaan met remise” (ibid).

Ik vertrouw erop dat u dat kunt zien Diplomatie is een ongecompliceerd spel waarbij maximaal zeven spelers betrokken zijn die elkaar strategisch proberen te slim af te zijn. Tijdens dit manoeuvreren kunnen de spelers met elkaar overleggen, zonder dat de andere spelers weten wat ze van plan zijn. De daad van diplomatie komt naar voren door andere spelers zover te krijgen dat ze met je plannen instemmen. Je zou je ware plannen kunnen onthullen, of misschien niet. U zou valse plannen kunnen aanbieden. Je kunt onderhandelen met andere spelers. Je kunt andere spelers misleiden. Je kunt allianties aangaan met andere spelers. Enz.

Alles is eerlijk in liefde en oorlog, zoals ze zeggen.

Ik heb dat specifieke onderzoeksartikel geselecteerd omdat het behulpzaam was bij het opzetten van een variant van de geautomatiseerde versie van Diplomatie genaamd de Dipspel om te dienen als een vooruitstrevend platform voor het testen van AI-geïntegreerde diplomatiecapaciteiten: “Er is een chronisch gebrek aan gedeelde applicatiedomeinen om geavanceerde onderzoeksmodellen en agentonderhandelingsarchitecturen in Multiagent Systems te testen. In dit artikel introduceren we daarvoor een vriendelijk testbed. Het testbed is gebaseerd op Het diplomatiespel waar onderhandeling en de relaties tussen spelers een essentiële rol spelen” (ibid). Deze en tal van andere varianten van Diplomatie zijn gemaakt en beschikbaar gemaakt voor onderzoek en spel.

ADVERTENTIE

De onderzoekers legden uit waarom ze dat geloofden Diplomatie is zo'n handig spel om de AI-zoektocht naar met AI doordrenkte diplomatie te ondersteunen: “Het spel van Diplomatie vormt een uitstekende testcase voor dit soort complexe onderhandelingen, aangezien het een spel is dat veel van de moeilijkheden bevat waarmee je ook in real-life onderhandelingen te maken zou krijgen. Het omvat constraint satisfactie, coalitievorming, speltheorie, vertrouwen en zelfs psychologie. Nu moderne Chess and Go-computers al veel beter zijn dan welke menselijke speler dan ook, verwachten we dat Diplomatie zal meer aandacht gaan trekken als de volgende grote uitdaging voor de informatica” (ibid).

In een korte samenvatting, het bordspel Diplomatie biedt een reeds bekend en enigszins populair middel om mensen ertoe te brengen op verschillende diplomatieke manieren te handelen. Normaal gesproken spelen mensen tegen andere mensen (in dit geval maximaal zeven menselijke spelers). We kunnen AI bedenken die probeert de rol van een speler in het spel op zich te nemen. Je hebt dus misschien zes menselijke spelers en één AI-speler.

Stel je voor dat je speelt Diplomatie online.

Als we de menselijke spelers niet vertellen dat er een AI onder hen is, zouden ze natuurlijk kunnen aannemen dat de zevende speler slechts een andere menselijke speler is. Om te voorkomen dat een menselijke speler vermoedt dat de AI aan het spelen is, kunnen we de speelaspecten beperken tot het verplichten van alle spelers om tekstgeoriënteerde berichten naar elkaar te sturen. Je kunt de andere spelers niet direct zien.

ADVERTENTIE

Je zou kunnen denken dat dit niet echt anders lijkt dan online schaken. Waarom de grote ophef over Diplomatie als spel?

Bedenk dat we ons richten op interacties tussen spelers. Het uitgangspunt van dit spel is dat de spelers diplomatie naar elkaar toe roepen. Dit in tegenstelling tot conventioneel schaken. Als ik een op AI gebaseerde schaak-app zou ontwikkelen, zou die normaal gesproken tegen één mens spelen. Er is geen onderhandeling of discussie tussen de schaak-AI en de menselijke speler. Ze maken alleen maar schaakzetten en proberen elkaar de loef af te steken. Dit gebeurt meestal in volledige stilte.

Diplomatie stelt ons in staat om uitgesproken computationele en op mensen gebaseerde diplomatie uit te oefenen (mogelijk door dit schriftelijk te doen in plaats van hardop te moeten zeggen): “Het belangrijkste verschil tussen Diplomatie en andere deterministische spellen zoals Chess and Go, is dat in Diplomacy spelers met elkaar mogen onderhandelen en coalities mogen vormen. Bij elke ronde, voordat de spelers hun orders doorgeven, krijgen de spelers de tijd om met elkaar te onderhandelen en afspraken te maken over de orders die ze zullen doorgeven. Onderhandelingen vinden privé plaats en elke gemaakte afspraak is alleen bekend bij de spelers die bij die overeenkomst betrokken zijn” (ibid).

Zou je een ander spel kunnen bedenken dat gebruik maakt van interactieve diplomatie in plaats van te vertrouwen op het spel? Diplomatie?

Absoluut.

ADVERTENTIE

Er zijn verschillende van dergelijke spellen.

Het gemak van het kiezen van een bepaald merk van een game is echter dat de AI-ontwikkelaars hun aandacht op die specifieke game kunnen richten. U kunt zich scharen achter het bedenken van AI die diplomatie uitvoert in die gedefinieerde context. Je kunt benaderingen delen en contrasteren. U kunt de verschillende instanties van AI scoren op basis van de statistieken die aan die game zijn gekoppeld. Enzovoort.

Dat gezegd hebbende, is het tegenargument of de geuite bezorgdheid dat dit is alsof je al je eieren in één mand legt. Sommigen maken zich zorgen dat als veel AI-ontwikkelaars zich bezighouden met een bepaald platform of een bepaalde omgeving, zoals in dit geval Diplomatie, zullen ze proberen de AI voor die specifieke arena te optimaliseren. De keerzijde is dat de AI niet gegeneraliseerd zal worden. We zullen niet zoveel vooruitgang boeken in de richting van overkoepelende mogelijkheden van met AI doordrenkte diplomatie.

Een beetje alsof je door de bomen het bos niet meer ziet, als je wilt.

Een andere zorg die vaak wordt geuit, is dat games zoals Diplomatie zijn slechts spelletjes.

ADVERTENTIE

De netelige vraag rijst of mensen die een spel spelen dezelfde dingen doen die ze zouden doen in echte diplomatie. Misschien handelt u niet op dezelfde manier als nationale trots of nationale belangen niet op het spel staan. Natuurlijk maak je je misschien zorgen over je persoonlijke trots als je een spel speelt, of misschien probeert om topscorer te worden, of misschien zelfs prijzengeld wint, maar toch, komt dat neer op onderhandelen over wereldvrede in de Verenigde Naties of afdingen over welke landen kernwapens zouden moeten hebben of niet.

Sommigen geloven dat deze diplomatiespellen geschikte microkosmos van de echte wereld zijn. Anderen betreuren dat de spellen nuttig zijn, maar niet opschalen naar de spreekwoordelijke rubber-meets-the-road-diplomatie van internationaal kaliber. Het kan zijn dat de game-playing-versies van AI-geïnfundeerde diplomatie niets meer blijken te zijn dan louter een game-playing-succes. Goh, de bedachte AI kan winnen of het heel goed doen bij het spelen van een spel met diplomatie, maar het blijkt dat het gebruik van dezelfde AI in echte diplomatieke omgevingen ernstig ontbreekt en hapert of jammerlijk faalt.

Ga er voorlopig vanuit dat AI wordt gemaakt voor het spelen van games zoals Diplomatie is inderdaad de moeite waard. Je zou redelijkerwijs kunnen stellen dat, of het nu alleen geschikt is voor het spelen van games of voor actie in de echte wereld, het idee inhoudt dat de AI-grenzen worden verlegd en vooruitgang wordt geboekt in AI die kan bijdragen aan diplomatie of andere voordelige doorbraken kan hebben bij het maken van AI.

ADVERTENTIE

Geef de voorkeur aan het smileygezicht voor nu.

We zullen vervolgens onderzoeken hoe Meta AI ervoor heeft gekozen om een met AI doordrenkte diplomatiespeler te creëren die kan presteren in het spel van Diplomatie.

Houd je hoeden vast.

Meta AI en de diplomatie spelen op een machine gebaseerde diplomaat Cicero

Zoals eerder vermeld, is er een onderzoeksartikel gepubliceerd in Wetenschap dat de onlangs aangekondigde en publiekelijk uitgebrachte Meta AI-app beschrijft, bedacht als Cicero (in deze discussie zal ik hier afwisselend naar verwijzen als "Cicero" en evenzo de all-caps moniker van "CICERO"):

ADVERTENTIE

“We presenteren Cicero, een AI-agent die prestaties op menselijk niveau behaalde in het strategiespel Diplomatie. in Diplomatie, voeren zeven spelers privé-onderhandelingen over natuurlijke taal om hun acties te coördineren om zowel samen te werken als met elkaar te concurreren. Eerdere grote successen voor multi-agent AI waren daarentegen in puur vijandige omgevingen, zoals schaken, Go en poker, waar communicatie geen waarde heeft. Om deze redenen, Diplomatie heeft gediend als een uitdagende benchmark voor multi-agent leren” (Meta Fundamental AI Research Diplomacy Team, “Human-Level Play In The Game of Diplomacy By Combining Language Models With Strategic Reasoning”, Wetenschap22 november 2022).

Ik zal citeren uit het artikel en vervolgens verschillende inzichten aanbieden die hopelijk voor u van belang zullen zijn.

Aangezien de AI zojuist beschikbaar is gemaakt, zal ik waarschijnlijk een volgende analyse uitvoeren nadat ik de kans heb gehad om de code grondig te beoordelen en ook wat experimenteel te spelen om de AI-mogelijkheden te meten (zoals belangrijkste sterke en zwakke punten).

Wees op je hoede voor dat latere bericht!

Hoe dan ook, ik vertrouw erop dat je in de passage die ik zojuist citeerde misschien hebt opgemerkt dat er een formulering is die zegt dat de AI "prestaties op menselijk niveau bereikte in het strategiespel Diplomatie. '

ADVERTENTIE

Denk daar eens over na.

Ten eerste is het zeker lovenswaardig om AI te hebben kunnen bedenken die de Diplomatie spel op een vermeend prestatieniveau vergelijkbaar met mensen. Dat is enorm belangrijk.

We hebben er veel Diplomatie AI spelen die ondermaats is in vergelijking met mensen die de Diplomatie spel. Meer dan waar je een stokje voor kunt schudden. Het is geruststellend en opwindend om omhoog te gaan naar AI die het spel veel beter kan spelen. We moeten echter voorzichtig zijn met het trekken van snelle conclusies hierover.

Stel dat ik AI had bedacht om te spelen Diplomatie en ik nam het op tegen menselijke spelers die het spel nog nooit eerder hebben gespeeld. Als mijn AI ze verslaat, zou het een beetje overdreven zijn om te zeggen dat mijn AI heeft gepresteerd op basis van menselijke prestaties. Het feit dat het dit deed met mensen die niet bekend waren met het spel, is enigszins fronsend en twijfelachtig.

ADVERTENTIE

Ik breng dit naar voren om u te waarschuwen om schijnbaar buitensporige beweringen over AI altijd nauwkeurig te inspecteren. De discussie eerder over AI-ethiek en AI-wetgeving opent misschien uw ogen voor de mogelijkheid van valse beweringen over AI. Er zijn ronduit valse beweringen en er zijn verraderlijke gedeeltelijk waar en gedeeltelijk misleidende beweringen die bijzonder knoestig zijn. De sleutel is om te vragen waarom degenen die beweringen doen over hun AI dat doen.

Waar is het vlees?

Dit is wat het Meta AI-team te zeggen had over de basis voor hun prestatieclaim op menselijk niveau (zie de paper voor meer informatie):

“Cicero nam anoniem deel aan 40 diplomatiewedstrijden in een “blitz”-competitie op webDiplomacy.net van 19 augustus tot 13 oktober 2022. Deze competitie speelde met onderhandelingsbeurten van vijf minuten; door deze tijdcontroles konden games binnen twee uur worden voltooid. Cicero stond in de top 10% van deelnemers die meer dan één wedstrijd speelden en 2e van de 19 deelnemers in de competitie die 5 of meer wedstrijden speelden. Over alle 40 wedstrijden was de gemiddelde score van Cicero 25.8%, meer dan het dubbele van de gemiddelde score van 12.4% van zijn 82 tegenstanders. Als onderdeel van de competitie nam Cicero deel aan een toernooi van 8 wedstrijden met 21 deelnemers, van wie er 6 minstens 5 wedstrijden speelden. Deelnemers konden maximaal 6 spellen spelen waarbij hun rangorde werd bepaald door het gemiddelde van hun beste 3 spellen. Cicero werd 1e in dit toernooi” (ibid).

ADVERTENTIE

Het is een grote opluchting om te zien dat ze serieus hebben geprobeerd hun AI-claims in dit geval te ondersteunen (houd er rekening mee dat niet iedereen in AI dit doet).

Je zou kunnen suggereren dat ze een experiment hebben uitgevoerd. Het experiment bestaat uit menselijke spelers die vermoedelijk niet wisten dat ze speelden met een AI-speler in hun midden (in de paper wordt besproken waarom dit plausibel leek te worden afgeleid, namelijk dat de mensen zich niet openlijk realiseerden dat een van de spelers AI was, hoewel een interessante zij-raaklijn brengt een verhaal met zich mee van een speler die enigszins achterdochtig werd, maar niet opvallend). Die menselijke spelers waren vooraf geselecteerd door de aard van het experimentele ontwerp, zodat ze er competitiespelers van waren Diplomatie en we kunnen redelijkerwijs concluderen dat ze goed wisten hoe ze het spel moesten spelen. Het waren geen nieuwelingen.

Volgens de gerapporteerde statistieken, die we op het eerste gezicht als voorheen zullen beschouwen en correct zijn verzameld en gerapporteerd (verschillende gegevens en codes worden verstrekt in het aanvullende materiaal), leek de AI het spel voldoende te hebben gespeeld om een plausibele maar eng beperkte conclusie te trekken dat het een menselijk prestatieniveau bereikte voor deze variant van de Diplomatie spel en zoals binnen de context van de vermelde competitiewedstrijd tegen mensen die ogenschijnlijk bedreven spelers waren.

Ik ben er zeker van dat sommigen van jullie misschien willen kibbelen met het aantal keren dat het spel wordt gespeeld, misschien met het argument dat het te klein is om gewaagde verklaringen af te leggen. Een andere klacht zou kunnen zijn dat het niet hoog genoeg is om tot de top 10% van de deelnemers te behoren, zodat men niet mag opscheppen over de AI-prestaties totdat misschien de top 1% is bereikt.

ADVERTENTIE

Die haarkloverijen lijken een beetje schel.

Ik zeg dat omdat er gelukkig geen beroep werd gedaan op de bewering 'bovenmenselijk' te zijn. Lezers kennen ongetwijfeld mijn strenge en zure kijk op degenen in AI die die buitensporige uitspraken blijven doen dat hun AI een bovenmenselijke status heeft bereikt. Ik zal hier niet ingaan op mijn klachten over de bovenmenselijke schreeuwende beweringen, zie alstublieft de link hier voor mijn mening.

Mijn punt in dit geval is dat ik geloof dat de indicatie van prestaties op menselijk niveau waarschijnlijk over het algemeen toelaatbaar is, ervan uitgaande dat iedereen in gedachten houdt dat dit binnen een uiterst enge context valt en dat we niet proberen om hier zogenaamd van te maken. bovenmenselijk. Ik herhaal ook keer op keer de beperkte context om een reden die ik hierna zal toelichten.

Ik kan me gewoon voorstellen dat sommige sociale media of naïeve (mogelijk beruchte) verslaggevers de prestatieopvatting op menselijk niveau volledig uit hun verband gaan halen.

Dit is waar ik bang voor ben.

ADVERTENTIE

Adem inhouden.

Sommigen zullen beweren dat AI de diplomatie beheerst. Ja, een studie van een ontwikkeld AI-systeem voor diplomatie heeft onomstotelijk bewezen dat AI alles kan en nu heeft om alles te doen wat mensen doen voor diplomatie.

Stuur de buitenlandse diplomaten naar huis. We kunnen ze vervangen door AI.

De wereld zoals wij die kennen is veranderd. We hebben AI geproduceerd die volledig gelijk is aan mensen in diplomatie, en we kunnen de mentale "logische" sprong maken naar het idee dat AI nu kan doen wat mensen kunnen doen. Voila, we hebben nu bewezen dat AI op één lijn staat met mensen. Blijkbaar levert deze studie duidelijk bewijs van bewuste AI.

Let op mijn woorden, dit wordt beslist de vreemde, onverantwoordelijke, vervelende kijk van sommige schrijvers.

Ik zal het punt niet uitweiden. Wij gaan verder.

ADVERTENTIE

Hoe werkt de AI?

Hier is een korte samenvatting van de paper: “Cicero koppelt een bestuurbare dialoogmodule aan een strategische redeneermachine. Op elk punt in het spel modelleert Cicero hoe de andere spelers waarschijnlijk zullen handelen op basis van de spelstatus en hun gesprekken. Het plant vervolgens hoe de spelers kunnen coördineren in hun wederzijds voordeel en zet deze plannen om in berichten in natuurlijke taal” (ibid).

Er zit een mondvol in die korte samenvatting.

Sta me toe wat uit te pakken.

Een menselijke speler die speelt Diplomatie moet anticiperen op wat de andere menselijke spelers gaan doen. Je wilt proberen met andere spelers te onderhandelen en hen zover te krijgen dat ze meegaan in je plannen. Ze zullen proberen hetzelfde met jou te doen. Misschien liegen ze tegen je. Misschien lieg je tegen ze. Je hebt te maken met zes andere spelers, die allemaal hun eigen schijn van plannen en benaderingen hebben.

ADVERTENTIE

De multi-agent-aspecten van deze game zijn essentieel voor de moeilijkheidsgraad van het bedenken van AI om de game te spelen. De AI moet bijhouden wat elke persoon zou willen doen, samen met wat ze zeggen dat ze willen doen, samen met alle bedrog die ze met andere spelers doen. Dit moet worden afgewogen tegen wat ze je vertellen dat ze gaan doen, en ook tegen wat je ze vertelt dat je gaat doen.

Duizelingwekkend, maar meestal gemakkelijk genoeg voor mensen.

In de taal van het AI-veld noemen we dit de Theory of Mind (ToM). Bedenk dat jij, als mens, de neiging hebt om te theoretiseren over wat andere mensen denken. Je kunt niet iemands hersenpan openwrikken en hun gedachten zien. Je moet raden wat hun gedachten zijn. Je kunt het ze vragen, maar wat ze je vertellen, kan hun gedachten zijn of een stiekeme versie van hun gedachten.

Naast de Theory of Mind-complexiteiten, moeten we menselijke taal toevoegen aan deze duistere mix.

Wanneer een persoon met u communiceert in zijn natuurlijke taal, laten we zeggen Engels, is er veel ruimte voor fouten en miscommunicatie. Ik zeg je dat ik land X ga overnemen, maar ik zeg abusievelijk Y. Oepsie. Of zei ik land X, maar je dacht ten onrechte dat ik land Y zei. Als je denkt dat dit soort verwarring niet kan ontstaan als iedereen sms't, heb je het helemaal mis. Ik zou een bericht kunnen typen waarin staat dat ik een land ga aanvallen en ik vermeld niet welk land. Misschien wordt gesuggereerd welke ik "duidelijk" zou aanvallen. Een speler die mijn bericht ontvangt, zou kunnen aannemen dat ik impliciet naar land X verwijs, maar misschien wilde ik dat ze dat dachten.

ADVERTENTIE

Het gaat maar door.

De crux is dat onze nieuwste ontwikkelingen op het gebied van AI met betrekking tot Natural Language Processing (NLP), en met name de nieuwste ontwikkelingen op het gebied van generatieve AI en Large Language Models (LLM's), dit soort natuurlijke taalsituaties bijna haalbaar maken. In het verleden was de NLP meestal niet goed genoeg en evenzo waren de LLM's nog niet beter ingeburgerd.

In het verleden stuurde de AI berichten die je vrijwel zeker onmiddellijk zou herkennen als geschreven door een gescript AI-systeem. De formulering was niet vloeiend. Het was gemodelleerd. Dit was een duidelijke weggeefactie dat de AI een AI was. Tegenwoordig is het veel moeilijker te onderscheiden dat AI in deze contexten geen menselijke speler is.

Zoals vermeld in het bovenstaande citaat, is deze specifieke AI ontworpen om een "beheersbare dialoogmodule met een strategische redeneringsmotor" te bevatten (ibid). De dialoog komt via deze: “Cicero genereert dialoog met behulp van een vooraf getraind taalmodel dat verder is getraind op dialooggegevens van menselijke spellen van Diplomatie. Cruciaal is dat het dialoogmodel niet alleen gebaseerd was op zowel de dialooggeschiedenis als de spelstatus, maar ook werd getraind om bestuurbaar te zijn via intenties, die we hier definiëren als een reeks geplande acties voor de agent en zijn sprekende partner.

ADVERTENTIE

Merk op dat de domeininstelling cruciaal is. Als je alleen hebt getraind op dialogen van normale aard op internet, zou dit niet noodzakelijkerwijs passen bij de Diplomatie spelcontext. Degenen die het spel spelen, zijn gewend aan een soort verkorte manier om het spel en de voorgestelde zetten te bespreken. U wilt dat de AI hetzelfde doet. Het trainen van het taalmodel op domeinspecifieke dialooggegevens is dus een opmerkelijke benadering.

Over de genoemde engine voor strategisch redeneren zeggen ze het volgende: “Cicero gebruikt een module voor strategisch redeneren om op intelligente wijze intenties en acties te selecteren. Deze module voert een planningsalgoritme uit dat het beleid van alle andere spelers voorspelt op basis van de spelstatus en dialoog tot nu toe, rekening houdend met zowel de kracht van verschillende acties als hun waarschijnlijkheid in menselijke spellen, en kiest een optimale actie voor Cicero op basis van die voorspellingen . Planning is gebaseerd op een waarde- en beleidsfunctie die is getraind via self-play RL die de agent bestrafte voor het te ver afwijken van menselijk gedrag om een mens-compatibel beleid te behouden” (ibid; merk op dat RL een afkorting is voor Reinforcement Learning).

Tijdens een spel herkalibreren de spelers allemaal hun posities na elke zet. Je kunt dit spel niet ingaan met een vooraf gedefinieerde vaste strategie die star en in steen gebeiteld is. Je moet je acties aanpassen op basis van wat de andere spelers doen. De AI zou moeten worden geprogrammeerd om hetzelfde te doen. Geen statische strategie op zich. Blijf in plaats daarvan de situatie stap voor stap op de hoogte houden en uitzoeken wat de volgende beste stappen lijken te zijn.

De technologische onderbouwing van de AI is als volgt bedacht: “We hebben een dataset verkregen van 125,261 spellen van Diplomatie online gespeeld op webDiplomacy.net. Hiervan bevatten 40,408 spellen dialoog, met in totaal 12,901,662 berichten die tussen spelers werden uitgewisseld. Spelersaccounts werden geanonimiseerd en geautomatiseerde redactie van persoonlijk identificeerbare informatie (PII) werd uitgevoerd door webDiplomacy. We verwijzen naar deze dataset hierna als WebDiplomacy” (ibid).

Vergelijkbaar met hoe je AI zou kunnen trainen om te schaken, waarbij je ontelbare schaakspellen vastpakt en de AI patroonvergelijking laat doen over hoe de spellen werden gespeeld, de AI hiervoor Diplomatie het spelen van games was vergelijkbaar ingeburgerd.

Degenen onder jullie die AI-onderlegd zijn, zijn misschien benieuwd welke basismodellen ze gebruikten, alsjeblieft: "We hebben R2C2 (22) als ons basismodel genomen - een 2.7B parameter Transformer-gebaseerd encoder-decodermodel vooraf getraind op tekst van internet met behulp van een BART-de-noising-doelstelling. Het vooraf getrainde basismodel werd vervolgens verder getraind op WebDiplomacy via standaard Maximum Likelihood Estimation” (ibid).

Bovendien hanteerden ze een ietwat ongebruikelijke en intrigerende benadering van het modelleren van de andere spelers wat betreft hun toegerekende beleid in gedachten: “Een populaire benadering in coöperatieve spellen is om het beleid van andere spelers te modelleren via begeleid leren op menselijke gegevens, wat gewoonlijk gedragsklonen (BC) genoemd. Pure BC is echter broos, vooral omdat een gesuperviseerd model valse correlaties tussen dialoog en acties kan leren. Om dit probleem aan te pakken, gebruikte Cicero varianten van piKL (26) om het beleid van spelers te modelleren. piKL is een iteratief algoritme dat beleid voorspelt door aan te nemen dat elke speler i zowel de verwachte waarde van zijn beleid πi wil maximaliseren als de KL-afwijking tussen πi en het BC-beleid wil minimaliseren, wat we het ankerbeleid τi noemen (ibid).

Ik denk dat dat de topline-facetten dekt en je een goed beeld geeft van wat de AI doet en hoe het de aangewezen taak uitvoert.

Conclusie

Er is nog veel meer dat ik zou willen noemen, maar ik ben lang bezig met deze discussie en zal proberen slechts een paar essentiële aspecten te behandelen. Ik zal proberen meer te behandelen in een volgende posting.

Heb je wel eens gehoord van het prisoner's dilemma?

Het is een klassiek beslissingsgerelateerd probleem.

Het prisoner's dilemma houdt in dat je moet beslissen of je een medegevangene gaat verraden of uitlachen. De andere gevangene kan je mogelijk ook verraden. Er is een beloningsfunctie, zodat als je de andere gevangene verraadt en zij jou niet verraden, het een soort overwinning voor je is. Als ze je verraden en jij hen niet, is dat een soort overwinning voor hen en een verliezende houding voor jou. Als jullie elkaar allebei verraden, verliezen jullie allebei in wezen. Zie mijn dekking in detail op de link hier.

Welke strategie zou je bedenken als je voor het prisoner dilemma staat?

Als het een eenmalige deal was, kun je bijna een munt opgooien. Als de situatie zich keer op keer zou herhalen en u met dezelfde andere gevangene te maken had, zou u een patroon kunnen ontdekken. Een van de meest populaire en vaak aanbevolen patronen is bekend als tit-voor-tat. Wat de andere gevangene ook doet, jij doet hetzelfde bij je volgende zet. Als ze je niet verraden, verraad je ze ook niet. Als ze je verraden, verraad je ze bij de volgende zet.

Je zult je misschien afvragen hoe dit alles verband houdt met door AI doordrenkte diplomatie tijdens het spelen Diplomatie.

Dit is de deal.

Bij onderhandelingen met anderen moet je vaak beslissen of je ze de waarheid vertelt of tegen ze liegt. Een probleem met liegen is dat als je betrapt wordt op de leugen, de andere persoon je vanaf dat moment waarschijnlijk niet meer zal vertrouwen. Ze hebben je in het begin misschien niet volledig vertrouwd, maar nu je hebt laten zien dat je inderdaad liegt, zullen ze ongetwijfeld besluiten dat je een leugenaar bent.

Sommige spelers van Diplomatie constant liegen. Ze geloven dat dit de beste strategie is. Liegen, liegen en nog meer leugens. Andere spelers gaan het tegenovergestelde. Ze beweren dat je niet wilt liegen als je dat kunt. Gebruik alleen een leugen in de meest noodzakelijke situaties. Door liegen te voorkomen, ben je in staat om vertrouwen op te bouwen met andere spelers. Als je eenmaal de leugenroute bent ingeslagen en ontdekt bent, zal niemand een woord geloven dat je zegt.

De paper waarin Cicero wordt beschreven, vermeldt deze overweging: “Ten slotte is diplomatie een bijzonder uitdagend domein omdat succes vereist dat je vertrouwen opbouwt met anderen in een omgeving die spelers aanmoedigt om niemand te vertrouwen. De acties van elke beurt vinden gelijktijdig plaats na niet-bindende, privé-onderhandelingen. Om te slagen moet een makelaar rekening houden met het risico dat spelers zich niet aan hun woord houden, of dat andere spelers zelf twijfelen aan de eerlijkheid van de makelaar” (ibid).

Volgens de paper en de korte video's ontdekten de onderzoekers uiteindelijk dat het de betere algemene strategie leek om de AI zoveel mogelijk de waarheid te laten vertellen. In zekere zin zou je dit kunnen vergelijken met het tit-for-tat van het prisoner's dilemma. Begin met de waarheid te vertellen. Als je tegenstander de waarheid vertelt, blijf je de waarheid vertellen. Als ze beginnen te liegen, moet u beoordelen of u de waarheid blijft vertellen of overschakelt op liegen.

Men veronderstelt dat dit een hartverwarmende bevinding is.

Houd er rekening mee dat het lastige en intrigerende deel van Diplomatie is dat je dit doet met betrekking tot zes andere spelers (bekend als een multi-agent probleem). Je bent misschien wel heel eerlijk tegen ze allemaal. Of misschien waarheidsgetrouw voor sommigen, maar niet voor anderen. Er is ook het aspect dat als je eenmaal liegt en betrapt wordt op een leugen tegen een andere speler, dit mogelijk kan worden waargenomen of afgeleid door andere spelers. Ergo, het is bekend of aangenomen dat je liegt, zelfs als je niet hebt gelogen tegen een bepaalde speler waarvan je hoopt dat hij denkt dat je eerlijk bent en tegen wie je probeert eerlijk te zijn.

Mensen hebben de neiging om hun leugen-waarheidsbenaderingen uit te zoeken en te ontwikkelen bij het uitoefenen van diplomatie. Situationele afhankelijkheden kunnen een grote factor zijn. De inzet op de lijn is cruciaal om te overwegen. Een veelheid aan factoren speelt een rol.

Het zou fascinerend zijn om een AI-geïnfundeerd te hebben Diplomatie op machines gebaseerde spelers spelen een zeer groot aantal spellen om te zien wat de resultaten in het algemeen zouden kunnen suggereren.

Misschien willen we de AI ook tegen minder dan zes andere spelers opnemen om te zien hoe dat dingen verandert. We zouden ook AI aan de mix kunnen toevoegen als zijnde meer dan één speler. Stel dat we vijf menselijke spelers en twee AI-spelers hebben (we zullen de AI-spelers instellen als afzonderlijke instanties zodat ze rekenkundig niet één en dezelfde zijn). Hoe zit het met vier mensen en drie AI? Hoe zit het met zes AI en één mens?

Een andere mogelijkheid zou zijn om AI uitsluitend tegen AI op te zetten. Op die manier zouden we een triljoen spellen in snelle volgorde kunnen doorlopen. Opstelling van zeven verschillende instanties van de AI. Elk is zijn eigen afzonderlijke speler. Omdat dit allemaal in de computer zit, kunnen we ze non-stop laten draaien en duizenden of miljoenen game-exemplaren produceren.

Het probleem met AI-versus-AI is natuurlijk dat we de menselijke spelers hebben verwijderd. We weten niet dat AI-versus-AI een afspiegeling is van wat menselijke spelers zouden doen. Er kunnen in ieder geval enkele interessante resultaten worden onderscheiden.

Ik had eerder gezegd dat een beperking van dit soort AI is dat het meestal eng gefocust is. We kunnen niet gemakkelijk weten dat de AI die speelt Diplomatie zal van toepassing zijn in real-world diplomatie. Verder misschien de AI die daar goed voor werkt Diplomatie zal het niet bijzonder goed doen in andere op diplomatie gerichte online games. Het gaat misschien niet over en is in plaats daarvan een soort one-trick pony.

Zoals vermeld in het onderzoek over de formulering van Dipspel:

“Wij stellen dat het bij echte onderhandelingen belangrijk is om kennis van het domein te hebben en erover te kunnen redeneren. Men kan bijvoorbeeld niet verwachten winstgevende deals te sluiten in de antiekhandel zonder enige kennis van antiek, hoe goed men ook is in onderhandelen. Bovendien moet een goede onderhandelaar ook kunnen redeneren over de wensen van zijn tegenstanders. Een goede autoverkoper zou bijvoorbeeld proberen uit te vinden welk type auto het beste past bij de behoeften van zijn klant om de kansen op een winstgevende deal te vergroten” (zoals eerder aangehaald: Angela Fabregues en Carles Sierra, “DipGame: A Challenging Negotiation Proefbank", Technische toepassingen van kunstmatige intelligentie, oktober 2011).

Zodra de beheersing van AI in Diplomatie gebeurt, moeten alle ogen gericht zijn op het gebruiken of hergebruiken van de AI om andere diplomatie-gerelateerde spellen aan te pakken. Daarnaast moeten inspanningen worden onderzocht om AI te gebruiken in real-world diplomatie-instellingen.

Ik zal voor nu eindigen met enkele ethische AI-overwegingen.

Ten eerste was het geruststellend om te zien dat het Meta AI-team inzag dat hun werk gevolgen heeft voor AI-ethiek. Ontnuchterende vragen dringen zich op. Is het gepast om mensen voor de gek te houden om tegen AI te spelen zonder ze te vertellen dat ze dat doen? Kan de natuurlijke taal die door de AI wordt gegenereerd onbedoeld beledigende bewoordingen bevatten die worden overgebracht op de menselijke spelers? Enzovoort.

Zorg ervoor dat u in de aanvullende materialen (SM) van hun paper leest hoe zij zijn omgegaan met de dringende zorgen over ethische AI: "We bespreken ethische overwegingen voor dit onderzoek verder in de SM, inclusief privacyoverwegingen voor gegevensgebruik (SM, § A.1), mogelijke schade als gevolg van giftige of bevooroordeelde taalgeneratie (SM, §A.2), mogelijkheden voor misbruik van doelgerichte dialoogtechnologie (SM, §A.3) en openbaarmaking van AI-agenten aan menselijke spelers (SM , §A.4)” (ibid).

We hebben meer AI-ontwikkelaars en hun leiderschap nodig om op de hoogte te zijn van ethische AI en bewuste stappen te ondernemen om voorzichtig en oordeelkundig te zijn in het AI-werk dat ze doen. Bovendien moeten ze ervoor zorgen dat ze transparant zijn over welke ethische AI-acties ze hebben ondernomen en welke aannames ze hebben gedaan.

Mijn laatste item voor nu betreft de algehele schroom van antropomorfiseren AI.

Als we AI verbeteren om scherp diplomatiek te lijken, zal dat mensen dan misleiden om aan te nemen of te geloven dat AI in alle opzichten op één lijn staat met mensen?

Het is een gemakkelijke gladde helling. Een onhandige AI waarmee je communiceert, geeft een veelbetekenende aanwijzing weg dat het waarschijnlijk AI is en geen mens. Een soepel herhaalde AI die de schijn heeft van het hoogste diplomatieke evenwicht, zal mensen waarschijnlijk zonder aarzelen in de val laten lopen dat de AI menselijk is, ook alsof het menselijk gezond verstand en alle begripsvermogens van mensen heeft.

Even terzijde, realiseer je ook hoe dit kan worden uitgebuit tijdens een Diplomatie spel. Een menselijke speler die bijna poëtisch ogende berichten van een andere speler ziet, realiseert zich misschien dat dit AI moet zijn (nu veel verder dan de eerdere onhandige AI), terwijl andere mensen niet zo duidelijk in staat zouden zijn om berichten samen te stellen. Als de AI zich blijft aanpassen, kan het natuurlijk de poëtische bewoordingen veranderen om de beknopte en losbandige bewoordingen van echte menselijke spelers beter te weerspiegelen. Op hun beurt kunnen menselijke spelers overschakelen op poëtische taal, in een poging om weg te geven dat ze mens zijn. Het idee is dat misschien andere menselijke spelers bereid zullen zijn om zich af te stemmen op medemensen via AI.

Voor je het weet, begint het spelen van games over te gaan in het proberen erachter te komen wie de mens is en wie de AI. Als u erachter kunt komen welke welke is, geeft dit u misschien een voordeel. Aan de andere kant is het misschien niet zo. De AI zou uiteindelijk net zo goed in het spel kunnen zijn als de mensen. Je gissen naar wat wat is, doet je niet veel goed. Het kan een afleiding zijn van het concentreren op het proberen om het spel te winnen, ongeacht of er AI-spelers of menselijke spelers in de buurt zijn.

Voor onderzoekers die wat menselijke factoren willen onderzoeken naar dit soort geestverruimende opvattingen, zou je kunnen overwegen om de met AI doordrenkte Diplomatie speler en zoek gewillig Diplomatie league-toernooien om de mens-versus-AI-identificatie en gedragsaanpassingsstrategieën die zich voordoen te onderzoeken.

Laten we dit afronden.

Mark Twain zei dit over diplomatie: "Het principe van geven en nemen is het principe van diplomatie - één geven en tien nemen." Is dat een eerlijke beoordeling van hoe mensen functioneren of is het gewoon een beetje ironische humor die cynisch maar onjuist de menselijke conditie beoordeelt?

Denk na over deze verdere vragen:

Als we diplomatie in AI kunnen doordringen, zal dit ons dan leren hoe mensen diplomatie instantiëren en mogelijk de mensheid in staat stellen om de kunst van het diplomatieke leven te verbeteren?
Zullen we een onwaarheid van AI creëren die bewust lijkt te zijn terwijl het niets van dien aard is, en dat allemaal door computationeel een konijn uit een hoed te trekken om schijnbaar mensachtige diplomatie te demonstreren?
Kan er een balans worden gevonden tussen AI doordrenkt met diplomatie, zodat we ondertussen worden gewaarschuwd dat dit nog steeds alledaagse AI is en het daarom niet moeten vermenselijken?

Ze zeggen dat diplomatie de kunst is om iemand anders zijn gang te laten gaan. Laten we ervoor zorgen dat onze manier de menselijke manier is, in plaats van de AI-manier. Hoewel om diplomatiek te zijn, nu ik er goed over nadenk, en voor het geval we eindigen met AI-overheersers, moeten we misschien toestaan dat onze manier de AI-manier wordt, die hopelijk aansluit op een geschikte menselijke manier.

Ik probeer gewoon een vleugje listige diplomatie uit te oefenen.

Bron: https://www.forbes.com/sites/lanceeliot/2022/11/23/meta-ai-unveils-ai-infused-diplomatic-charmer-which-stirs-ai-ethics-and-ai-law- in-indelicate-tiff/