Een blik op de nieuwe Al Generative Art

Al generatieve kunst is een vorm van kunst, in de meeste gevallen visueel, die gebaseerd is op samenwerking tussen een mens en een autonoom systeem. Een "autonoom systeem" wordt gedefinieerd als een Artificial Intelligence software, algoritme of model dat in staat is om complexe bewerkingen uit te voeren zonder tussenkomst van een programmeur.

Van de bizarre juxtaposities van afbeeldingen gemaakt door Dall-E mini aan de NFT markt, dringen beelden die zijn gegenereerd door AI-algoritmen steeds meer de mainstream verbeelding binnen. In feite zijn er twee belangrijke projecten over dit onderwerp die het waard zijn om geanalyseerd te worden: halverwege de reis en DALL-E2.

Natuurlijk heeft het nieuws ook zijn weg gevonden naar Twitter. Onder meer Charles Hoskinson geeft er commentaar op, die schreef:

AI gegenereerde kunst. Ik heb deze foto in een paar minuten kunnen maken. Ik kan me niet voorstellen hoe opmerkelijk deze technologie over 3 jaar zal zijn pic.twitter.com/jOToCZj7ki
- Charles Hoskinson (@IOHK_Charles) 1 februari 2023

Al generatieve kunst: vroege experimenten en functies

Nu we hebben begrepen wat generatieve kunst is, is het belangrijk om een van de grondbeginselen ervan te benadrukken: willekeurigheid. Dat is een fundamentele eigenschap van generatieve kunst.

Afhankelijk van het type software is het autonome systeem in feite in staat om resultaten te verwerken die altijd verschillend en uniek zijn elke keer dat de opdracht genereren wordt uitgevoerd, of het kan een variabel aantal resultaten retourneren als reactie op gebruikersinvoer.

De eerste experimenten in generatieve kunst dateren uit de jaren zestig met de experimenten van Harold Cohen en zijn AARON programma. Cohen gebruikte voor het eerst stand-alone software om abstracte kunstwerken te genereren die waren geïnspireerd op Pop Art-zeefdrukken. Cohen's werken zijn nu te zien in de Tate Gallery in Londen.

Een ander kenmerk van Generative Art, maar een dat steeds minder een voorrecht is, is de herhaling van patronen of abstracte elementen die door de programmeur worden aangeleverd en in de softwarecode worden geïmplementeerd.

Bovendien heeft de ontwikkeling van steeds complexere neurale netwerken die werken op tekst-beeldassociatie de ontwikkeling mogelijk gemaakt van generatieve modellen die in staat zijn steeds realistischere en nauwkeurigere afbeeldingen te creëren. Het bekendste voorbeeld van deze categorie generatieve kunst is Plaat.

Dall-E is een multimodaal neuraal netwerk gebaseerd op de GPT-3 deep learning-model van OpenAI, hetzelfde bedrijf dat zich ook recentelijk heeft ontwikkeld ChatGPT, de chatbot gelanceerd in november 2022 en geoptimaliseerd met "onder toezicht" en versterkende leertechnieken.

Terugkerend naar Dall-E, zien we dat dit systeem in staat is om afbeeldingen te genereren uit een tekstuele beschrijving, genaamd a "snel," gebaseerd op een dataset van tekst-beeldparen.

De eerste versie van Dall-E, die in januari 2021 aan het publiek werd gepresenteerd en het voorrecht bleef van een klein aantal professionals in het veld, vertegenwoordigde een echte revolutie in termen van dit soort generatieve modellen en overtrof de innovaties van GPT- 3 zelf.

Ook van belang is het feit dat de nauwkeurigheid van de door Dall-E verwerkte resultaten de perfecte ruimte bleek te zijn voor een andere OpenAI-oplossing: CLIP (Contrastieve Taal-Beeld Pre-training).

Een neuraal netwerk voor het classificeren en rangschikken van afbeeldingen, getraind op basis van tekst-beeldassociaties, zoals bijschriften die op internet zijn gevonden. Dankzij de tussenkomst van CLIP, waardoor het aantal resultaten dat per prompt aan de gebruiker wordt voorgesteld, wordt teruggebracht tot 32, bleek Dall-E in de meeste gevallen bevredigende afbeeldingen te retourneren.

Midjourney: ontwerp, menselijke infrastructuur en kunstmatige intelligentie

Als verwacht, halverwege de reis is een belangrijk project dat deel uitmaakt van het opkomende Al Generative Art-concept. Midjourney is met name een onafhankelijk onderzoekslaboratorium dat nieuwe manieren van denken verkent en de verbeeldingskracht van de menselijke soort uitbreidt.

Het gebruik ervan is eenvoudig: er moet eerst een account op worden aangemaakt Discord, een platform dat verschillende communities host, waar Midjourney er een van is. Binnen de applicatie zijn de verschillende chatrooms waarin men al dan niet actief kan deelnemen aan discussies.

Het is belangrijk om erop te wijzen dat om kunstmatige intelligentie voor de eerste keer te gebruiken, men naar de "nieuwelingen" kanalen, waar 25 gratis weergaven beschikbaar.

Eén weergave komt overeen met het genereren van vier verschillende varianten die zijn gegenereerd op basis van dezelfde tekstuele invoer.

De 25 weergaven verwijzen dus naar 25 verwerkingstaken die door de Midjourney-bot zijn uitgevoerd. Bijgevolg vereist het genereren van de afbeelding interactie met de Midjourney-bot via een sms-bericht dat een "prompt" wordt genoemd, waarin trefwoorden de afbeelding beschrijven die de gebruiker in gedachten heeft.

U kunt zoveel details toevoegen als u wilt, het belangrijkste is om de trefwoorden te scheiden met een komma. Zodra de weergave is voltooid, retourneert de computer vier verschillende afbeeldingen op basis van de beschrijvingen om uit te kiezen.

Bovendien kunt u, als het programma klaar is met renderen, uw voorkeuren aan de hand van de afbeeldingen doorgeven en desgewenst nog eens vier versies laten genereren.

DALL-E 2: het nieuwe AI-systeem voor kunstwerken

Naast Midjourney is DALL-E 2 ook het nieuwe AI-systeem dat realistische afbeeldingen en kunstwerken kan creëren vanuit een natuurlijke taalbeschrijving. Niet alleen dat, DALL-E 2 kan ook concepten, attributen en stijlen combineren.

De kracht van het nieuwe AI-systeem ligt ook in het kunnen uitbreiden van afbeeldingen die verder gaan dan wat zich op het originele canvas bevindt, waardoor ze ontstaan nieuwe uitgebreide composities. Bovendien kan het realistische wijzigingen aanbrengen in bestaande afbeeldingen vanuit een onderschrift in natuurlijke taal en kan het elementen toevoegen en verwijderen, rekening houdend met schaduwen, reflecties en texturen.

De mogelijkheden van de DALL-E 2 omvatten ook het maken van een afbeelding en het maken van verschillende variaties daarop, geïnspireerd op het origineel. DALL-E 2 heeft de relatie geleerd tussen afbeeldingen en de tekst die wordt gebruikt om ze te beschrijven.

Het maakt gebruik van een proces genaamd "verspreiding", die begint met een patroon van willekeurige stippen en dat patroon geleidelijk verandert in de richting van een afbeelding wanneer het specifieke aspecten van die afbeelding herkent.

Dus nadat OpenAI DALL-E in januari 2021 introduceerde, genereert nu het nieuwste systeem, DALL-E 2, realistischere en nauwkeurigere beelden met vier keer de resolutie.

DALL-E 2 begon als een onderzoeksproject en is nu beschikbaar als een beta versie. Beveiligingsbeperkingen die het systeem heeft ontwikkeld en voortdurend verbetert, zijn onder andere: beperking van het vermogen van het systeem om gewelddadige, haatdragende of volwassen beelden te genereren, en op leren gebaseerde gefaseerde implementatie.

Bron: https://en.cryptonomist.ch/2023/02/02/ai-generative-art/