Midjourney-oprichter David Holz over de impact van AI op kunst, verbeelding en de creatieve economie

halverwege de reis is een van de belangrijkste aanjagers van de opkomende technologie om kunstmatige intelligentie (AI) te gebruiken om visuele beelden te creëren op basis van tekstprompts. De in San Francisco gevestigde startup maakte onlangs nieuws als de motor achter het kunstwerk dat een prijs won in een eerlijke wedstrijd in de staat Colorado, en dat is waarschijnlijk niet het laatste gecompliceerde probleem waarmee AI-kunst de komende jaren te maken zal krijgen.

Midjourney onderscheidt zich van anderen in de ruimte door de nadruk te leggen op de schilderkunstige esthetiek in de beelden die het produceert. Het platform probeert geen fotorealistische afbeeldingen te maken die kunnen worden aangezien voor foto's, en CEO David Holz zegt dat hij persoonlijk erg ongemakkelijk is over de griezelige kwaliteit van deepfakes en ander werk dat de werkelijkheid te nauwkeurig nabootst. In plaats daarvan zegt Holz dat Midjourney is ontworpen om de creativiteit van gewone mensen te ontsluiten door ze tools te geven om prachtige foto's te maken door ze gewoon te beschrijven.

Maar ondanks de humanistische, consumentgerichte focus van het bedrijf, zijn er onvermijdelijke vragen over de implicaties voor commerciële kunst en professionele kunstenaars. Ik interviewde Holz voor een breder stuk over de mogelijke verstoringen die AI-kunst waarschijnlijk zal veroorzaken bij de productie van afbeeldingen voor entertainment, videogames en uitgeverijen. Hier is een langer fragment uit ons gesprek waarin Holz meer diepgang en context geeft terwijl hij deze problemen aanpakt en zijn visie op het bedrijf, de industrie en de technologie uiteenzet. Het interview is bewerkt voor lengte en duidelijkheid.

Rob Salkowitz, Forbes-bijdrager: Wat is uw rol en titel?

David Holz, Midreis. Ik ben de oprichter en CEO. Meestal word ik echter liever de oprichter genoemd, omdat CEO erg zakelijk klinkt, en wij zijn niet erg zakelijk. Wij zijn een toegepast onderzoekslab dat producten maakt.

Wat is de missie van Midjourney?

We zeggen graag dat we proberen de verbeeldingskracht van de menselijke soort uit te breiden. Het doel is om mensen fantasierijker te maken, niet om fantasierijke machines te maken, wat volgens mij een belangrijk onderscheid is.

Kunt u een korte geschiedenis van het bedrijf tot nu toe geven?

Ongeveer anderhalf jaar geleden zijn we begonnen met het verbeeldingsgedeelte van ons bedrijf. Er waren enkele doorbraken in diffusiemodellen, mensen die clip, openAI, dat soort dingen begrepen. Bijna iedereen die hierbij betrokken is, is San Francisco en we realiseerden ons allemaal dat dit serieus gaat worden, dat het anders is dan veel andere dingen.

Wat ziet Midjourney als het voordeel van deze tekst-naar-beeldtechnologie voor het bedrijfsleven en de samenleving?

Ik ben zeker meer bezorgd over de samenleving dan over het bedrijfsleven. We zijn een consumentenproduct, maar misschien is 30%-50% van onze gebruikers op dit moment professionals. De meerderheid is dat niet. Kunstenaars op het platform vertellen ons dat ze in het begin creatiever en onderzoekender kunnen zijn en in korte tijd met veel ideeën kunnen komen.

Op dit moment gebruiken onze professionele gebruikers het platform voor concepting. Het moeilijkste van [een commercieel kunstproject] is vaak aan het begin, wanneer de belanghebbende niet weet wat hij wil en ideeën moet zien om op te reageren. Midjourney kan mensen helpen om veel sneller samen te komen tot het idee dat ze willen, omdat het erg arbeidsintensief is om op die concepten te herhalen.

Een ander voordeel voor kunstenaars is dat het mensen vertrouwen geeft op gebieden waar ze geen vertrouwen in hebben. De meeste, zo niet alle kunstenaars hebben het gevoel dat er een deel van de kunst is dat ze niet goed kunnen. Het kunnen kleuren, compositie, achtergronden zijn. We hebben een beroemde personageontwerper die ons product gebruikt en mensen vragen hem waarom je een AI zou gebruiken, aangezien je al zo goed bent. En hij zei: 'Nou, ik ben alleen goed in het karaktergedeelte. Dit helpt me met de rest, de wereld, de achtergrond, de kleurenschema's.”

Hoeveel mensen gebruiken het product ongeveer?

Miljoenen gebruiken het. Onze Discord is meer dan twee miljoen. Het is nu veruit de grootste actieve Discord-server.

Staat de licentie van Midjourney commercieel gebruik toe van door het platform gegenereerde afbeeldingen?

Ja. Maar als u werkt voor een bedrijf met een jaarlijkse omzet van meer dan een miljoen dollar, vragen we u een bedrijfslicentie te kopen.

Hoe is de dataset opgebouwd?

Het is gewoon een grote schram van het internet. We gebruiken de open datasets die worden gepubliceerd en trainen daar overheen. En ik zou zeggen dat dit iets is dat 100% van de mensen doet. We waren niet kieskeurig. De wetenschap evolueert echt snel in termen van hoeveel gegevens je echt nodig hebt, versus de kwaliteit van het model. Het zal een paar jaar duren om dingen echt uit te zoeken, en tegen die tijd heb je misschien modellen die je met bijna niets traint. Niemand weet echt wat ze kunnen.

Heb je toestemming gevraagd aan levende kunstenaars of werk waarop copyright rust?

Nee. Er is niet echt een manier om honderd miljoen afbeeldingen te krijgen en te weten waar ze vandaan komen. Het zou cool zijn als afbeeldingen metadata bevatten over de eigenaar van het auteursrecht of zoiets. Maar dat is niets; er is geen register. Er is geen manier om een ​​foto op internet te vinden en deze dan automatisch te traceren naar een eigenaar en dan iets te doen om het te authenticeren.

Kunnen artiesten ervoor kiezen om niet opgenomen te worden in uw datatrainingsmodel?

Daar kijken we naar. De uitdaging is nu om erachter te komen wat de regels zijn en hoe je erachter kunt komen of iemand echt de kunstenaar is van een bepaald werk of gewoon zijn naam erop zet. We zijn nog niemand tegengekomen die wil dat zijn naam uit de dataset wordt gehaald.

Kunnen artiesten ervoor kiezen om niet genoemd te worden in prompts?

Niet nu. Daar kijken we naar. Nogmaals, we zouden een manier moeten vinden om die verzoeken te verifiëren, wat ingewikkeld kan worden.

Wat zeg je tegen commerciële artiesten die bang zijn dat dit hun levensonderhoud zal vernietigen? Waarom zou een artdirector op een gegeven moment een illustrator inhuren om werk te produceren zoals concept art, production design, achtergronden - dat soort dingen - als ze gewoon prompts kunnen invoeren en veel sneller en tegen veel lagere kosten bruikbare output kunnen krijgen?

Het is nog veel werk. Het is niet zomaar 'maak me een achtergrond'. Het is misschien tien keer minder werk, maar het is veel meer werk dan een manager gaat doen.

Ik denk dat dit op twee manieren kan gaan. Een manier is om te proberen hetzelfde niveau van inhoud te bieden dat mensen consumeren tegen een lagere prijs, toch? En de andere manier om dit te doen, is door enorm betere inhoud te bouwen tegen de prijzen die we al bereid zijn te besteden. Ik merk dat de meeste mensen, als ze al geld uitgeven, en je hebt de keuze tussen enorm betere inhoud of goedkopere inhoud, eigenlijk een enorm betere inhoud kiezen. De markt heeft al een prijs vastgesteld die mensen bereid zijn te betalen.

Ik denk dat sommige mensen zullen proberen artiesten uit te sluiten. Ze zullen proberen iets soortgelijks te maken tegen lagere kosten, en ik denk dat ze zullen falen in de markt. Ik denk dat de markt naar een hogere kwaliteit, meer creativiteit en veel geavanceerdere, diversere en diepere inhoud zal gaan. En de mensen die daadwerkelijk kunnen gebruiken zoals de artiesten en de tools gebruiken om dat te doen, zijn degenen die gaan winnen.

Deze technologieën creëren in feite een veel diepere waardering en geletterdheid in het visuele medium. Misschien heb je echt de vraag, overtreft je het vermogen om op dat niveau te produceren, en dan verhoog je misschien de salarissen van artiesten. Het kan raar zijn, maar dat is wat er gaat gebeuren. Het tempo van die toename van de vraag naar zowel kwaliteit als diversiteit zal ertoe leiden dat er prachtige en onverwachte projecten worden gerealiseerd.

Een generatie studenten studeerde af aan kunstacademies, velen van hen met zware schulden, rekenend op relatief goedbetaalde banen in entertainmentproductie, videogameproductie, commerciële kunst enzovoort. Hoe beïnvloedt de opkomst van AI-tekst-naar-beeldplatforms hun toekomst?

Ik denk dat sommige mensen zullen proberen om kosten te besparen, en sommige mensen zullen proberen hun ambities uit te breiden. Ik denk dat de mensen die ambities uitbreiden nog steeds dezelfde salarissen zullen betalen, en de mensen die proberen om kosten te besparen, zullen denk ik falen.

Ai wordt meestal op grote schaal gebruikt voor zaken als callcenters of het inchecken van bagage op luchthavens en het soort werk dat mensen niet echt willen doen. En de waardepropositie is dat het mensen de vrijheid geeft om meer lonende, interessantere soorten banen te doen. Maar kunstbanen zijn lonend en interessant. Mensen werken hun hele leven en ontwikkelen hun vaardigheden om dit soort banen te krijgen. Waarom zou je deze technologie op dat niveau van de economie richten als een soort zakelijke focus en prioriteit voor de dingen die je doet?

Persoonlijk ben ik dat niet. Mijn spullen zijn niet gemaakt voor professionele artiesten. Als ze het leuk vinden om het te gebruiken, dan is dat geweldig. Mijn spullen zijn gemaakt voor mensen die, zoals, er is een vrouw in Hong Kong, en ze kwam naar me toe, en ze zegt: "Het enige in Hong Kong dat je ouders nooit willen dat je bent, is een artiest, en ik' ben nu een bankier. Ik leid een goed bankiersleven. Maar met Midjourney begin ik nu echt een voorproefje te krijgen van deze ervaring van de persoon te zijn die ik eigenlijk wilde zijn.” Of een man bij de truckstop die zijn eigen honkbalkaarten maakt met wilde afbeeldingen, gewoon voor de lol. Het is gemaakt voor die mensen, omdat ze, zoals de meeste mensen, deze dingen nooit kunnen doen.

Het is belangrijk om te benadrukken dat het hier niet om kunst gaat. Dit gaat over verbeelding. Verbeelding wordt soms gebruikt voor kunst, maar vaak niet. De meeste afbeeldingen die op Midjourney zijn gemaakt, worden niet professioneel gebruikt. Ze worden niet eens gedeeld. Ze worden gewoon gebruikt voor deze andere doeleinden, deze zeer menselijke behoeften.

Toch is de output van uw product beeldspraak, die naast al die andere eigenschappen ook commerciële waarde heeft in de professionele context. En dit is zeer ontwrichtend voor die economie.

Ik denk dat het is alsof we een boot maken, en iemand kan met de boot racen, maar dat betekent niet dat de boot over racen gaat. Als je de boot gebruikt om te racen, dan misschien, ja, zeker. Op dat moment is het. Maar de menselijke kant is echt belangrijk, en ik denk dat we niet... We willen foto's er mooi uit laten zien. We zien onszelf niet als een poging om kunst te creëren als onderdeel van ons ding. We willen dat de wereld fantasierijker wordt. We maken liever mooie dingen dan lelijke dingen.

Gelooft u dat een overheidsinstantie jurisdictie of bevoegdheid heeft om deze technologie te reguleren? En zo ja, denk je dat ze dat zouden moeten doen?

Ik weet het niet. Regelgeving is interessant. Je moet de vrijheid om iets te doen in evenwicht brengen met de vrijheid om beschermd te worden. De technologie zelf is niet het probleem. Het is als water. Water kan gevaarlijk zijn, je kunt erin verdrinken. Maar het is ook essentieel. We willen water niet verbieden alleen maar om de gevaarlijke delen te vermijden.

Wel, we willen er zeker van zijn dat ons water schoon is.

Ja dat is waar.

Bron: https://www.forbes.com/sites/robsalkowitz/2022/09/16/midjourney-founder-david-holz-on-the-impact-of-ai-on-art-imagination-and-the- creatieve economie/