Wat de nieuwe tekst-naar-3D-middelen van Nvidia betekenen voor engineering en productontwerp

tl; Dr.: Generatieve AI evolueert in een opwindend tempo. Het nieuwste algoritme van Nvidia zet tekst twee keer zo snel om in 3D-mesh als projecten die amper 2 maanden geleden werden gepubliceerd. Dit betekent dat de technische mogelijkheden ons vermogen om ermee te werken nu al te boven gaan.

De laatste weken papier door Nvidia-wetenschappers hebben de exponentiële snelheid aangetoond waarmee de generatieve AI-ruimte evolueert. Deze explosie van activiteit – vooral zichtbaar in de afgelopen 9 maanden – zal een impact hebben op elk onderdeel van het leven, niet in de laatste plaats op productontwerp, engineering en productie. De veranderingen zullen de industrie bevrijden van structurele beperkingen in de manier waarop ideeën worden gecommuniceerd, snellere innovatiecycli mogelijk maken en uiteindelijk in staat stellen haar duurzaamheidsbeloften waar te maken.

Na jarenlang te hebben gehoord dat AI de manier waarop we werken fundamenteel zou veranderen, verwachtten maar weinigen dat de creatieve sector een van de eerste slachtoffers zou zijn. De komst van de mensachtige tekstgenerator van GPT-3 in 2020 bracht de mogelijkheden scherper in beeld. Sindsdien is het een wilde rit geweest: DALL-E (tekst-naar-afbeelding), Whisper (spraakherkenning) en recentelijk Stable Diffusion (tekst-naar-afbeelding) hebben niet alleen de mogelijkheden van spraak- en visuele AI-tools vergroot, maar ook verminderde de middelen die nodig zijn om ze te gebruiken (van 175 miljard parameters voor GPT-3 tot 900 miljoen voor stabiele diffusie).

De grootte van de stabiele Diffusion betekent minder dan 5 GB schijfruimte - geschikt voor gebruik op elke laptop. Niet alleen dat; in tegenstelling tot OpenAI (dat voornamelijk wordt gefinancierd door Microsoft en GPT-3, DALL-E en Whisper publiceert), is Stable Diffusion open source, wat betekent dat anderen veel gemakkelijker op de lessen kunnen voortbouwen. Dat betekent dat we nog maar het begin van de innovatieve cyclus zien – er komt nog veel meer aan, zoals Nvidia's paper nu laat zien.

De donateurs van Stable Diffusion (stability.ai) stimuleren deze trend verder door technologische en financiële subsidies te verstrekken aan andere teams die de verkenning in nieuwe richtingen brengen. Bovendien maken een overvloed aan projecten de tools beschikbaar voor een steeds breder scala aan gebruikers. Onder hen zijn plug-ins voor Blender, een open-source ontwerptool, en Adobe's eigen Photoshop-equivalent. Volledige API-toegang tot de tools wordt gefinancierd met grote Venture Capital-dollars, wat betekent dat honderden miljoenen softwareontwikkelaars, niet alleen een paar honderdduizend data-engineers, nu hun eigen tools op deze algoritmen zullen maken.

Spraak, beeld en tekst behoren tot de eerste branches die door deze technologieën worden verstoord. Maar 3D loopt niet ver achter. Naast generatieve niche-kunst, zijn tekenfilms het voor de hand liggende eerste toepassingspunt. Er is al een Pokémon-generator op basis van Stable Diffusion. Visuele effecten en films zijn de volgende. Maar veel andere sectoren zullen waarschijnlijk worden verstoord, waaronder interieurdesign met Interiorai.com als leider.

In al deze opwinding voelt het toepassen van de innovaties op Design & Engineering als een bijzaak. Toch is het waarschijnlijk het gebied dat uiteindelijk het zwaarst wordt getroffen. Natuurlijk zijn er aanvankelijke uitdagingen: ten eerste zijn Stable Diffusion en zijn landgenoten nog niet erg precies. Dat is geen probleem voor cartoons, maar het is een grote uitdaging voor elke poging om tekst om te zetten in volledige 3D-geometrieën die in industriële contexten worden gebruikt. Dat is een gebied dat enige ontluikende interesse heeft gehad (een project met de naam Bits101 werd in 2015 in Israël gelanceerd). Dit is misschien wel de heilige graal van de branche, maar er zijn veel tussenliggende uitdagingen die veel gemakkelijker op te lossen zijn. Deze omvatten verbeterde objectherkenning (het Yolo-algoritme wordt al met veel succes gebruikt), wat zal leiden tot verbeterde citaten en annotaties, waardoor de kwaliteit verbetert en fouten worden verminderd. Plug-ins zouden het ook gemakkelijker moeten maken om Generative AI te gebruiken om basisontwerpen (Primitives) te ontwikkelen, die vervolgens verder kunnen worden bewerkt in ontwerptools om de tolerantie naar behoefte te verbeteren. Dat is een benadering die al wordt gebruikt in Altair's Inspire, die eindige-elementenanalyse gebruikte om hetzelfde te doen. Deze Primitives kunnen ook dienen als synthetische database van geannoteerde modellen, waaraan in de 3D CAD-industrie een tekort is. CEO en oprichter van Physna wijst dit in een artikel hun eigen pogingen beschrijven om deze nieuwe methoden te gebruiken om gedetailleerde 3D-ontwerpen te maken, wat ook een aantal valkuilen belicht bij het gebruik van synthetische gegevens om deze algoritmen aan te sturen. bibliotheek met gereedschapsslijtage om de beste bewerkingsstrategieën te bepalen.

Deze uitdagingen zijn belangrijk en lucratief om op zichzelf aan te pakken. Maar hun belangrijkste impact zal zijn om het idee-naar-ontwerptraject te helpen ontwikkelen door uiteindelijk de afhankelijkheid van 3D-ontwerpen te verminderen om de intentie over te brengen. Ontwerpen, zowel 2D als 3D, hebben gediend als het belangrijkste middel om de behoeften van klanten te vertalen naar eindproducten. Dat beperkt de industrie omdat deze ontwerpen dienen als een zwarte doos waarin al die waardevolle klantinzichten, productiebeperkingen en bedrijfsdoelstellingen worden opgeslagen, niet te ontwarren, maar alleen geïdentificeerd. Dit betekent dat wanneer er iets verandert, het bijna onmogelijk is om het ontwerp zomaar aan te passen. Dit is de reden waarom het zo lang duurt voordat fabricage-innovaties zoals 3D-printen worden geaccepteerd en kortetermijninvesteerders voortdurend teleurstellen. De componenten waaruit een vliegtuig bestaat, zijn "set" vanaf het moment dat ze zijn ontworpen, ondanks een productieve levensduur van meer dan 20 jaar. Er is bijna geen ruimte voor innovatie - deze moeten wachten op de lancering van de volgende generatie.

Door een enkele beperking te kunnen wijzigen en een algoritme zoals Stable Diffusion de ontwerp- en productieparameters te laten reconstrueren, wordt de acceptatie van nieuwe innovaties aanzienlijk versneld en kunnen we sneller lichtere, beter presterende producten bouwen. Net als in Formule 1 of Systeemontwerp, zullen toekomstige ingenieurs optreden als constraintmanagers die in staat zijn om in woorden en in verwijzing naar gegevensbronnen uit te drukken wat het doel en de beperkingen van het product zijn.

Zonder op deze manier het engineeringproces voor nieuwe en bestaande producten te versnellen, hebben we bijna geen middelen om de ambitieuze duurzaamheidsdoelstellingen te halen die we onszelf moeten stellen. Om dit te doen, moeten we het eerst eens worden over een taal die we kunnen gebruiken om buiten ontwerpen te communiceren. Dit nieuwe semantische model is de duidelijke leemte in de hierboven geschetste innovaties. Een aantal bedrijven is er al mee aan het experimenteren, zoals nTopologie met zijn concepten van velden. En toch is het tempo van verandering traag, in tegenstelling tot de algoritmen die het semantische model zal voeden. Nvidia's nieuwe algoritme is naar verluidt meer dan twee keer zo snel als DroomFusie, minder dan 2 maanden geleden gepubliceerd. Product- en engineeringbedrijven moeten nu werken aan het vastleggen van hun ideeën op nieuwe, toekomstbestendige manieren om de mogelijkheden van deze explosie van generatieve AI optimaal te benutten. De snelheid van verandering in algoritmen heeft eens te meer aangetoond dat Morse Law overal van toepassing is waar tools worden gedigitaliseerd. De uitdaging blijft ons menselijk onvermogen om deze verandering te omarmen en nieuwe communicatiemethoden in te zetten die hun potentieel kunnen ontsluiten, ondanks de urgentie van de taak.

Bron: https://www.forbes.com/sites/andrewegner/2022/11/24/what-nvidias-new-text-to-3d-means-for-engineering–product-design/