Netflix' Chaos Monkey en toeleveringsketen

Ik had onlangs een gesprek met Carlos Crespo, Chief Operating Officer van Zara-moederbedrijf Inditex, waarin hij een softwaretool noemde die meer dan tien jaar geleden door Netflix was gemaakt om de veerkracht van het systeem te institutionaliseren. De naam is pakkend en voor leiders in de toeleveringsketen die hun toeleveringsnetwerken opnieuw willen uitvinden voor turbulente tijden, is het onweerstaanbaar. En toch, een GoogleGOOG
zoeken naar "supply chain chaos monkey" leverde precies op één citaat, van 2012.

Waarom passen we dit idee niet toe op de veerkracht van de toeleveringsketen?

Wat is Chaos Aap?

Het is een softwaretool, en meer in het algemeen, een technisch principe dat willekeurig delen van een complex systeem afsluit, waardoor operators gedwongen worden om live te herstellen. Een soort verrassingsbrandoefening, maar dan dagelijks en op willekeurige manieren en plaatsen. Het idee is dat snel goed worden in het oplossen van systeemproblemen een leerproces is dat baat zou moeten hebben bij een steiler wordende leercurve.

Het achtergrondverhaal gaat over hoe Netflix zijn streamingactiviteiten op Amazon Web Services heeft opgeschaald terwijl het overstapte van het verzenden van dvd's naar de deur van de klant. Op het eerste gezicht is het een logische benadering van systeemredundantieplanning, zoals je van NASA zou verwachten, maar in de praktijk maakt het gebruik van een culturele norm van Netflix om individuele medewerkers toe te staan ​​hun eigen problemen op te lossen. Zoals opgetekend in “chaos techniek', een boek uit 2020 van Casey Rosenthal en Nora Jones die pionierden in de praktijk bij Netflix, komt het neer op vijf principes:

  • Bouw een hypothese rond stabiel gedrag
  • Varieer gebeurtenissen uit de echte wereld
  • Voer experimenten uit in productie
  • Automatiseer experimenten om continu uit te voeren
  • Minimaliseer de straal van de explosie

De mix van cultuur en proces bij Netflix is ​​belangrijk omdat het een open-source probleemoplossende benadering heeft bevorderd en benut, terwijl het systematisch draaien van het wiel van willekeurige shutdowns het leren binnen het uitgebreide team versnelt.

Supply Chain Veerkracht en Chaos Engineering

Digitale transformatie in de toeleveringsketen was dit jaar hot omdat het de toeleveringsketens helpt nieuwe bedrijfsmodellen te ondersteunen en te streven naar duurzame bedrijfsvoering (zie BCG X-onderzoek), maar ook omdat het "veerkracht" belooft. Helaas komen praktische toepassingen van digitale transformatie voor veerkracht van de toeleveringsketen over het algemeen nog steeds neer op platforms voor betere "zichtbaarheid", ondersteund door een aantal traditionele tactieken zoals voorraadbuffering en dual sourcing. Aan de basis van deze benadering ligt nog een laag analytisch werk tijd om te herstellen door David Simchi-Levi van MIT, en een golf van simulaties met behulp van digitale tweelingen. Dat klinkt allemaal geweldig, maar wat ontbreekt, is een systematische manier om te experimenteren met echte supply chain-falen om te leren hoe je in de praktijk het beste kunt herstellen.

Chaos Monkey toepassen op toeleveringsketens

Doktoren leggen de eed van Hippocrates af voordat ze ons opensnijden, waaronder het beroemde 'eerst geen kwaad doen'. Geen slecht idee voor iedereen die Chaos Monkey-principes toepast op toeleveringsketens, wat inhoudt dat ergens willekeurig een echte machine wordt uitgeschakeld. Dit is niet triviaal en gebeurt voor zover ik weet nog nergens.

  • Het eerste hierboven aangehaalde principe zegt dat we ons moeten concentreren op systeemoutput in plaats van interne attributen. Controleer of het systeem werkt in plaats van te proberen te begrijpen waarom het werkt.
  • Het tweede principe zegt dat je verschillende dingen op realistische manieren moet breken. Het is niet nodig om een ​​wereldwijde thermonucleaire oorlog te simuleren, zet gewoon een schakelaar uit of verlies een bestelling en ontdek welke oplossing het beste werkt.
  • Het derde principe zegt dat de beste plaats om te leren in de productie is. Leren door te doen is beter dan leren door simulatie – dat wil zeggen, digitale tweelingen zijn geweldig, maar ze zijn misschien niet genoeg om een ​​cultuur van veerkracht op te bouwen.
  • Het vierde principe institutionaliseert de chaos-apenprincipes omdat het het experimenteerproces kan schalen, waardoor je een steilere leercurve krijgt. Gebruik datawetenschap bij brandbestrijding.
  • Als laatste, minimaliseer de straal van de explosie. Dit betekent "doe geen kwaad" en vertaalt zich naar een soort buffering (voorraad, doorlooptijd, versnelde verzending) om te voorkomen dat klanten uw experiment voelen. Leer gecontroleerde explosies te beheersen.

Je zou kunnen stellen dat de afgelopen drie jaar Covid, oorlog, arbeidsonrust, en economische onrust is voor iedereen één grote chaos geweest. De les van Netflix was dat dit soort crises niet alleen iets is om voor te plannen, maar iets om onder de knie te krijgen als een permanent feit van het leven.

De perfecte storm zal misschien nooit eindigen, dus misschien moeten we ermee leren leven.

Bron: https://www.forbes.com/sites/kevinomarah/2022/12/22/netflix-chaos-monkey-and-supply-chain/