Cradle maakt biologie programmeerbaar

Biotech-speler is "trotse klant" bij Google Cloud

Cradle maakt biologie programmeerbaar

Cradle zet AI in om biologische uitdagingen aan te pakken. CEO en mede-oprichter Stef van Grieken heeft daarvoor een team verzameld met expertise binnen Google, Uber en de biotechwereld. Met Google Cloud als springplank heeft het bedrijf al prominente klanten binnengehaald.

We spreken met Stef van Grieken tijdens Google Cloud Summit te Amsterdam, waarbij Google Cloud meerdere klanten naar voren schuift. Hij begon in 2014 als programmeur voor Google Search, droeg bij aan het voorspellen van verkeersfiles in Google Maps en ontwierp met zijn team één van de TPU’s (tensor processing units) die Google via Google Cloud Platform (GCP) voor AI-workloads inzet en aanbiedt. Cradle, dat werd opgericht in 2021, is dus naast klant ook een oude bekende voor de hyperscaler. Niet alleen via haar CEO, want onder de veertig medewerkers is ex-personeel te vinden van de Google AI-divisie Deepmind, YouTube en verschillende productenteams.

De missie van Cradle: het programmeren van biologie

Cradle kent als klanten R&D-medewerkers in laboratoria wereldwijd, die allen op zoek zijn naar de ideale proteïnesequenties voor hun producten. Denk hierbij aan alles dat biologisch van aard is: vaccins, cosmetica, enzymen voor wasmiddelen, et cetera. Deze toepassingen zijn weliswaar zeer uiteenlopend, maar kennen veel overeenkomsten. Door het manipuleren van stukjes DNA maakt Cradle producten beter geschikt voor hun specifieke doeleinden. Dit kan ze effectiever maken, eenvoudiger om op te slaan of onschadelijk voor goedaardige lichaamscellen. Cradle ontwerpt momenteel optimale enzymen, maar heeft vaccins, peptiden en antilichamen “in bèta” beschikbaar, zoals op de website te zien is.

De vermenging van biologie en IT-termen gaat verder dan alleen dat. Cradle tracht de biologische wereld “programmeerbaar” te maken. Feitelijk spreekt de biologie in een niet-menselijke programmeertaal, legt Van Grieken uit. RNA is de applicatiecode, iets dat door een cel wordt uitgevoerd. Net als een CPU is het zelf niet kieskeurig over wat het precies uitvoert, als het maar legitieme “code” is, of “compileert”, in een moeilijkere term. DNA is in deze voorstelling van zaken het storage-medium waarop de code kan worden geschreven.

De vergelijking houdt op bij de compilatietijd, dat gebonden is aan natuurwetten en niet met een nieuwe chip of via code refactoring kan worden versneld. Zo kost het drie maanden om dit “programma” te compileren door een complex mengsel aan biologische bottlenecks.

Een paar daarvan zijn wellicht nooit te omzeilen. Het kost twee weken om DNA te synthetiseren, dat doet een externe leverancier. De lengte van dit gesynthetiseerde DNA is zeer beperkt, dus de bandbreedte dient veelal versterkt te worden door de DNA-stukjes te assembleren (lees: aan elkaar plakken). Zo wordt de geleverde boodschap aan cellen uitgebreider. Vervolgens is er een zoektocht naar de juiste kandidaat om een daadwerkelijk eindproduct te realiseren. Veelal is dat E. coli, zoals bij Cradle het geval is. Ook dat werpt beperkingen op. “Cellen groeien niet sneller als je tegen ze schreeuwt,” zegt Van Grieken.

Een E. coli-cel heeft tijd nodig om te groeien en is cruciaal om DNA-informatie om te zetten in een bruikbaar enzym. De vereisten zijn op voorhand al fors: zo moet een medicijn zich wél aan bepaalde cellen vastgrijpen, expliciet níét aan een aantal andere, de juiste reactie veroorzaken, niet uit elkaar vallen, überhaupt te maken zijn en in water oplossen. Het is een hels karwei om vervolgens de gewenste functionaliteit op schaal te testen, waardoor het veelal jaren duurt voordat een product op de markt verschijnt. Waar is echter wel tijdswinst te boeken?

AI schiet te hulp

Van Grieken legt uit dat de “klassieke” methode van biotech-onderzoek van willekeur afhankelijk is. Zonder machine learning is de slaagkans voor het vinden van werkbare moleculen zo’n twee procent. Drie maanden wachten levert dus doorgaans geen succes op. Met hulp van AI gaat de mate waarin je wenselijke, effectieve moleculen krijgt met “twee keer of soms zelfs tien keer omhoog.” Het zoeken naar werkbare moleculen op basis van willekeur is computationeel duur en traag. AI-innovaties zorgen voor een grote efficiëntiesprong.

Cradle beschikt over aanzienlijke AI-expertise en biedt klanten allerlei opties om hun biotech-projecten te realiseren. Zo kan een onderzoeker labdata uploaden of vanaf nul beginnen en inzicht krijgen in de voorspelde prestaties voordat men drie maanden wacht op het werkelijke resultaat. Bedrijven als Johnson & Johnson, bekend van hun Covid-vaccin, en Manus, dat vervangende ingrediënten ontwikkelt op een biologische basis, benutten deze features al volop.

Ook als een laboratoriumproef niet het gewenste resultaat oplevert, is dit waardevol. Daar waar ChatGPT of Gemini afhankelijk is van een mens die een output goed- of afkeurt, is de menselijke feedback voor AI-modellen in de biotech een laboratoriumtest.

De manier waarop een dergelijk AI-model leert, verschilt verder niet echt van LLM’s. Van Grieken geeft aan dat de opdracht een “schoolse invultaak” betreft, waarbij het model een punt krijgt als het de juiste letter voor een aminozuur invult.

Alles “from scratch”

De AI-modellen moesten “from scratch” worden gebouwd door Cradle. Hoewel Van Grieken niet in detail treedt over de exacte creatie ervan, geeft hij aan dat het opgebouwd was met breed ondersteunde standaarden. Idealiter heb je daarvoor een Nvidia DGX-systeem voor, maar als start-up is dat onverbiddelijk duur en bovenal niet effectief. Wat als je product explosief populairder wordt? Schaalbaarheid ontbreekt dan. Tevens heb je het liefst de modernste hardware beschikbaar, maar continu upgraden is niet reëel. “Je hebt een serieuze IT-infrastructuur nodig om dit te bewerkstelligen.”

Gewapend met de eigen AI-expertise richtte Cradle zich op het GCP. “Ik kan me herinneren dat je als stagiair bij Google 100 machines gelijk op kon starten,” zegt Van Grieken. Nu kan iedereen dat, inclusief start-ups.

Van Grieken omschrijft zichzelf als een “trotse klant” bij Google Cloud. Hij en veel van zijn collega’s hebben van dichtbij meegemaakt hoe vroeg Google bij het ontwikkelen van de AI-stack instapte. Ze deden AI-workloads “voordat het gaaf was,” zoals Van Grieken het karakteriseert. Met eigen TPU’s en volwassen tooling heeft GCP volgens hem een streepje voor op de concurrentie.

Een risico op lock-in is er echter niet omdat een groot deel van de stack inmiddels niet meer uniek is aan elke cloud, stelt Van Grieken. “De meeste applicaties in de wereld zijn Docker-containers, iedereen grijpt naar Terraform voor orkestratie, et cetera.” Daarnaast zorgt deze standaardisering voor voordelige prijzen. “Google zou er niet mee wegkomen hun TPU’s opeens zes keer duurder te maken.”

Het belang van security

Het laat zich raden dat zelf-ontwikkelde, zeer gespecialiseerde AI-modellen veilig gehouden moeten worden. Daarnaast gebruiken Cradle-workloads de gevoelige data van klanten, bestaande uit labdata, persoonsgegevens en de bevindingen die Cradle opwerpt uit de modellen. Van Grieken vertrouwt Google Cloud zonder meer in de rol van beveiliger.

Opnieuw komt dat gedeeltelijk door de opgebouwde interne kennis. Noé Lutz, voorheen werkzaam bij Google’s Threat Analysis Group in Zürich, werkt nu bij Cradle. Hij en de rest van Cradle maakten de inschatting dat het beter was om een grote partij de security toe te vertrouwen. Van Grieken stipt aan dat Google als geen ander continu dreigingen moet afslaan. Het liep voorop met de adoptie van een gelaagde defensie en biedt bijvoorbeeld BeyondCorp Zero Trust Enterprise Security. Zo wordt een applicatie gezekerd zonder dat het met een firewall moet worden beschermd.

Eerlijke partner

Daarnaast weet Google Cloud goed waar het gevaar ligt, zegt Van Grieken. “Ze zijn heel eerlijk over waar dreigingen vandaan komen.” Die zijn lang niet altijd extern. Ook een Cradle-medewerker moet niet zomaar de IP van klanten kunnen downloaden. Kortom: de IT-omgeving van Cradle is bezaaid met encryptie, zero-trust mechanismen en andere security best practices. Omdat deze start-up zeer ervaren personeel heeft, is het ook niet al te lastig om de juiste interne securitycultuur te behouden. Onder de streep hoeft Van Grieken zich niet zoveel zorgen te maken om datasecurity, niet omdat het geen aandacht verdient, maar omdat Google Cloud dit al volwassen heeft ingericht.

Het is logisch dat Google Cloud een partij als Cradle maar wat graag als succesverhaal uitlicht. Het traject van Cradle van idee naar start-up met prominente klanten is snel doorlopen. Door het elimineren van technologische inperkingen heeft GCP de infrastructuur geleverd waar de biotech-speler mee uit de voeten kon. Het razendsnel opstarten van cloud instances levert echter een schril contrast met de niet altijd meewerkende natuur. Daar waar de biologie onvermijdelijke bottlenecks opwerpt, is het des te belangrijker om op alle andere fronten wél te optimaliseren. Cradle heeft binnen zijn eigen niche dat uitgevogeld.

Lees ook: Intel brengt AI naar de Olympische Spelen in Parijs