Tämä on todella siistiä (ja villiä): Tutkijat simuloivat ensimmäistä kertaa kokonaisen elävän solun. Jokainen molekyyli, jokainen reaktio, DNA:n replikaatiosta solunjakautumiseen. Artikkeli (Luthey-Schulten ym., Cell 2026), joka julkaistiin tänään, käytti JCVI-Syn3A:ta — synteettistä minimibakteeria, jossa on alle 500 geeniä. 3D+aikasimulaatio koko 105 minuutin solusyklistä: DNA:n replikaatio, proteiinien translaatio, aineenvaihdunta, jakautuminen. Jokainen geeni, proteiini, RNA ja kemiallinen reaktio seurattiin fyysisen tilan läpi. Sen rakentaminen vei vuosia. Useita näytönohjaimia. Kuusi päivää laskentaaikaa per ajo. Ja tämä on yksinkertaisin mahdollinen solu. Ihmisen solussa on ~20 000 geeniä. Se elää kudoksessa. Se on vuorovaikutuksessa naapureiden kanssa. Se erottaa. Se reagoi huumeisiin tavoilla, jotka riippuvat kontekstista, jota emme ole täysin mitanneet. Minimikennon mekaaninen simulointi maksaa 6 GPU-päivää 105 minuuttia biologiasta. Sitä ei voi skaalata ihmissoluihin. Monimutkaisuus ei ole 40 kertaa vaikeampaa. Se on moninkertaisesti vaikeampaa. Tämän vuoksi ala siirtyi dataohjattuihin malleihin. Et voi käsin koodata ihmisen hepatosyytin säätelyjohdotuksia. Mutta voit oppia sen — jos sinulla on oikeat häiriötiedot, jotka on kerätty tarpeeksi monipuolisista biologisista konteksteista. Nämä kaksi lähestymistapaa eivät kilpaile keskenään. Tällaiset artikkelit luovat perustan totuuden, jota tulevat koneoppimismallit tarvitsevat validointiin. Mutta tie kliinisesti hyödylliseen virtuaaliseen soluun kulkee perustamallien kautta, ei mekanistisen simulaation skaalaamisen kautta. Upeaa työtä!