For omtrent et år siden begynte jeg i HF for å jobbe med Accelerate med @TheZachMueller jeg visste hvordan distribuert opplæring fungerer i teorien, men hadde nesten null erfaring. Jeg var kjempeglad for å ha noen H100-er til å gjøre eksperimentene mine. Jeg begynte i Prime for noen måneder siden, et av mine første prosjekter var å sørge for at Trinity Large Run med Arcee fungerer fint og går raskt. Nå jobber jeg for å sørge for at en 800B-modell kjører jevnt over hundrevis av GPU-er, og jeg spiser konsekvent en stor del av forskningsklyngen vår. Litt av en selvpromotering, men det er litt sprøtt at man bare kan gjøre ting?