Las pesas abiertas no son entrenamiento abierto. @AddieF38654 de nuestro equipo escribió su experiencia intentando post-entrenar un modelo MoE de parámetro 1T usando la infraestructura de código abierto existente. Vamos a ver cuántos parches de mono se necesitan para entrenar después un modelo de pesos abiertos. Un hilo🧵