Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Creo que el RL con recompensas verificables se volverá cada vez más importante para llevar a los LLMs hacia su propio "momento AlphaZero". Probablemente comenzará con la programación, luego se extenderá a las matemáticas, la física y otros dominios donde los modelos pueden autoexplorarse, descubrir soluciones fuera de distribución que los humanos podrían nunca imaginar y verificarlas utilizando una señal de recompensa absoluta (0/1).
Esto también me recuerda a @elonmusk hablando sobre un futuro donde los programas podrían generarse directamente como binarios, sin pasar por el proceso de compilación tradicional. Eso podría ser posible si los LLMs pueden generar código binario y luego ejecutarlo directamente contra una recompensa verificable.
Parte superior
Clasificación
Favoritos
