como venho dizendo, este é o próximo estágio da computação podemos ir mais longe e colocar o LLM no chip e obter 10k tokens por segundo, tornando qualquer binário em um instante para realizar qualquer tarefa