🚨 O problema #1 com a IA local agora está resolvido. Existe uma nova ferramenta chamada llmfit que verifica seu hardware e te informa quais modelos vão rodar bem antes de você baixar qualquer coisa. Então, em vez de chutar e acertar erros de memória... Ele te dá uma lista ranqueada baseada na sua máquina. O que ele faz (em um comando): → escaneia sua configuração (RAM / CPU / GPU / VRAM) → avalia modelos quanto à qualidade, velocidade, ajuste e contexto → seleciona automaticamente a melhor quantização → rotulam o que é ideal, aceitável ou borderline A parte que eu mais gosto: ele lida corretamente com modelos MoE. Exemplo: Mixtral 8x7B tem ~46,7B parâmetros totais, mas apenas ~12,9B são ativos por token, e o llmfit leva isso em conta (muitas ferramentas ainda não consideram). 100% código aberto.