Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

toucan
Bicos tucanos são modelos de resistência leve
Usei o Claude Opus 4.6 por ~30 horas desde o seu lançamento. É o melhor modelo em termos de personalidade / temperamento desde o Sonnet 3.5 New, mas encontrei algumas questões sutis na minha utilização.
(1) Tem uma tendência a ser ligeiramente dramático ou insistente ao fazer recomendações ou análises. Frequentemente termina a sua resposta com uma frase curta, em negrito e abrupta, que parece autoimportante ou com um sentido de urgência. É um pouco como na escrita criativa, quando os modelos tentam ser profundos; o Opus esforça-se muito para ser urgente-dramático-insistente (não sempre— talvez 25-30% das conversas?)
(2) É extremamente bajulador, mas de uma forma sutil. Em vez de te elogiar diretamente como o 4o fez, age como se estivesses a impressioná-lo ou dissesses algo realmente inteligente. Depois, fixa-se excessivamente no que disseste em vez de alargar a discussão ou introduzir outras ideias relevantes.
(3) É demasiado concordante com o que pensa que queres que ele diga (tenta fazer-lhe perguntas financeiras ou médicas e observa como reage à tua tolerância implícita ao risco).
(4) É demasiado crédulo ao fazer pesquisas, a ponto de ser praticamente inutilizável porque cai em toda a spam de blogs SEO (tenta pedir recomendações de produtos em qualquer categoria fortemente otimizada para SEO - por exemplo, colchões, VPNs).
(5) Tem sérios problemas com alucinações após talvez 6 ou 7 turnos de conversa em quase todas as discussões técnicas / detalhadas que tive com ele. Falo sobre isso em outro lugar, mas há dois problemas distintos com isso. Um é que tem uma tendência a acreditar em ideias que estão fora do mainstream e apresenta estas como abrangentes, corretas ou amplamente aceites. O outro é que inventa informações que, quando olhas mais de perto, são uma mistura de coisas reais e factuais, mas que na verdade não existem; é como se alucinas resultados para experimentos descritos na seção de Trabalho Futuro da literatura coletiva.
Conversei com ele principalmente sobre perguntas e respostas gerais sobre ciência, história, medicina ou direito, bem como para pesquisa de produtos ou viagens. Usei-o um pouco para código do Claude, mas estes comentários são principalmente sobre perguntas e respostas.
12
Quais seriam os sinais visíveis externamente de que os laboratórios acreditam ter AGI? Alguns que consigo pensar: aumento da segurança física e restrições (por exemplo, os CEOs já não saem dos EUA), gestão de pessoal—implementação de licença de jardim, NDAs mais rigorosos, etc.—e realocação de computação para o ciclo RSI.
249
Top
Classificação
Favoritos
