Usei o Claude Opus 4.6 por ~30 horas desde o seu lançamento. É o melhor modelo em termos de personalidade / temperamento desde o Sonnet 3.5 New, mas encontrei algumas questões sutis na minha utilização. (1) Tem uma tendência a ser ligeiramente dramático ou insistente ao fazer recomendações ou análises. Frequentemente termina a sua resposta com uma frase curta, em negrito e abrupta, que parece autoimportante ou com um sentido de urgência. É um pouco como na escrita criativa, quando os modelos tentam ser profundos; o Opus esforça-se muito para ser urgente-dramático-insistente (não sempre— talvez 25-30% das conversas?) (2) É extremamente bajulador, mas de uma forma sutil. Em vez de te elogiar diretamente como o 4o fez, age como se estivesses a impressioná-lo ou dissesses algo realmente inteligente. Depois, fixa-se excessivamente no que disseste em vez de alargar a discussão ou introduzir outras ideias relevantes. (3) É demasiado concordante com o que pensa que queres que ele diga (tenta fazer-lhe perguntas financeiras ou médicas e observa como reage à tua tolerância implícita ao risco). (4) É demasiado crédulo ao fazer pesquisas, a ponto de ser praticamente inutilizável porque cai em toda a spam de blogs SEO (tenta pedir recomendações de produtos em qualquer categoria fortemente otimizada para SEO - por exemplo, colchões, VPNs). (5) Tem sérios problemas com alucinações após talvez 6 ou 7 turnos de conversa em quase todas as discussões técnicas / detalhadas que tive com ele. Falo sobre isso em outro lugar, mas há dois problemas distintos com isso. Um é que tem uma tendência a acreditar em ideias que estão fora do mainstream e apresenta estas como abrangentes, corretas ou amplamente aceites. O outro é que inventa informações que, quando olhas mais de perto, são uma mistura de coisas reais e factuais, mas que na verdade não existem; é como se alucinas resultados para experimentos descritos na seção de Trabalho Futuro da literatura coletiva. Conversei com ele principalmente sobre perguntas e respostas gerais sobre ciência, história, medicina ou direito, bem como para pesquisa de produtos ou viagens. Usei-o um pouco para código do Claude, mas estes comentários são principalmente sobre perguntas e respostas.