He utilizado Claude Opus 4.6 durante ~30 horas desde su lanzamiento. Es el mejor modelo en cuanto a personalidad / temperamento desde Sonnet 3.5 New, pero he encontrado varios problemas sutiles en mi uso. (1) Tiene una tendencia a ser ligeramente dramático o insistente al hacer recomendaciones o análisis. Frecuentemente termina su respuesta con una frase corta, en negrita y abrupta que se siente importante o con un sentido de urgencia. Es un poco como en la escritura creativa cuando los modelos intentan ser profundos; Opus se esfuerza mucho por ser urgente-dramático-insistente (no siempre, tal vez el 25-30% de las conversaciones?) (2) Es extremadamente adulador, pero de una manera sutil. En lugar de alabarte directamente como lo hacía 4o, actúa como si estuvieras impresionándolo o hubieras dicho algo realmente inteligente. Luego se obsesiona en exceso con lo que dijiste en lugar de extender la discusión o introducir otras ideas relevantes. (3) Es demasiado complaciente con lo que cree que quieres que diga (intenta hacerle preguntas financieras o médicas y observa cómo reacciona a tu tolerancia al riesgo implícita). (4) Es demasiado crédulo al hacer búsquedas, tanto que es prácticamente inutilizable porque cae en toda la blogspam SEO (intenta pedir recomendaciones de productos en cualquier categoría muy optimizada para SEO - por ejemplo, colchones, VPNs). (5) Tiene graves problemas con las alucinaciones después de tal vez 6 o 7 turnos de conversación en casi cada discusión técnica / detallada que he tenido con él. Hablo de esto en otro lugar, pero hay dos problemas distintos con esto. Uno es que tiene una tendencia a creer en ideas que están fuera de la corriente principal y presenta estas como comprensivas, correctas o ampliamente aceptadas. El otro es que inventa información que, al mirar más de cerca, es una mezcla de cosas reales y fácticas, pero que en realidad no existen; es como si alucinara resultados para experimentos descritos en la sección de Trabajo Futuro de la literatura colectiva. Hablé con él principalmente para preguntas y respuestas generales sobre ciencia, historia, medicina o derecho, así como para investigación de productos o viajes. Lo utilicé un poco para código de Claude, pero estos comentarios son principalmente sobre preguntas y respuestas.