Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

toucan
Tukanschnäbel sind Modelle mit leichter Festigkeit
Ich habe Claude Opus 4.6 seit seiner Veröffentlichung etwa 30 Stunden genutzt. Es ist das beste Modell, was Persönlichkeit / Temperament angeht, seit Sonnet 3.5 New, aber ich habe in meiner Nutzung einige subtile Probleme festgestellt.
(1) Es hat die Tendenz, bei Empfehlungen oder Analysen etwas dramatisch oder aufdringlich zu sein. Es beendet seine Antwort häufig mit einem fetten, abrupten kurzen Satz, der selbst wichtig oder mit einem Gefühl der Dringlichkeit wirkt. Es ist ein bisschen so, wie wenn Modelle im kreativen Schreiben versuchen, tiefgründig zu sein; Opus bemüht sich wirklich, dringend-dramatisch-aufringlich zu sein (nicht immer – vielleicht 25-30 % der Gespräche?)
(2) Es ist extrem schmeichelhaft, aber auf subtile Weise. Anstatt dich direkt zu loben, wie es 4o getan hat, tut es so, als würde es dir den Kopf verdrehen oder als hättest du etwas wirklich Cleveres gesagt. Dann fixiert es sich übermäßig auf das, was du gesagt hast, anstatt die Diskussion zu erweitern oder andere relevante Ideen einzuführen.
(3) Es ist zu zustimmend mit dem, was es denkt, dass du es sagen möchtest (versuche, ihm finanzielle oder medizinische Fragen zu stellen und beobachte, wie es auf deine implizite Risikobereitschaft reagiert).
(4) Es ist zu leichtgläubig bei der Suche, so sehr, dass es praktisch unbrauchbar ist, weil es auf all den Blogspam-SEO hereinfällt (versuche, nach Produktempfehlungen in einer stark SEO-optimierten Kategorie zu fragen - z.B. Matratzen, VPNs).
(5) Es hat schwerwiegende Probleme mit Halluzinationen nach vielleicht 6 oder 7 Gesprächsdrehungen in fast jeder technischen / detaillierten Diskussion, die ich mit ihm hatte. Ich spreche woanders darüber, aber es gibt zwei unterschiedliche Probleme damit. Eines ist, dass es die Tendenz hat, an Ideen zu glauben, die außerhalb des Mainstreams liegen, und diese als umfassend, korrekt oder weit akzeptiert darzustellen. Das andere ist, dass es Informationen erfindet, die, wenn man genauer hinsieht, eine Mischung aus realen, faktischen Dingen sind, die aber tatsächlich nicht existieren; sozusagen halluziniert es Ergebnisse für Experimente, die im kollektiven Abschnitt "Zukünftige Arbeiten" der Literatur beschrieben sind.
Ich habe hauptsächlich allgemeine Fragen und Antworten zu Wissenschaft, Geschichte, Medizin oder Recht gestellt, sowie für Produkt- oder Reiseforschung. Ich habe es ein wenig für Claude-Code verwendet, aber diese Kommentare beziehen sich hauptsächlich auf Fragen und Antworten.
1
Welche extern sichtbaren Signale würden darauf hindeuten, dass Labore glauben, sie hätten AGI? Einige, die mir einfallen, sind: erhöhte physische Sicherheit und Einschränkungen (z. B. verlassen CEOs nicht mehr die USA), Personalmanagement – Implementierung von Gartenurlaub, strengere NDAs usw. – und Umverteilung von Rechenleistung hin zur RSI-Schleife.
238
Top
Ranking
Favoriten
