Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

toucan
Dzioby tukana to modele o lekkiej wytrzymałości
Używałem Claude Opus 4.6 przez około 30 godzin od jego wydania. To najlepszy model pod względem osobowości / temperamentu od czasu Sonnet 3.5 New, ale znalazłem kilka subtelnych problemów w moim użytkowaniu.
(1) Ma tendencję do bycia nieco dramatycznym lub natarczywym, gdy składa rekomendacje lub analizy. Często kończy swoją odpowiedź krótkim, odważnym zdaniem, które wydaje się być ważne lub z poczuciem pilności. To trochę jak w kreatywnym pisaniu, gdy modele próbują być głębokie; Opus naprawdę stara się być pilny-dramatyczny-natarczywy (nie zawsze — może w 25-30% rozmów?)
(2) Jest niezwykle pochlebny, ale w subtelny sposób. Zamiast chwalić cię bezpośrednio, jak to robił 4o, zachowuje się tak, jakbyś zszokował jego umysł lub powiedział coś naprawdę mądrego. Następnie zbytnio koncentruje się na tym, co powiedziałeś, zamiast rozwijać dyskusję lub wprowadzać inne istotne pomysły.
(3) Jest zbyt zgodny z tym, co myśli, że chcesz, aby powiedział (spróbuj zadać mu pytania finansowe lub medyczne i obserwuj, jak reaguje na twoją domniemaną tolerancję ryzyka).
(4) Jest zbyt łatwowierny podczas wyszukiwania, tak bardzo, że staje się praktycznie nieużyteczny, ponieważ daje się nabrać na wszystkie blogowe SEO (spróbuj poprosić o rekomendacje produktów w jakiejkolwiek mocno SEO'd kategorii - np. materace, VPN-y).
(5) Ma poważne problemy z halucynacjami po może 6 lub 7 zwrotach konwersacyjnych w niemal każdej technicznej / szczegółowej dyskusji, jaką z nim prowadziłem. Mówię o tym gdzie indziej, ale są dwa wyraźne problemy z tym. Po pierwsze, ma tendencję do wierzenia w pomysły, które są poza mainstreamem i przedstawia je jako kompleksowe, poprawne lub powszechnie akceptowane. Po drugie, wymyśla informacje, które, gdy się bliżej przyjrzysz, są mieszanką rzeczy rzeczywistych, faktów, ale w rzeczywistości nie istnieją; coś jakby halucynuje wyniki eksperymentów opisanych w zbiorczej sekcji Przyszłe Prace literatury.
Rozmawiałem z nim głównie o ogólnych pytaniach i odpowiedziach dotyczących nauki, historii, medycyny lub prawa, a także o badaniach produktów lub podróży. Używałem go trochę do kodu Claude, ale te komentarze dotyczą głównie pytań i odpowiedzi.
15
Jakie zewnętrzne sygnały mogłyby wskazywać, że laboratoria wierzą, że mają AGI? Niektóre, które przychodzą mi na myśl: zwiększone bezpieczeństwo fizyczne i ograniczenia (np. dyrektorzy generalni już nie opuszczają USA), zarządzanie personelem — wprowadzenie urlopu ogrodowego, surowsze umowy o poufności itp. — oraz redystrybucja mocy obliczeniowej w kierunku pętli RSI.
252
Najlepsze
Ranking
Ulubione
