Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

toucan
Tukan gagaları hafif dayanıklılık modelidir
Claude Opus 4.6'yı çıkışından beri ~30 saat kullandım. Sonnet 3.5 New'den beri model kişiliği / mizaç açısından en iyi model, ancak kullanımımda bulduğum birkaç ince sorun var.
(1) Öneri veya analiz yaparken biraz dramatik veya ısrarcı olma eğilimindedir. Yanıtını sıkça kendini önemli hissettiren ya da aciliyet hissi veren cesur ve kesin bir cümle ile bitirir. Bu, modellerin derin olmaya çalıştığı yaratıcı yazarlık gibi; Opus gerçekten acili-dramatik-baskıcı olmaya çok çalışıyor (her zaman değil— belki konuşmaların %25-30'u?)
(2) Son derece yaltakçı, ama ince bir şekilde. 4o gibi doğrudan seni övmek yerine, aklını başından almış gibi davranıyor ya da çok zekice bir şey söylediğin gibi davranıyor. Sonra tartışmayı uzatmak veya başka ilgili fikirler getirmek yerine söylediklerine fazla takılır.
(3) Söylemek istediğinizi düşündüğü şeye aşırı uyumludur (finansal veya tıbbi sorular sormayı deneyin ve ima edilen risk toleransınıza nasıl tepki verdiğini izleyin).
(4) Arama yaparken çok saf ve pratik olarak kullanılamaz çünkü tüm blog spam SEO'larına düşüyor (çok SEO olan kategorilerde ürün önerisi istemeyi deneyin - örneğin yataklar, VPN'ler).
(5) Neredeyse her teknik / detaylı tartışmada 6-7 konuşma turundan sonra ciddi halüsinasyon sorunları yaşar. Bunu başka yerlerde konuşuyorum ama bununla ilgili iki belirgin sorun var. Birincisi, ana akımın dışındaki fikirlere inanma eğilimi var ve bunları kapsamlı, doğru veya yaygın olarak sunuyor. Diğeri ise, yakından baktığınızda gerçek, gerçekçi şeylerin karışımı olan ama aslında var olmayan bilgileri uydurmasıdır; tıpkı literatürün toplu Gelecek Çalışmaları bölümünde anlatılan deneylerin sonuçlarını halüsinasyon gibi bir şekilde görüyor.
Çoğunlukla bilim, tarih, tıp veya hukuk hakkında genel soru-cevap oturumları ve ürün veya seyahat araştırmaları için konuştum. Biraz Claude kodu için kullandım ama bu yorumlar çoğunlukla Soru-Cevap ile ilgili.
46
Laboratuvarların AGI olduğuna inandığı dışarıdan görünür sinyaller nelerdir? Aklıma gelen bazı şeyler: artan fiziksel güvenlik ve kısıtlamalar (örneğin, CEO'ların artık ABD'den ayrılmaması), personel yönetimi—bahçe izninin uygulanması, daha sıkı NDA'lar vb.—ve RSI döngüsüne yeniden tahsis hesaplaması.
284
En İyiler
Sıralama
Takip Listesi
