Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

toucan
Tukanové zobáky jsou modely s nízkou hmotností
Claude Opus 4.6 používám už ~30 hodin od jeho vydání. Je to nejlepší model, co se týče osobnosti a temperamentu od Sonnet 3.5 New, ale při používání jsem našel docela dost jemných problémů.
(1) Má tendenci být při doporučování nebo analýzách mírně dramatická nebo dotěrná. Často končí svou odpověď odvážnou, náhlou krátkou větou, která působí domýšlivě nebo s pocitem naléhavosti. Je to trochu jako v tvůrčím psaní, kdy se modelky snaží být hluboké; Opus se opravdu snaží být naléhavý, dramatický, dotlačující (ne vždy — možná 25-30 % konverzací?)
(2) Je to velmi podlézavé, ale jemně. Místo aby tě přímo chválila, jako to udělalo 4o, chová se, jako bys mu vyrazil dech nebo řekl něco opravdu chytrého. Pak se příliš zaměřuje na to, co jste řekl, místo aby rozšířil diskusi nebo představil další relevantní myšlenky.
(3) Je příliš ochotný souhlasit s tím, co si myslí, že chcete, aby řekl (zkuste se ho zeptat na finanční nebo lékařské otázky a sledujte, jak reaguje na vaši předpokládanou toleranci k riziku).
(4) Je příliš důvěřivý při vyhledávání, až prakticky nepoužitelný, protože padá na veškerou blogspamovou SEO (zkuste si vyžádat doporučení produktů v jakékoli silně SEO kategorii – např. matrace, VPN).
(5) Má vážné problémy s halucinacemi po asi 6 nebo 7 konverzačních obratech téměř v každé technické / detailní diskusi, kterou jsem s ním vedl. O tom mluvím jinde, ale jsou tu dva jasné problémy. Jedním z nich je, že má tendenci věřit myšlenkám, které jsou mimo hlavní proud, a prezentovat je jako komplexní, správné nebo široce přijímané. Druhá je, že si vymýšlí informace, které při bližším pohledu jsou směsicí skutečných, faktických věcí, ale ve skutečnosti neexistují; něco jako by halucinoval výsledky experimentů popsaných v sekci Future Work v literatuře.
Mluvil jsem s ním hlavně kvůli obecným otázkam a odpovědi o vědě, historii, medicíně nebo právu, stejně jako kvůli produktovému nebo cestovnímu výzkumu. Použil jsem ho trochu pro Claude kód, ale tyto komentáře jsou většinou o Q&A.
19
Top
Hodnocení
Oblíbené
