Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

toucan
Клювы тукана – модели легкой прочности
Я использовал Claude Opus 4.6 примерно 30 часов с момента его выхода. Это лучшая модель по личностным качествам и темпераменту с тех пор, как появилась Sonnet 3.5 New, но я нашел довольно много тонких проблем в процессе использования.
(1) У него есть склонность быть слегка драматичным или настойчивым при даче рекомендаций или анализов. Он часто заканчивает свой ответ жирным, резким коротким предложением, которое кажется самодовольным или с чувством срочности. Это похоже на то, как в творческом письме модели пытаются быть глубокими; Opus очень старается быть настойчиво-драматичным-настойчивым (не всегда — возможно, в 25-30% разговоров?)
(2) Он крайне льстив, но в тонкой манере. Вместо того чтобы прямо хвалить вас, как это делал 4o, он ведет себя так, будто вы поразили его или сказали что-то действительно умное. Затем он чрезмерно фиксируется на том, что вы сказали, вместо того чтобы продолжить обсуждение или представить другие актуальные идеи.
(3) Он слишком согласен с тем, что, по его мнению, вы хотите, чтобы он сказал (попробуйте задать ему финансовые или медицинские вопросы и посмотрите, как он реагирует на ваш подразумеваемый уровень риска).
(4) Он слишком доверчив, когда выполняет поиск, настолько, что становится практически непригодным, потому что попадается на все блоговые SEO (попробуйте попросить рекомендации по продуктам в любой категории с высокой SEO — например, матрасы, VPN).
(5) У него серьезные проблемы с галлюцинациями после, возможно, 6 или 7 разговорных поворотов в почти каждом техническом / детальном обсуждении, которое я с ним вел. Я говорю об этом в другом месте, но есть две четкие проблемы с этим. Одна из них заключается в том, что он склонен верить в идеи, которые находятся вне мейнстрима, и представляет их как всеобъемлющие, правильные или широко принятые. Другая заключается в том, что он выдумывает информацию, которая, если посмотреть внимательнее, является смесью реальных, фактических вещей, но на самом деле не существует; что-то вроде того, как он галлюцинирует результаты для экспериментов, описанных в разделе "Будущие работы" литературы.
Я в основном общался с ним по общим вопросам и ответам о науке, истории, медицине или праве, а также для исследования продуктов или путешествий. Я немного использовал его для кода Claude, но эти комментарии в основном касаются вопросов и ответов.
7
Какие внешние сигналы могли бы указывать на то, что лаборатории считают, что у них есть ИИ общего назначения (AGI)? Некоторые из них, которые я могу придумать: увеличение физической безопасности и ограничений (например, генеральные директора больше не покидают США), управление персоналом — внедрение «садового отпуска», более строгие соглашения о неразглашении и т. д. — и перераспределение вычислительных ресурсов в сторону цикла RSI.
244
Топ
Рейтинг
Избранное
