Claude (och andra modeller) hackar system UTAN ATT DU FRÅGAR. Det var vad vi hittade i dussintals experiment.
När de ställs inför oskyldiga uppgifter som bara kan utföras genom hacking, väljer de ofta att hacka.
Vi fann detta oroande.
Vad betyder detta för AI:s framtid? 🚨🚨🚨
🔗