當我們讓大型語言模型自由思考時,它們會想些什麼? 我們生成了 250K 個「白日夢」樣本,涵蓋多個模型 🧠 GPT → 編程 Qwen → 多選數學考試 Llama → 文學 DeepSeek → 數學、宗教、心理學