DeepSeek-V4 akan datang? Menurut informasi tangkapan layar yang beredar, model V4 dikuantisasi oleh INT8, yang bertujuan untuk secara signifikan mengurangi jejak memori dan biaya inferensi sambil mempertahankan kinerja tinggi dan membuatnya mudah untuk diterapkan/dijalankan pada perangkat keras konsumen atau lingkungan yang lebih luas. Namun, dari tangkapan layar itu sendiri, tidak jelas apakah itu mendukung multimodalitas.