Tiga hal tentang grafik METR: 1) Ini mengukur sesuatu yang nyata tentang kemampuan pengkodean tetapi juga tidak persis seperti yang diklaimnya untuk diukur 2) Banyak tolok ukur lain berkorelasi dengan sangat tinggi dan meningkat secara eksponensial 3 AI tetap bergerigi dengan cara utama yang sulit diukur