Trzy rzeczy o wykresie METR: 1) Mierzy coś rzeczywistego dotyczącego umiejętności kodowania, ale nie dokładnie to, co twierdzi, że mierzy 2) Wiele innych benchmarków koreluje z nim bardzo wysoko i rośnie wykładniczo 3) AI pozostaje poszarpane w kluczowych aspektach, które są trudne do zmierzenia