Tři věci o grafu METR: 1) Měří něco skutečného ohledně schopnosti programování, ale zároveň to není přesně to, co tvrdí, že měří 2) Mnoho dalších benchmarků s tím velmi silně koreluje a roste exponenciálně 3 AI zůstává zubatá v klíčových ohledech, které je těžké měřit