Drie dingen over de METR-grafiek: 1) Het meet iets reëels over programmeervaardigheid, maar ook niet precies wat het beweert te meten 2) Veel andere benchmarks correleren er zeer hoog mee en nemen exponentieel toe 3 AI blijft op belangrijke manieren ongelijkmatig die moeilijk te meten zijn