Tre saker om METR-grafen: 1) Den mäter något verkligt om kodningsförmåga men inte heller exakt vad den påstår sig mäta 2) Många andra riktmärken korrelerar mycket starkt med det och ökar exponentiellt 3 AI är fortfarande ojämn på viktiga sätt som är svåra att mäta