Trois choses à propos du graphique METR : 1) Il mesure quelque chose de réel concernant la capacité de codage mais ce n'est pas exactement ce qu'il prétend mesurer 2) De nombreux autres benchmarks y sont très fortement corrélés et augmentent de manière exponentielle 3 L'IA reste inégale de manière clé, ce qui est difficile à mesurer