La création d’ensembles de données à partir de sources primaires est l’une des tâches les plus coûteuses en économie empirique. Nous proposons Deep Research on a Loop (DRIL), une méthodologie qui utilise des agents d'IA pour compiler des ensembles de données à partir de sources accessibles au public. DRIL applique un outil de recherche fixe sur un espace unitaire cartographié (par exemple, pays par année), avec une architecture à deux niveaux séparant la conception et la mise en œuvre. L'instrument spécifie les variables et les règles de codage, une ligne directrice sur les données probantes réglemente les sources et les citations, et les mécanismes de qualité des données suivent explicitement les lacunes et les incertitudes. Nous appliquons DRIL dans une mise à jour 2025 de la base de données mondiales sur les dépenses fiscales pour huit pays d’Amérique latine et des Caraïbes. L'analyse produit 129 sources et 136 ensembles de données probantes, couvrant entièrement 22 domaines qualitatifs et 6 types d'estimations quantitatives avec des lacunes documentées, pour le prix d'un abonnement LLM standard, comparable à quelques heures de travail de recherche. Nous soutenons que même une automatisation partielle de la construction des ensembles de données peut modifier la fonction de production de l’économie empirique.

Cela ressort d’un nouveau document de travail du NBER


#Utiliser #des #agents #pour #créer #des #ensembles #données #économiques