8 avril 2024
http://creativecommons.org/licenses/by-nc/
Mathias Bellat et al., « La détection automatisée des structures en archéologie: la standardisation à l'aire du "Big Data" », HAL-SHS : archéologie, ID : 10670/1.01228u
Ces dernières années ont vu une utilisation croissante de solutions automatiques pour détecter les structures archéologiques (Argyrou et Agapiou, 2022). De nouvelles applications de processus d'apprentissage automatique pour détecter des formes basées sur des données de télédétection (drones ou satellites) ont conduit à de nombreuses solutions, allant de la programmations personnalisées dans des langages tels que R et Python à des logiciels intégrés tels que e-Cognition et ArcGIS. Cette diversification s'est étendue à diverses zones géographiques, à divers types de structures détectées et à une large échelle chronologique, ce qui a favorisé l'émergence d'une riche mosaïque de pratiques. Les données produites sont rarement comparables et les métriques utilisées pour décrire l'efficacité des modèles sont difficilement comparables. En outre, la transparence des paramètres de prétraitement et d'apprentissage des modèles fait souvent défaut, ce qui complique les comparaisons entre les études. Cette présentation vise à fournir un manuel de bonnes pratiques pour plus d'interdisciplinarité et à mettre en évidence les mauvaises habitudes dans le domaine de la détection automatisée des structures archéologiques.Nous avons analysé 25 articles portant sur la détection des structures archéologiques et avons extrait et classé les meilleures pratiques des chercheurs. Nous avons pris en compte le type de modèle employé pour la détection automatisée, les étapes de prétraitement et l'approche de classification (supervisée, semi-supervisée ou non supervisée). Si l'apprentissage par transfert et la segmentation sont reconnus comme des conditions préalables aux études modernes, leur adoption et leur mention varient d'une publication à l'autre. Parmi les modèles, les réseaux neuronaux convolutifs (CNN) sont les plus utilisés et plus particulièrement le R-CNN du masque, extrêmement bien adapté à la détection de sites (Altaweel et al., 2022). L'utilisation d'images RVB doit également être discutée car elles ne sont pas optimisées pour la détection de structures (Felicetti et al., 2021). L'utilisation systématique du score F1 et de la matrice de confusion n'est pas attestée et conduira à des résultats non standardisés. Un autre problème important est l'ensemble de données de test et d'entraînement, qui n'est pas toujours décrit, et plus encore le prétraitement qui est souvent omis.La variabilité des pratiques parmi les chercheurs en archéologie, engagés dans la détection automatisée de sites, peut être attribuée à de multiples facteurs : Le besoin d'un manuel complet ou d'un cadre de coordination pour unifier les pratiques ; La formation d'ensembles de données de sites archéologiques de différents contextes géographiques et chronologiques ; Le développement rapide de nouveaux modèles et l'entrée de données qui empêchent l'établissement d'ensembles de données ou de modèles standardisés ; Les interactions entre les archéologues et l'informatique ne sont pas très efficaces jusqu'à présent, car les applications modernes d'apprentissage automatique sont rarement enseignées dans les cours d'archéologie.Les interactions entre les archéologues et l'informatique ne sont pas très efficaces jusqu'à présent, car les applications modernes d'apprentissage automatique sont rarement enseignées dans les cours d'archéologie. Cet article vise à ouvrir un débat sur des pratiques plus standardisées pour la détection des sites archéologiques et à promouvoir la création d'une communauté autour de méthodologies partagées.