Évaluation comparative des algorithmes d'apprentissage automatique pour la classification des types de sols à partir de caractéristiques physico-chimiques : application de Random Forest, XGBoost, SVM et KNN

Fiche du document

Date

2025

Discipline
Type de document
Périmètre
Langue
Identifiant
  • 20.500.13089/13raq
Relations

Ce document est lié à :
info:eu-repo/semantics/reference/issn/1492-8442

Ce document est lié à :
https://hdl.handle.net/20.500.13089/138e5

Ce document est lié à :
https://doi.org/10.4000/138e5

Organisation

OpenEdition

Licences

info:eu-repo/semantics/openAccess , https://creativecommons.org/licenses/by-nc-nd/4.0/




Citer ce document

Mamadou Ndiaye et al., « Évaluation comparative des algorithmes d'apprentissage automatique pour la classification des types de sols à partir de caractéristiques physico-chimiques : application de Random Forest, XGBoost, SVM et KNN », VertigO - la revue électronique en sciences de l’environnement


Partage / Export

Résumé Fr En

Cette étude explore l'application des algorithmes d'apprentissage automatique pour la classification des types de sol, une tâche essentielle pour l'agriculture et la gestion durable des terres, en particulier dans des zones confrontées à des défis environnementaux tels que la dégradation des sols. La recherche a été menée dans la commune de Djilor, située dans le Sine Saloum au Sénégal, une région affectée par la salinisation et la perte de terres agricoles. En utilisant des caractéristiques physico-chimiques telles que la texture (pourcentages de sable, limon et argile), le pH, la matière organique, la capacité d'échange cationique (CEC), la densité apparente et la rétention d'eau, cette étude évalue les performances de quatre algorithmes : le Random Forest, le XGBoost, le SVM et le KNN. Un ensemble de 1000 échantillons aléatoires a été utilisé pour l'entraînement et les tests, avec une validation croisée et des matrices de confusion pour évaluer les performances. Les résultats montrent que le SVM obtient les meilleures performances avec une précision globale de 98,85 %, suivi par le Random Forest (97,13 %) et le KNN (95,40 %), tandis que le XGBoost affiche une précision de 94,83 %. Ces résultats soulignent la capacité des modèles à capturer les relations complexes entre les caractéristiques physico-chimiques, bien que des ajustements soient nécessaires pour améliorer leur capacité à gérer les classes minoritaires. L'analyse de l'importance des caractéristiques révèle que la texture du sol, notamment les pourcentages de sable et de limon, joue un rôle clé dans la classification des types de sol. Ces résultats mettent en évidence la pertinence de l'apprentissage automatique comme outil pour une gestion durable des terres agricoles et des ressources naturelles. Toutefois, l’étude souligne également des limitations, telles que la nécessité d’une validation avec des données terrain et d’une exploration de modèles plus complexes pour améliorer la robustesse et la généralisabilité des conclusions.

This study explores the application of machine learning algorithms for soil type classification, a crucial task for agriculture and sustainable land management, particularly in areas facing environmental challenges such as soil degradation. The research was conducted in the Djilor commune, located in the Sine Saloum region of Senegal, an area affected by salinization and agricultural land loss. Using physico-chemical characteristics such as texture (percentages of sand, silt, and clay), pH, organic matter, cation exchange capacity (CEC), bulk density, and water retention, this study evaluates the performance of four algorithms: Random Forest, XGBoost, SVM, and KNN. A set of 1000 random samples was used for training and testing, with cross-validation and confusion matrices to assess performance. The results show that SVM achieves the best performance with an overall accuracy of 98.85%, followed by Random Forest (97.13%) and KNN (95.40%), while XGBoost shows an accuracy of 93.68%. These results highlight the ability of the models to capture the complex relationships between the physico-chemical characteristics, although adjustments are needed to improve their ability to handle minority classes. The analysis of feature importance reveals that soil texture, particularly the percentages of sand and silt, plays a key role in soil type classification. These results highlight the relevance of machine learning as a tool for sustainable management of agricultural land and natural resources. However, the study also highlights limitations, such as the need for validation with field data and exploration of more complex models to improve the robustness and generalisability of the conclusions.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines