From designing a large-scale observation system to deploying and operating its information systemApplication to the observation of coralligenous habitats and the colonization of artificial reefs (ARMS) De la conception d'un système d'observation à large échelle au déploiement et à l'exploitation de son système d'information : application à l'observation des habitats coralligènes et à la colonisation de récifs artificiels (ARMS) En Fr

Metadatas

Author
Date

July 6, 2018

type
Language
Identifiers
License

info:eu-repo/semantics/OpenAccess


Keywords

database coralligenous information systems graphs mediterranean méditerranée base de donnée observation coralligène graphes systèmes d’information -bio]/Ecology, environment/Ecosystems


Cite this document

Romain David, « From designing a large-scale observation system to deploying and operating its information systemApplication to the observation of coralligenous habitats and the colonization of artificial reefs (ARMS) », Le serveur TEL (thèses-en-ligne), ID : 10670/1.0i5q41


Metrics


Share / Export

Abstract En Fr

In the field of marine environment, observation protocols developed in many settings produce a large volume of heterogeneous data, which are difficult to aggregate since they focus on the use that is often specific to a profession. However, access and sharing of data on a large scale is essential to better understand the challenges behind protecting biodiversity and marine resources, and to anticipate their irreversible deterioration. To address these challenges, there is a need to strengthen the effectiveness of knowledge acquisition systems, and to organise data access for all potential users. Improving the consistency between observational systems and informational systems is the main objective of this work. Effective implementation of large-scale observational systems requires an inventory of knowledge, available skills and locks to be lifted. Monitoring networks for environmental protection become multi-user and must produce sufficient reliable descriptors to develop an effective reporting.The present work proposes to develop i) methods, protocols and recommendations to build and / or support the establishment of networks for monitoring biodiversity (from gene to species to habitats), operational and sustainable at all scales, (ii) innovative usage of data, their conservation and the organisation of their permanent access.Two case studies were chosen: coralligenous habitats at the Mediterranean scale and the colonisation of artificial reefs (ARMS) in various regional seas, focusing on: the construction of sustainable monitoring and observational networks; efficient sharing and inter-operability of long-term knowledge along with data analysis methods exploiting advances in the field of Big Data, and the analysis of heterogeneous data in the form of graphs.The testing of the proposed protocols developed during this thesis shows that a large-scale experiment must be described very explicitly in standardised terms beyond the disciplinary field of marine ecology and to be based on the simplest possible measurement methods. These tests also demonstrated the importance of operator’s training and iterative intercalibration.The work on the architecture of informational systems highlights the inevitability of a modular management system, business-oriented and decentralised. A mechanism for coupling data of different origins accessible in the form of parameterisable and open flows is proposed (field observations and data describing the contexts). It is based on the requalification of heterogeneous descriptive factors built on a collaborative arbitration between specialists. Thanks to the development of a prototype, a method of analysis and data mining based on graph theory has been experimented. Diverse types of possible demonstrations based on the data were constructed through the organisation of multidisciplinary curation and graphical data visualszation workshops.In conclusion, we recommend that the information produced is iteratively controlled in real time and that the curation processes of the data is implemented at the same time as the design of the observational processes. Standard definitions and access to context data require collaborative, interdisciplinary, iterative, long-term, international work. They must be considered for all their possible uses.In perspective, the use of the computation grid to carry out graph mining in a parallel way was prepared during the workshops, with the challenge of scaling up distributed and very heterogeneous data and forming graphs with more than one billion nodes and several hundred billions links.

Dans le domaine de l’environnement marin, des protocoles d’observation développés dans de nombreux cadres produisent un grand volume de données hétérogènes, difficiles à agréger car centrées sur l’utilisation souvent spécifique à un métier. L’accès et le partage des données à large échelle est pourtant incontournable pour mieux cerner les enjeux de protection de la biodiversité et des ressources marines, et anticiper leur détérioration irréversible. Pour répondre à ces enjeux, il est nécessaire de renforcer l’efficacité des systèmes d’acquisition de connaissances, et d’organiser l’accès aux données pour tous les utilisateurs potentiels. Améliorer la cohérence entre systèmes d’observation et systèmes d’information est l’objectif cadre de ce travail. La mise en place efficace de systèmes d’observation à large échelle nécessite un état des lieux des connaissances, des compétences disponibles et des verrous à lever. Les réseaux de suivi pour la protection environnementale deviennent multi-usagers et doivent produire suffisamment de descripteurs fiables pour élaborer une indication et un reportage performants.Ce travail propose i) des méthodes, protocoles et recommandations pour construire et/ou soutenir la mise en place de réseaux de suivis de la biodiversité (du gène aux espèces et aux habitats), opérationnels et pérennes à toutes les échelles, ii) des utilisations novatrices des données, de leur conservation et de l’organisation de leurs accès permanent.Deux cas d’étude ont été choisis : les habitats coralligènes à l’échelle de la Méditerranée et la colonisation de récifs artificiels (ARMS) dans différentes mers régionales, en focalisant sur : la construction de réseaux de suivi et d’observation pérennes, le partage efficace et l’inter-opération des connaissances à long terme et les méthodes d’analyses de données exploitant les avancées dans le domaine du Big Data, et de l’analyse de données hétérogènes sous forme de graphes.Le test des protocoles élaborés dans le cadre de cette thèse montre qu’une expérimentation à large échelle doit être décrite très explicitement dans des termes standardisés au-delà du champ disciplinaire de l’écologie marine et se baser sur des méthodes de mesures les plus simples possibles. Ces tests ont aussi montré l’importance de la formation des opérateurs et d’une intercalibration itérative.Le travail sur l’architecture des systèmes d’information met en évidence l’inévitabilité d’un système de gestion modulaire, orienté “métier” et décentralisé. Un mécanisme de couplage de données de différentes origines accessibles sous forme de flux paramétrables et ouverts est proposé (observations de terrain et données décrivant les contextes). Il s’appuie sur la requalification des facteurs descriptifs hétérogènes reposant sur un arbitrage collaboratif entre spécialistes. Grâce au développement d’un prototype, une méthode d’analyse et de fouille de données basé sur la théorie des graphes a été expérimentée. Différents types de démonstrations possibles partant des données ont été construits grâce à l’organisation d’ateliers multidisciplinaires de curation et de visualisation de données sous forme de graphes.En conclusion, nous recommandons que l’information produite soit contrôlée par itérations en temps réel et que les processus de curation de la donnée soient mis en œuvre en même temps que la conception des procédés d’observation. Les définitions de standards et les accès aux données de contextes nécessitent un travail collaboratif, interdisciplinaire, itératif produit sur le long terme sur un plan international. Ils doivent être considérés pour toutes leurs utilisations possibles.En perspective, l’utilisation de la grille de calcul pour faire de la fouille de graphes de manière parallélisée a été préparée lors des ateliers, avec le challenge d’un passage à l’échelle avec des données distribuées et très hétérogènes formant des graphes de plus d’un milliard de nœuds et plusieurs centaines de milliards de liens.

From the same authors

On the same subjects

Similar documents