Makina Corpus collabore avec l’ENSG pour le développement de l’outil geolabel-maker

Communiqué blog Makina Corpus par Daphné Lercier — publié 10/02/2021

Dans le cadre de nos activités R&D, Makina Corpus a proposé à Arthur Dujardin, étudiant de l’École Nationale des Sciences Géographiques, de contribuer aux développements de l’outil geolabel-maker.

Arthur Dujardin, en dernière année du cycle d’ingénieur de l’École Nationale des Sciences Géographiques, suit la filière PPMD (Photogrammétrie, Positionnement et Mesures de déformations) après une année à étudier à l’Université d’Oslo où il s’est spécialisé en Intelligence Artificielle (deep-learning) et traitement d’images. Depuis octobre, il travaille sur la création automatique de jeux d’apprentissage pour la cartographie par deep-learning avec Daphné Lercier, chercheuse chez Makina Corpus.

La cartographie par deep-learning

L’ouverture de données d’imagerie aérienne ou satellitaire de plus en plus précises, couplée avec l’arrivée d’algorithmes d’intelligence artificielle de plus en plus performants, révolutionne les pratiques en cartographie numérique. Désormais, les réseaux de neurones sont fréquemment sollicités pour les opérations de reconnaissance d’objets ou de détection de changements. Ces algorithmes font partie des algorithmes dits d’apprentissage supervisé dans la mesure où ils s’ajustent à partir d’un jeu de données d’apprentissage composé de différents exemples accompagnés du résultat attendu pour chacun.

Lorsque nous cherchons à localiser des objets (bâtiments ou zones végétalisées par exemple) dans des images aériennes, l’apprentissage du modèle de deep-learning choisi se base sur un jeu d’images et l’ensemble des positions des objets recherchés.

Geolabel-maker

Pour faciliter la création de ces jeux de données d’apprentissage, l’outil « geolabel-maker » a récemment été développé. Cet outil est disponible en open-source sur GitHub et permet de générer les couples d’images (image, label) à partir de données vecteurs et rasters hétéroclites.

Le jeu de données d’apprentissage produit peut également être fourni au format COCO. Le fonctionnement de l’outil est décrit dans le notebook Use_geolabel_maker, ainsi que dans la suite de tutoriels sur le blog de Makina Corpus.

Améliorations à venir

Le travail d’Arthur va permettre d’ajouter de nouvelles fonctionnalités à l’outil.

Il va tout d’abord permettre la récupération de données directement depuis des sources de données externes via des web services. Les images pourront donc être téléchargées depuis l’API Mapbox ou SentinelSat. Les géométries des objets étudiés pourront quant à elles être obtenues par extraction de données d’OpenStreetMap.

Le chargement de données sera également possible depuis une base de données PostGis.

Quant aux jeux de données d’apprentissage produits, ils pourront désormais répondre à davantage de besoins. Il sera notamment possible de créer un jeu de données prêt à l’emploi pour les modèles de classification d’images.

En attendant, si vous avez besoin d’aide dans vos projets de deep-learning, n’hésitez pas à contacter : contact@makina-corpus.com

Vous êtes membre de l’Afigéo et souhaitez communiquer sur votre actualité (évènement, communiqué, offre emploi…), proposez un article à communication@afigeo.asso.fr