Dernière mise à jour le 11/06/2025

Structuration et documentation des données pour l’IA

Informations générales

Type de formation : Formation continue
Domaine : IA, Big Data et Bases de données
Filière : IA
Rubrique : Certification ATLAS : CISIA (Actions co.)
Formation éligible au CPF : Non
Formation Action collective : Oui Code ACO : CISIA

Objectifs & compétences

Documenter le flux de traitement des données : De la source à l’exploitation, en couvrant la chaîne d’approvisionnement (C1, C3).
Documenter  le cycle  de vie  de  la  donnée  :  De  sa création  à son archivage  ou suppression (C1, C8).
Comprendre les enjeux de la documentation des jeux de données pour répondre aux besoins métiers et aux cas d’usage (C1).
Identifier les risques éthiques et sociétaux liés à la collecte et à l'utilisation des jeux de données (C2).
Préparer et structurer les données afin de renforcer leur intégrité pour une utilisation dans un modèle d'IA (C3).
Élaborer une documentation technique claire pour assurer la transparence et la traçabilité des données (C8).
 

Public visé

Toute personne impliquée dans la gestion et la documentation des données.
 

Pré-requis

Notions de base en gestion de données et en traitement des données.
Compréhension des concepts fondamentaux liés aux chaînes d’approvisionnement des données.
Notions de base en gestion de données (CSV, Excel, SQL).
Compréhension de l'importance des données pour les cas d’usage IA.
Connaissance des concepts de base en intelligence artificielle

Programme

Documenter les Flux et le Cycle de Vie des Données – 4H00 – 2, 3
Documenter et Structurer les Jeux de Données pour l'IA – 4H00 – 1, 2, 3
 
CISIA-DOC01 : Documenter les Flux et le Cycle de Vie des Données – 4H00 – 2, 3
 
  • Introduction à la documentation du flux de traitement des données (1 heure)
  •  
      • Présentation des concepts de flux de données et de chaîne d’approvisionnement (C1)
      • Méthodes  pour  documenter  chaque  étape  du  flux  de  données,  de  la  source  à
    l’exploitation (C3)
     
    2. Documentation du cycle de vie de la donnée (1 heure)
     
      • Étapes  du  cycle  de  vie  des  données  :  collecte,  stockage,  traitement,  utilisation, archivage (C1)
      • Importance de la documentation pour chaque phase du cycle de vie (C8)
     
    3. Considérations éthiques et réglementaires dans la documentation (1 heure)
     
      • Identification des risques éthiques et sociétaux associés aux données (C2)
      • Respect du cadre réglementaire lors de la documentation des données (C2)
     
    4. Mise en pratique : Atelier de documentation (1 heure)
     
      • Exercice pratique : Création d’une documentation pour un flux de traitement et un cycle de vie de données (C1, C8)
      • Analyse et discussion des résultats (C8)
     
     
    CISIA-DOC02 : Documenter et Structurer les Jeux de Données pour l'IA – 4H00 – 1, 2, 3
     
     
  •  Introduction à la documentation des jeux de données (1 heure)
  •  
      • Importance de la documentation (C1)
      • Présentation des datasheets et de la documentation technique (C1, C8)
     
    2. Structure et intégrité des données (1 heure)
     
      • Techniques de structuration et préparation des données (C3)
      • Vérification de la cohérence et de la pertinence des données pour un cas
    d’usage IA (C1, C3)
     
    3. Considérations éthiques et réglementaires dans la documentation (1 heure)
     
      • Identification des risques éthiques et sociétaux (C2)
      • Cadre réglementaire et législation sur la confidentialité des données (C2)
     
    4. Mise en pratique : Élaboration d'une documentation technique (1 heure)
     
      • Atelier pratique : création d’une datasheet pour un jeu de données (C1,
    C8)
      • Documentation des étapes de traitement de la donnée (C8)
     
     

    Modalités

    L’ensemble du parcours est accessible en présentiel, à distance ou mode hybride.
     
    Présentation théorique en présentiel (4 heures).
    Atelier pratique avec exercices en ligne et en présentiel (4 heures).
     

    Méthodes

    Élaboration d’un document complet pour le flux de traitement et le cycle de vie d’un
    jeu de données
    Élaboration et présentation d’une datasheet pour un jeu de données

    Les certifications

    A l'issus du parcours (10 modules), les candidats pourrons passer le jury de certifcation ATLAS :
    Concevoir et implémenter une solution d'IA
    Code de formation : CISIA-DOC

    Tarifs

    Prix public : 1000
    Tarif & financement :
    Financement possilble via les Actions Collectives ATLAS ou le Plan de Formation.

    Lieux & Horaires

    Durée : 8 heures
    Rythme :
    9h-13h et 14h-18h
    Délai d'accès :
    Jusqu'a 8 jours avant le début de la formation, sous condition d'un dossier d'insciption complet

    Prochaines sessions

    Handi-accueillante Accessible aux personnes en situations de handicap. Pour toutes demandes, contactez notre référente, Mme Rizlene Zumaglini Mail : rzumaglini@aston-ecole.com

    à voir aussi dans le même domaine...

    Formation continue

    IA

    CISIA-MEN

    Analyser les Menaces et Atténuer les Risques dans les Solutions d’IA

    Analyser les Menaces Associées à l'Élaboration d'une Solution d'IA (Compétence C2)

          • Identifier les risques éthiques et sociétaux liés à l'exploitation des solutions d'IA.
          • Comprendre les implications réglementaires et éthiques pour prévenir les dérives potentielles.
    Comprendre et Appliquer les Mécanismes d'Atténuation des Attaques Adversariales (Compétence C4)
          • Étudier les techniques et les approches pour atténuer les attaques adversariales contre les modèles d'IA.
          • Mettre en œuvre des stratégies pour protéger les modèles contre ces attaques.
    Évaluer les Risques Résiduels et Assurer la Sécurité des Modèles d'IA (Compétence C8) Évaluer l'efficacité des mécanismes d'atténuation et les risques résiduels associés. Adapter les stratégies de sécurité en fonction des résultats de l'évaluation des risques

    8 heures de formations sur 1 Jours
    En savoir plus

    Formation continue

    IA

    MSAI900

    Microsoft Azure AI Les Fondamentaux

    Cette formation présente les concepts fondamentaux liés à l’intelligence artificielle (AI) ainsi que les services de Microsoft Azure qui peuvent être utilisés pour créer des solutions d’intelligence artificielle.

    7 heures de formations sur 1 Jours
    En savoir plus

    Formation continue

    IA

    CISIA-MIA

    Conception et développement de modèles IA Performants

    Comprendre les spécificités des modèles IA et leurs cas d’usage. Développer des modèles IA performants avec Python et ses bibliothèques. Ajuster les hyperparamètres pour optimiser les performances des modèles. Maîtriser les techniques de validation et d’évaluation des modèles IA  

    14 heures de formations sur 2 Jours
    En savoir plus

    Formation continue

    IA

    LEDN211

    IA – langage : NLP, traduction, analyse

    A l’issue de la formation, le stagiaire sera capable :

          • Comprendre les principes du NLP et savoir les mettre en œuvre avec Python.
     

    14 heures de formations sur 2 Jours
    En savoir plus

    Formation continue

    IA

    CISIA-MSP

    Suivi de la Performance et Amélioration Continue des Modèles

    Identifier et corriger les dérives des modèles IA en production. Définir et mesurer les indicateurs de performance des modèles IA. Appliquer les meilleures pratiques de versionnage et suivi des modèles IA. Mettre en place des tableaux de bord pour suivre l'évolution des modèles.  

    22 heures de formations sur 3 Jours
    En savoir plus

    Formation continue

    IA

    LEDN215

    OpenAI Initiation – Génération de contenus avec ChatGPT et DALL-E 2

    A l’issue de la formation, le stagiaire sera capable :

          • Pouvoir développer de façon autonome des solutions applicatives tirant parti des  services fournis par les API fournies par OpenAI, notamment ChatGPT et DALL-E 2
      

    21 heures de formations sur 3 Jours
    En savoir plus