# Gestion de projets _data_ ### Introduction, définition et enjeux > Glenn Y. Rolland > --- ## Les data, qu'est-ce que c'est ? --- ## Les data, qu'est-ce que c'est ? ### Étymologie Du latin _datum_ (supin de _do_) * Don, cadeau, présent * S'utilise principalement au pluriel --- ## Les data, qu'est-ce que c'est ? ### Définition * (Informatique) Données, faits, informations. * (Philosophie) Se dit de faits connus dans le domaine scientifique et servant de départ à des recherches futures. (corrélatif de desiderata) ---- ## Contexte --- ## Contexte ### Un monde capitaliste... une incitation à * Vendre plus cher * Vendre plus * Elargir le marché (croissance horizontale) * Mieux cibler sa prospection → connaitre le consommateur * Payer moins cher les ressources * Être plus efficace / ressource * Produire plus / ressource * Acquérir de nouvelles compétences (croissance verticale) --- ## Contexte ### De plus en plus d'organisations... * Qui ont fait ou font leur transition numérique * Qui constatent qu'elles possèdent de l'information métier * Qui optent pour des stratégies data-driven * Qui se lancent dans un marathon de projets _data science_ et _intelligence artificielle_ * Qui espèrent profiter des avantages des nouvelles technologies et de la donnée ---- ## Contexte ### De plus en plus de métiers... * De plus en plus de demande pour les compétences data * Data scientist * Data analyst * Data engineer * __...mais tout le monde peut utiliser les data dans sa pratique professionnelle__ --- ## Contexte ### De plus en plus de questions * Quelle est la meilleure approche pour réussir un projet * Big Data ? * ou Data Science ? * ou Machine Learning / Intelligence artificielle ? * Quels sont les acteurs nécessaires aux changements ? * Comment se déclinent les différentes étapes de conception et de déploiement de projets dans le temps ? --- ## Enjeux autour des data --- ## Enjeux autour des data ### Être capable d'analyser... * C'est être capable de collecter, organiser, nettoyer, manipuler, décortiquer, analyser et visualiser des données * Pour des données internes ou externes, qualitatives ou quantitatives, à sa disposition * L'analyse de données, c'est de l'information... qui produit de l'information --- ## Enjeux autour des data ### ...pour les utiliser ! * L'information = * Valeur (directe ou indirecte) * Influence (sur un public, des bénéficiaires) * Temps d'avance (sur le marché, la concurrence, l'ennemi, etc.) * C'est une nouvelle forme de capital * Levier de pouvoir * Nouveaux rapports de force (propriétaire des moyens de production, force de production, exploités, etc.) * Les usages sont innombrables --- ## Différents types de projets data --- ## Différents types de projets data ### Trois grandes classes d'objectifs * l’automatisation des processus * comprendre l’existant, détecter des patterns ou prédire des événements * l’amélioration du niveau de service et l’engagement vis-à-vis de l’utilisateur final --- ## Différents types de projets data ## Robotic Process Automation (RPA) — présentation * La forme d’IA la plus facile et la moins coûteuse à mettre en place * Porte ses fruits à court terme et son ROI est remarquable * Toutefois, nombreuses organisations ont encore du chemin à faire dans ce domaine --- ## Différents types de projets data ## Robotic Process Automation (RPA) — quelques exemples * Le transfert de données et des emails collectés dans divers systèmes d’information pour mettre à jour les bases de données clients ou les opportunités détectées ; * Le rapprochement et contrôle des factures et commandes afin de rendre plus robuste les processus comptables ; * La lecture et analyse des contrats et documents légaux pour extraire des contraintes ou anomalies possibles. --- ## Différents types de projets data ### Analyse de données — présentation * L’analyse de l’information (évolution "automatisée" des statistiques) * L’extraction de valeurs pertinentes depuis un vaste volume de données (Big Data) * À des fins descriptives ou prédictives --- ## Différents types de projets data ### Analyse de données — quelques exemples * Faire de la maintenance prédictive sur les chaines d’industrie * Identifier les fraudes possibles dans les systèmes bancaires ou d’assurance ou les systèmes de santé * Automatiser le ciblage clientèle lors des campagnes marketing * Fournir aux assureurs des modèles plus précis sur les potentiels clients Certaines pratiques de _Machine Learning_, dites de _Deep Learning_, permettent de : * Reconnaitre de la voix ou des images * Reconnaitre du langage naturel (Natural Language Processing ou NLP) --- ## Différents types de projets data ### Engagement et prise de décision — présentation * Engager l’utilisateur final (employé ou client) dans un processus d’interaction avec la machine * Pour récolter de l’information * Pour fournir un service ou produit "plus" adapté --- ## Différents types de projets data ### Engagement et prise de décision — quelques exemples * Agents conversationnels (chatbots) intelligents * qui peuvent être sollicités 24/7 * qui couvrent une panoplie de services dépendant du niveau d’apprentissage du robot * Moteurs de recommandation qui orientent l’utilisateur dans ses choix de services ou produits --- ## Limites des projets actuels et nouveaux enjeux --- ## Limites des projets actuels et nouveaux enjeux ### Initiatives complexes * En terme de ressources humaines * En terme de processus transverse à l'entreprise * En terme de technologies ### Manque de maturité * Des modeles difficilements industrialisables * Essentiellement des _proof-of-concept_ * Peu d'outils et de formats standardisés * Pas de méthodes ou de normes sur la production --- ## Limites des projets actuels et nouveaux enjeux ### Pertinence de la donnée * Nous sommes capable de ratisser tres large mais... * Quelle est la qualité de la donnée ? * Est-elle pertinente ou est-elle un déchet ? * Comment assure-t-on la tracabilité de la donnée ? ### Une approche centrée sur la technologie * La machine ne fait pas de prise en compte globale * L'analyse du contexte autour de la donnée, importe autant que cette dernière * Comment utilise-t-on la machine et l'humain dans leurs meilleurs rôles ? --- ## Limites des projets actuels et nouveaux enjeux ### Chaine opérationnelle * Besoin d'une vision transverse aux différents métiers * Mais organisation non mobilisée * Faible collaboration liées aux différences culturelles * Quels temps de réactions * entre la collecte, ... * ... le traitement, ... * ... et l'action ? --- ## Limites des projets actuels et nouveaux enjeux ### Des risques juridiques * Fuite de données personnelles dans les modeles (RGPD) * Discrimination liés aux données qu'il est difficile à expliquer (RGPD) * À qui appartient le modele entrainé sur la base de données d'un tiers (propriété intellectuelle / industrielle) --- ## Merci pour votre attention !