contrib--caracol-community/slides/01-introduction.md
2020-04-15 14:05:27 +02:00

7.3 KiB
Raw Blame History

Gestion de projets data

Introduction, définition et enjeux

Glenn Y. Rolland glenux@glenux.net


Les data, qu'est-ce que c'est ?


Les data, qu'est-ce que c'est ?

Étymologie

Du latin datum (supin de do)

  • Don, cadeau, présent
  • S'utilise principalement au pluriel

Les data, qu'est-ce que c'est ?

Définition

  • (Informatique) Données, faits, informations.
  • (Philosophie) Se dit de faits connus dans le domaine scientifique et servant de départ à des recherches futures. (corrélatif de desiderata)

Contexte


Contexte

Un monde capitaliste... une incitation à

  • Vendre plus cher
  • Vendre plus
    • Elargir le marché (croissance horizontale)
    • Mieux cibler sa prospection → connaitre le consommateur
  • Payer moins cher les ressources
  • Être plus efficace / ressource
  • Produire plus / ressource
    • Acquérir de nouvelles compétences (croissance verticale)

Contexte

De plus en plus d'organisations...

  • Qui ont fait ou font leur transition numérique
  • Qui constatent qu'elles possèdent de l'information métier
  • Qui optent pour des stratégies data-driven
  • Qui se lancent dans un marathon de projets data science et intelligence artificielle
  • Qui espèrent profiter des avantages des nouvelles technologies et de la donnée

Contexte

De plus en plus de métiers...

  • De plus en plus de demande pour les compétences data
  • Data scientist
  • Data analyst
  • Data engineer
  • ...mais tout le monde peut utiliser les data dans sa pratique professionnelle

Contexte

De plus en plus de questions

  • Quelle est la meilleure approche pour réussir un projet
    • Big Data ?
    • ou Data Science ?
    • ou Machine Learning / Intelligence artificielle ?
  • Quels sont les acteurs nécessaires aux changements ?
  • Comment se déclinent les différentes étapes de conception et de déploiement de projets dans le temps ?

Enjeux autour des data


Enjeux autour des data

Être capable d'analyser...

  • C'est être capable de collecter, organiser, nettoyer, manipuler, décortiquer, analyser et visualiser des données
  • Pour des données internes ou externes, qualitatives ou quantitatives, à sa disposition
  • L'analyse de données, c'est de l'information... qui produit de l'information

Enjeux autour des data

...pour les utiliser !

  • L'information =
    • Valeur (directe ou indirecte)
    • Influence (sur un public, des bénéficiaires)
    • Temps d'avance (sur le marché, la concurrence, l'ennemi, etc.)
  • C'est une nouvelle forme de capital
    • Levier de pouvoir
    • Nouveaux rapports de force (propriétaire des moyens de production, force de production, exploités, etc.)
  • Les usages sont innombrables

Différents types de projets data


Différents types de projets data

Trois grandes classes d'objectifs

  • lautomatisation des processus
  • comprendre lexistant, détecter des patterns ou prédire des événements
  • lamélioration du niveau de service et lengagement vis-à-vis de lutilisateur final

Différents types de projets data

Robotic Process Automation (RPA) — présentation

  • La forme dIA la plus facile et la moins coûteuse à mettre en place
  • Porte ses fruits à court terme et son ROI est remarquable
  • Toutefois, nombreuses organisations ont encore du chemin à faire dans ce domaine

Différents types de projets data

Robotic Process Automation (RPA) — quelques exemples

  • Le transfert de données et des emails collectés dans divers systèmes dinformation pour mettre à jour les bases de données clients ou les opportunités détectées ;
  • Le rapprochement et contrôle des factures et commandes afin de rendre plus robuste les processus comptables ;
  • La lecture et analyse des contrats et documents légaux pour extraire des contraintes ou anomalies possibles.

Différents types de projets data

Analyse de données — présentation

  • Lanalyse de linformation (évolution "automatisée" des statistiques)
  • Lextraction de valeurs pertinentes depuis un vaste volume
    de données (Big Data)
  • À des fins descriptives ou prédictives

Différents types de projets data

Analyse de données — quelques exemples

  • Faire de la maintenance prédictive sur les chaines dindustrie
  • Identifier les fraudes possibles dans les systèmes bancaires ou dassurance ou les systèmes de santé
  • Automatiser le ciblage clientèle lors des campagnes marketing
  • Fournir aux assureurs des modèles plus précis sur les potentiels clients

Certaines pratiques de Machine Learning, dites de Deep Learning, permettent de :

  • Reconnaitre de la voix ou des images
  • Reconnaitre du langage naturel (Natural Language Processing ou NLP)

Différents types de projets data

Engagement et prise de décision — présentation

  • Engager lutilisateur final (employé ou client) dans un processus dinteraction avec la machine
  • Pour récolter de linformation
  • Pour fournir un service ou produit "plus" adapté

Différents types de projets data

Engagement et prise de décision — quelques exemples

  • Agents conversationnels (chatbots) intelligents
    • qui peuvent être sollicités 24/7
    • qui couvrent une panoplie de services dépendant du niveau dapprentissage du robot
  • Moteurs de recommandation qui orientent lutilisateur dans ses choix de services ou produits

Limites des projets actuels et nouveaux enjeux


Limites des projets actuels et nouveaux enjeux

Initiatives complexes

  • En terme de ressources humaines
  • En terme de processus transverse à l'entreprise
  • En terme de technologies

Manque de maturité

  • Des modeles difficilements industrialisables
    • Essentiellement des proof-of-concept
    • Peu d'outils et de formats standardisés
    • Pas de méthodes ou de normes sur la production

Limites des projets actuels et nouveaux enjeux

Pertinence de la donnée

  • Nous sommes capable de ratisser tres large mais...
    • Quelle est la qualité de la donnée ?
    • Est-elle pertinente ou est-elle un déchet ?
  • Comment assure-t-on la tracabilité de la donnée ?

Une approche centrée sur la technologie

  • La machine ne fait pas de prise en compte globale
  • L'analyse du contexte autour de la donnée, importe autant que cette dernière
  • Comment utilise-t-on la machine et l'humain dans leurs meilleurs rôles ?

Limites des projets actuels et nouveaux enjeux

Chaine opérationnelle

  • Besoin d'une vision transverse aux différents métiers
  • Mais organisation non mobilisée
    • Faible collaboration liées aux différences culturelles
  • Quels temps de réactions
    • entre la collecte, ...
    • ... le traitement, ...
    • ... et l'action ?

Limites des projets actuels et nouveaux enjeux

Des risques juridiques

  • Fuite de données personnelles dans les modeles (RGPD)
  • Discrimination liés aux données qu'il est difficile à expliquer (RGPD)
  • À qui appartient le modele entrainé sur la base de données d'un tiers (propriété intellectuelle / industrielle)

Merci pour votre attention !