jeudi 16 avril 2015

Analyse du livre "Big Data et Machine Learning" (vision Chef de Projet)

Introduction


Cet article est le premier prévu sur quatre d'un livre très récent dédié au Big Data, à la Data Science et notamment au Machine Learning.
Ce premier article donnera ma vision du livre d'un point de vue gestion de projet ou même sur la gouvernance de ce type de projet de Data Science.
Les autres articles seront plus dédiés à la mention indiquant "Manuel du data scientist" avec 3 visions différentes :

  • du point de vue du statisticien
  • du point de vue du data miner 
  • du point de vue du spécialiste en computer vision

En deux mots


L'ouvrage est clair, construit en 3 grandes parties qui peuvent être abordée séparément :

  1. Les fondements du Big Data 
  2. Le métier de Data Scientist
  3. Les outils du Big Data

Il permet à des profils sans bagages mathématiques d'aborder les notions autour de ce mot galvaudé qu'est le "Big Data".

Même les notions plus ardues de Machine Learning (et donc de Data Mining) au travers de schémas et d'explications claires arrivent à être accessibles ou du moins dans le pire des cas le terme sera évocateur. Pas besoin ici, d'avoir mal à la tête avec des termes mathématiques comme le "maximum de vraisemblance" et d'autres termes pouvant très vite refroidir plus d'une personne allergique aux maths.

Au final

C'est un très bon livre d’introduction quasiment sans formules de math à faire peur, accessible à l'ensemble des acteurs de ce type de projet même côté métier.

Le livre peut être un excellent point de départ pour travailler en commun avec différents acteurs, connaître le vocabulaire et les notions sous-jacentes.

Enfin, pour la création d'un Data Lab, toutes les étapes y sont décrites. Côté gouvernance, le livre constitue donc la première pierre d'un édifice à construire à plusieurs dont les étapes et le vocabulaire seront partagés.



Aucun commentaire:

Enregistrer un commentaire