Cover image

Big data et machine learning : les concepts et les outils de la data science / Pirmin Lemberger,... Marc Batty,... Médéric Morel,... [et al.] ; préface d'Aurélien Géron

PPN : 195624653Main Author : Lemberger, PirminCoauthor : Batty, MarcCoauthor : Morel, MédéricCoauthor : Raffaëlli, Jean-LucSecondary author : Géron, Aurélien (19..-....) Edition : 2e éditionPublication : Malakoff : Dunod, DL 2016Description : 1 vol. (XVI-255 p.) : ill., couv. ill. en coul. ; 25 cmISBN : 978-2-10-075463-2Note : Suite du tirage : 2018Belong to the serie : InfoPro. Management des systèmes d'informationOther edition on other media : Big data et machine learningSubject - Topical Name : Données massives | Apprentissage automatique | Exploration de données | Big data | Machine learning | Data mining Document type : Livre
Item type Current location Call number Status Date due Barcode Item holds
Prêt normal BU Beaulieu
BU Beaulieu - Informatique et Sciences de l'ingénieur (RdC)
006.312 LEM BIG 2016 (Browse shelf) Available 0992750316
Prêt normal BU Beaulieu
BU Beaulieu - Informatique et Sciences de l'ingénieur (RdC)
006.312 LEM BIG 2016 (Browse shelf) Available 0992750309
Total holds: 0

Suite du tirage : 2018

Autre contribution : Jean-Luc Raffaëlli (auteur)

Notes bibliogr. et webogr. Index

4e de couv. : " Cet ouvrage s’adresse à tous ceux qui réfléchissent à la meilleure utilisation possible des données au sein de l’entreprise, qu’ils soient data scientists, DSI, chefs de projets ou spécialistes métier. Le Big Data s’est imposé comme une innovation majeure pour toutes les entreprises qui cherchent à construire un avantage concurrentiel grâce à l’exploitation de leurs données clients, fournisseurs, produits, processus, machines, etc. Mais quelle solution technique choisir ? Quelles compétences métier développer au sein de la DSI ? Ce livre est un guide pour comprendre les enjeux d’un projet Big Data, en appréhender les concepts sous-jacents (en particulier le machine learning) et acquérir les compétences nécessaires à la mise en place d’un data lab... Cette deuxième édition est complétée et enrichie par des mises à jour sur les réseaux de neurones et sur le Deep Learning ainsi que sur Spark."

P. III Préface P. XV Avant-propos Première partie - Les fondements du Big Data P. 3 Chapitre 1 - Les origines du Big Data P. 3 1.1 La perception de la donnée dans le grand public P. 5 1.2 Des causes économiques et technologiques P. 8 1.3 La donnée et l'information P. 9 1.4 La valeur P. 10 1.5 Les ressources nécessaires P. 11 1.6 De grandes opportunités P. 13 Chapitre 2 - Le Big Data dans les organisations P. 13 2.1 La recherche de l'Eldorado P. 14 2.2 L'avancée par le cloud P. 15 2.3 La création de la valeur P. 15 2.4 Les « 3V » du Big Data P. 17 2.5 Un champ immense d'applications P. 19 2.6 Exemples de compétences à acquérir P. 22 2.7 Des impacts à tous les niveaux P. 26 2.8 « B » comme Big Data ou Big Brother ? P. 29 Chapitre 3 - Le mouvement NoSQL P. 29 3.1 Bases relationnelles, les raisons d'une domination P. 34 3.2 Le dogme remis en question P. 40 3.3 Les différentes catégories de solutions P. 50 3.4 Le NoSQL est-il l'avenir des bases de données ? P. 53 Chapitre 4 - L'algorithme MapReduce et le framework Hadoop P. 53 4.1 Automatiser le calcul parallèle P. 54 4.2 Le pattern MapReduce P. 58 4.3 Des exemples d'usage de MapReduce P. 63 4.4 Le framework Hadoop P. 68 4.5 Au-delà de MapReduce Deuxième partie - Le métier de data scientist P. 73 Chapitre 5 - Le quotidien du data scientist P. 73 5.1 Data scientist : licorne ou réalité ? P. 80 5.2 Le data scientist dans l'organisation P. 82 5.3 Le workflow du data scientist P. 91 Chapitre 6 - Exploitation et préparation de données P. 91 6.1 Le déluge des données P. 96 6.2 L'exploitation de données P. 101 6.3 La préparation de données P. 106 6.4 Les outils de préparation de données P. 109 Chapitre 7 - Le Machine Learning P. 109 7.1 Qu'est-ce que Le Machine Learning ? P. 119 7.2 Les différents types de Machine Learning P. 122 7.3 Les principaux algorithmes P. 136 7.4 Réseaux de neurones et Deep Learning P. 152 7.5 Illustrations numériques P. 163 7.6 Systèmes de recommandation P. 173 Chapitre 8 - La visualisation des données P. 173 8.1 Pourquoi visualiser l'information ? P. 177 8.2 Quels graphes pour quels usages ? P. 184 8.3 Représentation de donnée complexes Troisième partie - Les outils du Big Data P. 193 Chapitre 9 - L'écosystème Hadoop P. 194 9.1 La jungle de l'éléphant P. 196 9.2 Les composants d'Apache Hadoop P. 203 9.3 Les principales distributions Hadoop P. 206 9.4 Spark ou la promesse du traitement Big Data in-memory P. 212 9.5 Les briques analytiques à venir P. 214 9.6 Les librairies de calcul P. 219 Chapitre 10 - Analyse de logs avec Pig et Hive P. 219 10.1 Pourquoi analyser des logs ? P. 220 10.2 Pourquoi choisir Pig ou Hive ? P. 221 10.3 La préparation des données P. 226 10.4 L'analyse des parcours clients P. 229 Chapitre 11 - Les architectures gamma P. 229 11.1 Les enjeux du temps réel P. 231 11.2 Rappels sur MapReduce et Hadoop P. 231 11.3 Les architectures gamma P. 239 Chapitre 12 - Apache Storm P. 239 12.1 Qu'est-ce que Storm ? P. 240 12.2 Positionnement et intérêt dans les architectures gamma P. 241 12.3 Principes de fonctionnement P. 244 12.4 Un exemple très simple P. 247 Conclusion P. 251 Index

 

Powered by Koha