Résumé du livre

Fundamentals of Machine Learning

Les fondements du ML pour l'analyse prédictive

Le manuel de référence du machine learning classique, organisé autour des quatre approches d'apprentissage — par l'information (arbres de décision), la similarité (k-NN), la probabilité (Bayes) et l'erreur (régression) — du cycle CRISP-DM à l'évaluation, avec des exemples chiffrés rigoureux.

Commencer 10 chapitres · ~191 min de lecture

Sommaire

  1. 01 Le machine learning pour l'analyse prédictive Ce qu'est l'analyse prédictive, comment une machine apprend un modèle à partir de données, le piège du sur-apprentissage, et le cycle CRISP-DM. 16 min
  2. 02 Des données aux décisions : problème, faisabilité et features Traduire un problème métier en solution analytique, évaluer sa faisabilité, et concevoir l'Analytics Base Table et ses descripteurs. 17 min
  3. 03 L'exploration des données et la qualité Le rapport de qualité des données, repérer valeurs manquantes, outliers et cardinalités douteuses, et préparer les données (normalisation, binning). 23 min
  4. 04 L'apprentissage par l'information : arbres de décision Poser la question la plus informative : entropie, gain d'information et l'algorithme ID3 qui construit des arbres de décision. 19 min
  5. 05 L'apprentissage par la similarité : k plus proches voisins Des instances semblables ont des cibles semblables : espace de features, métriques de distance et l'algorithme des k plus proches voisins. 24 min
  6. 06 L'apprentissage par la probabilité : Bayes Combiner connaissance a priori et observations : théorème de Bayes, classifieur naïf de Bayes et réseaux bayésiens. 18 min
  7. 07 L'apprentissage par l'erreur : régression et descente de gradient Ajuster les paramètres d'un modèle en minimisant l'erreur : régression linéaire, descente de gradient, régression logistique et SVM. 20 min
  8. 08 L'évaluation des modèles Estimer la vraie performance d'un modèle : jeu de test, validation croisée, matrice de confusion, précision/rappel, ROC et AUC. 19 min
  9. 09 Études de cas : churn client et classification de galaxies Deux applications complètes du processus CRISP-DM, de la compréhension métier au modèle évalué : la résiliation client et la classification de galaxies. 19 min
  10. 10 L'art du machine learning prédictif Choisir la bonne approche parmi les quatre familles, comprendre le rôle des données et du domaine, et les arbitrages qui font la maturité d'un praticien. 16 min