Ce livre sur la Data Science avec le langage Python, alliant théorie et pratique, s’adresse aussi bien aux étudiants et professionnels (ingénieurs, chercheurs, enseignants, data scientists), qu’aux informaticiens souhaitant apprendre à analyser des données avec Python.
La première partie du livre vise à introduire le langage Python et son utilisation dans le domaine de l’analyse de données. Le lecteur y découvre la mise en place de l’environnement de travail ainsi que des rappels sur le...
Ce livre sur la Data Science avec le langage Python, alliant théorie et pratique, s’adresse aussi bien aux étudiants et professionnels (ingénieurs, chercheurs, enseignants, data scientists), qu’aux informaticiens souhaitant apprendre à analyser des données avec Python.
La première partie du livre vise à introduire le langage Python et son utilisation dans le domaine de l’analyse de données. Le lecteur y découvre la mise en place de l’environnement de travail ainsi que des rappels sur le langage Python.
Dans une deuxième partie, le lecteur apprend à manipuler efficacement ses données grâce aux librairies NumPy et Pandas. Chaque notion est introduite théoriquement puis illustrée par un exemple concret permettant de comprendre son application. Il apprend à importer ses données sous Python et à utiliser les fonctions, méthodes et attributs fournis pour les explorer et les manipuler afin d’en faire ressortir des informations et tendances.
Dans une troisième partie, le lecteur apprend à visualiser ses données avec les librairies Matplotlib et Seaborn, lui permettant de comprendre l’architecture et le fonctionnement de la création de figures avec Python, ainsi que les types de graphiques à utiliser selon le type de variables à représenter.
Enfin, dans le dernier chapitre, l’auteur propose un exercice complet avec sa correction permettant de mettre en pratique les notions étudiées. Il permet au lecteur d’écrire le code permettant de répondre aux questions de l’exercice.
Pour chaque chapitre, un fichier contenant le code source utilisé, appelé notebook, est disponible en téléchargement sur le site www.editions-eni.fr. Ce notebook permet au lecteur de tester le code, de le modifier et d’y tester ses propres lignes de code. De plus, deux jeux de données réels sont disponibles en téléchargement et utilisés dans ce livre pour illustrer les propos de l’auteur.
8. Compter les films/séries produitspar les États-Unis et par la France
9. Afficher le contenu le plus vieux disponible sur Netflix
10. Afficher le film avec la durée la plus longuesur Netflix
a. Nouvelle notion : les méthodes str
b. Énoncé
11. Étudier les catégories avec le plusde contenu
12. Afficher les directeurs qui ont produit le plus defilms/séries disponibles sur Netflix
13. Voir si Jan Suter travaille souvent avec les mêmesacteurs
14. Représenter les dix pays qui ont produitle plus de contenus disponibles sur Netflix, avec le nombre de contenus parpays
15. Tracer un graphe à barres du nombre de films/sériespar classement de contenu (rating)
16. Afficher l’évolution du nombre de films/sériesdisponibles sur Netflix au cours du temps
a. Notions supplémentaires sur les dates
b. Énoncé
17. Afficher la distribution de la durée desfilms disponibles sur Netflix
18. Tracer un graphique représentant le nombrede séries par modalité de nombre de saisons
Version papier
Le livre est extra il permet sans connaissance préalable préalable de rentrer dans le monde de la data science. Le livre est passionnant et très pédagogique. L'autrice est un excellent professeur
AnonymeVersion papier
Pour ceux qui ne connaissent rien à python rien de plus…
AnonymeVersion en ligne
Livre complet sur les principales biblio de data science, avec un exercice sympa à réaliser
AnonymeVersion papier
Je n'ai pas encore eu le temps de me plonger dans la lecture de tous les livres, donc, jusqu'à preuve du contraire, je vais dire que je suis content.
Anonyme
Amandine VELT
Diplômée du master Bioinformatique Modélisation et Statistique de l’Université de Rouen Normandie, Amandine VELT est ingénieure en Bioinformatique à l’INRAE (Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement). Passionnée par la programmation, le traitement de données de grandes volumétries et l’enseignement, elle est aussi formatrice indépendante en Data Science avec les langages de programmation Python et R. Ses deux formations en ligne dans le domaine regroupent environ 3000 participants. Ce livre, qu’elle a voulu pratique et concret, est dédié aux lecteurs désireux d’apprendre à analyser des données ave le langage Python.