Cette vidéo de formation s'adresse à tous les décideurs et développeurs intéressés par le Big Data et désireux d’avoir un premier aperçu de la plateforme Hadoop et de son écosystème afin de comprendre ses concepts clés, son fonctionnement et ses possibilités.
Ainsi, après avoir défini les notions de NoSQL et de Big Data, vous apprendrez à installer Hadoop et étudierez les différents outils au cœur de la plateforme. Puis vous déploierez un...
Niveau Débutant à Initié
Durée 2h07
Parution janvier 2021
Cette vidéo de formation s'adresse à tous les décideurs et développeurs intéressés par le Big Data et désireux d’avoir un premier aperçu de la plateforme Hadoop et de son écosystème afin de comprendre ses concepts clés, son fonctionnement et ses possibilités.
Ainsi, après avoir défini les notions de NoSQL et de Big Data, vous apprendrez à installer Hadoop et étudierez les différents outils au cœur de la plateforme. Puis vous déploierez un cluster sur des machines virtuelles dans le cloud grâce à la distribution Cloudera Data Plateform.
Vous pourrez ensuite découvrir comment stocker des données dans Hadoop. Vous étudierez ainsi HDFS, le système de fichiers distribué de Hadoop, Apache Ozone pour le stockage objet et HBase en tant que base de données colonne. Vous verrez alors comment mettre en œuvre et exploiter chacun de ces types de stockage de données.
Une fois les données stockées, vous découvrirez dans la suite de la vidéo comment les traiter et les exploiter. Vous appréhenderez ainsi le paradigme de traitement distribué des données avec MapReduce, exploité dans un premier temps en PHP avec Hadoop Streaming, puis en Java avec les API dédiées. Vous développerez alors des traitements avec Spark ou en SQL avec Hive avant de transmettre les données résultantes dans une base de données relationnelle grâce à Sqoop.
Consultant et formateur indépendant, Simon GILLIOT, est expert Hadoop et HBase et certifié par Cloudera. Il met en place de nombreuses infrastructures et bénéficie d’une riche expérience dans le domaine du Big Data. Il intervient auprès des professionnels pour apporter des solutions efficaces aux besoins de très haute performance, de résilience et de scalabilité. Il a enregistré cette vidéo pour partager son savoir sur cet environnement.