Cette vidéo de formation s'adresse à tout développeur, administrateur système ou décideur informatique. Elle présente l'HDFS (Hadoop Distributed File System) et ses particularités afin d'en obtenir une connaissance approfondie. Elle va vous permettre également de développer une application se basant sur l'HDFS - en lien ou non avec Hadoop - et de profiter ainsi de ses possibilités de réplication et de très haute...
Niveau Confirmé à Expert
Durée 1h58
Parution septembre 2016
Cette vidéo de formation s'adresse à tout développeur, administrateur système ou décideur informatique. Elle présente l'HDFS (Hadoop Distributed File System) et ses particularités afin d'en obtenir une connaissance approfondie. Elle va vous permettre également de développer une application se basant sur l'HDFS - en lien ou non avec Hadoop - et de profiter ainsi de ses possibilités de réplication et de très haute disponibilité.
Après une introduction rapide des systèmes de fichiers en général puis d'Hadoop, nous nous pencherons sur les spécificités de l'HDFS : parallélisation et réplication des fichiers par blocs.
Ensuite, nous détaillerons HadoopFS, une couche d'abstraction permettant d'interagir avec des systèmes de fichiers, qu'ils soient locaux ou distribués comme l'HDFS, Amazon S3, Cassandra, CephFS. Nous étudierons les interfaces qu'offre HadoopFS pour contrôler les systèmes de fichiers compatibles et notamment l'HDFS, que ce soit en ligne de commande, en programmation Java ou via des appels HTTP. Nous illustrerons chacune de ces possibilités par des exemples simples et concrets.
Enfin, nous nous pencherons plus spécifiquement sur le fonctionnement profond de l'HDFS et de ses services afin de comprendre au mieux ses particularités : la notion de NameNode, de DataNode et les points essentiels du stockage dans l'HDFS.
Des éléments complémentaires sont en téléchargement sur le site www.editions-eni.fr.
Consultant et formateur indépendant, Simon GILLIOT, est expert Hadoop et HBase et certifié par Cloudera. Il met en place de nombreuses infrastructures et bénéficie d’une riche expérience dans le domaine du Big Data. Il intervient auprès des professionnels pour apporter des solutions efficaces aux besoins de très haute performance, de résilience et de scalabilité. Il a enregistré cette vidéo pour partager son savoir sur cet environnement.