Introduction à R
Introduction
Dans ce chapitre, nous partons à la découverte de l’environnement de développement R. Dans une première partie on parlera de l’évolution du langage et du logiciel R, ses caractéristiques et ses rapports avec les autres langages. Ensuite, on montre comment le télécharger et l’installer sur Microsoft Windows, Linux et Mac OS X.
Finalement, nous aborderons deux des IDE, les plus fournis en fonctionnalités, RStudio et RTVS.
R, un langage statistique
R est devenu rapidement populaire depuis sa première sortie en 1997. La croissance continue des packages fortement propulsée par l’élargissement de sa communauté constituée tant de développeurs particuliers que des contributeurs issus de firmes de taille telles que Microsoft, IBM, Google, etc. fait de R aujourd’hui l’outil statistique le plus fourni en fonctionnalités.
Dans cette section, il sera retracé le parcours fabuleux du langage R, ainsi que ses caractéristiques vis-à-vis des impératifs du domaine de la science des données, mais également vis-à-vis des autres langages concurrents.
1. Histoire de R
À ses débuts en 1992, R était un projet de recherche mené par deux professeurs, Ross Ihaka et Robert Gentleman de l’université d’Auckland en Nouvelle-Zélande. Ainsi, à l’époque, il existait déjà un langage nommé S développé par Bell Laboratories, c’est de ce dernier que R tire sa syntaxe de base. Dans un cours de présentation de R, R. Ihaka blaguait en disant que l’idée de nommer le langage R venait du fait que ce soit la première lettre des prénoms des deux auteurs. Il faut noter qu’ils étaient connus comme l’équipe "R & R" du Département de Statistique de l’université d’Auckland.
La première forme complète du langage est achevée en 1994 et encouragée par les collègues, R a été distribué comme projet open source. À cette époque, la renommée de R est limitée à la sphère académique, mais rapidement la communauté des utilisateurs s’agrandit et devient trop difficile à gérer par deux individus alors submergés de suggestions d’améliorations et de corrections de bugs dans le langage.
Il va sans dire que R allait connaître non seulement d’importants changements, mais qu’également l’équipe de maintien allait s’étendre pour devenir en 1997, R core group. Cette année fut un point marquant de l’histoire de R, puisque Kurt Hornik...
Quelques IDE pratiques
R est un langage statistique, mais un langage de programmation tout de même, et à l’instar des autres langages il a besoin d’un environnement de développement proposant plus de fonctionnalités notamment :
-
création et gestion de projet
-
explorateur d’objet et de fichier
-
outils de débogage
-
interfaces d’importation/exportation de données
-
interfaces de visualisation et sauvegarde des graphiques
-
interfaces de téléchargement et de gestion des packages
-
un éditeur de texte enrichi (coloration de texte, autocomplétion, etc. En bref, avec les fonctionnalités IntelliSense)
-
historisation des commandes, fenêtres d’aide, etc.
Et bien sûr une console interactive.
R a vu se développer plusieurs IDE qui l’intègrent. On a donc choisi de présenter deux des IDE les plus intéressants, mais aussi les plus aisés d’utilisation à ce jour (ceci reste un point de vue et les IDE présentés sont simplement des suggestions).
1. RStudio
Le plus populaire et le plus complet à ce jour, RStudio est un IDE bâti spécialement pour R. C’est aussi le projet de la société de même nom fondée par JJ Allaire, qui a sorti la première version du logiciel en 2011. C’est une société membre Platinum du consortium R au même titre que Microsoft ou IBM, etc. Nonobstant sa jeunesse, RStudio n’a pas tardé à s’imposer comme IDE de référence à la communauté des développeurs R, ce qui a nettement favorisé son amélioration et encouragé de nombreux contributeurs et concepteurs de packages R à rejoindre l’équipe RStudio. Plusieurs aide-mémoires sur l’utilisation de plusieurs packages majeurs ont été réalisés par la société RStudio qui propose le logiciel à titre gratuit, et payant pour la version pro. Ci-dessous, le lecteur peut observer une capture d’écran de la version 1.1.383 :
Sur www.rstudio.com, le site officiel de la société RStudio, se trouve une description plus complète des différentes versions du logiciel (versions Desktop et Serveur).
a. Téléchargement et installation
Bien...