Building reproducible analytical pipelines with R
Publié le 27 avril 2023
Bruno Rodrigues
1 jeux de données
5 réutilisations
Informations
- Type
- Papier
- Thématique
- Science et technologie
- ID
- 644a248d84d8660017abb278
Publication
Intégrer sur votre site
URL stable
Description
Ce livre en anglais utilise les données de l'observatoire de l'habitat pour illustrer comment définir des pipelines analytiques reproductibles afin de générer des produits de données cohérents et de haute qualité à l'aide de R, Github et Docker. À travers les chapitres du livre, j'explique comment, à partir de l'Excel "Série rétrospective des prix annoncés des maisons par commune, de 2010 à 202x", on peut utiliser des concepts tels que la programmation fonctionnelle et lettrée pour mener une analyse statistique. Cette analyse est ensuite rendue reproductible en utilisant des outils permettant de figer les dépendances nécessaires à l'exécution de l'analyse, en plus de Docker pour figer l'environnement entier de production. Le livre se termine par expliquer comment exécuter les pipelines sur Github Actions.
Jeux de données utilisés 1
Discussion entre le producteur et la communauté à propos de cette réutilisation.
Plus de réutilisations
Découvrez davantage de réutilisations.