Ce projet cherche à gérer les données de l'enquête NSU en :
- Obtenir les données. Ceci consiste du :
- Téléchargement des données.
- Fusionnement de différentes bases.
- Organisation des images.
- Valider les données. En particulier, identifier des problèmes que Survey Solutions ne peut pas déceler :
- Incohérences dans les relevés (e.g. une unité de taille petite qui pèse plus la même unité de taille moyenne.
- Trucage des photos. Voir si les enquêteurs ont utilisé la même image pour plusieurs relevés.
- Valeurs extrêmes.
- Créer des rapports de suivi.
- Pour les données :
- Confirmer la réception du nombre attendu d'entretiens par marché.
- Suivre le nombre de produit-unité avec un faible nombre par strate.
- Cohérence interne des données (e.g. poids d'une unité de taille petite est moin que le poids d'une unité de taille grande)
- Vraisemblence des données dans le sens d'identifier des valeurs extrêmes.
- R
- RTools, si l'on utilise Windows comme système d'exploitation
- RStudio
Ouvrir pour voir plus de détails 👁️
- Suivre ce lien
- Cliquer sur votre système d'exploitation
- Cliquer sur
base
- Télécharger and installer (e.g., this pour le compte de Windows)
Nécessaire pour le système d'exploitation Windows
- Suivre ce lien
- Cliquer sur
Windows
- Cliquer sur
RTools
- Télécharger (e.g.,this pour une architecture 64bit)
- Installer dans le lieu de défaut suggéré par le programme d'installation (e.g.,
C:\rtools4'
)
Ce programme permet à R de compiler des scripts écrit en C++ et utilisé par certains packages pour être plus performant (e.g., {dplyr}
).
- Suivre ce lien
- Cliquer sur le bouton
DOWNLOAD RSTUDIO
- Sélectionner le bon fichier d'installation selon votre système d'exploitation
- Télécharger et installer (e.g., this pour le compte de Windows)
RStudio est sollicité pour deux raisons :
- Il fournit une bonne interface pour utiliser R
- Il est accompagné par Quarto, un programme dont nous nous serviront pour créer certains documents.
Sur votre serveur SuSo, créer un compte API (procédure ici) et lui donner accès à l'espace de travail qui héberge le questionnaire NSU (procédure ici).
Avant de lancer le programme, fournir les détails de connexion dans _details_serveur.R
. Ces informations permettront ces programme d'interagir avec le serveur pour votre compte à travers l'utilisateur API.
Ouvrir le projet en tant que tel. En particulier, double-cliquer sur nsu_sgd.Rproj
. Ceci aura l'effet de l'ouvrir dans RStudio et d'enclencher l'activation de l'environment du projet (e.g., installer les packages requis au niveau du projet). (Pour en savoir plus, lire ici et ici.)
Pour chaque action, exécuter le programme afférant :
01_obtenir_01_donnees.R
. Télécharger et décomprimer les données brutes. Résultats dans :01_obtenir/01_donnees
.01_obtenir_02_images.R
. Télécharger et décomprimer les images. Résultats dans :01_obtenir/02_images
.02_fusionner_donnees.R
. Fusionner les données. Résultats dans :02_fusionner/donnees
.03_classer_images.R
. Reclasser les images: créer un nouveau système de répertoires, ajouter des informations dans le nom d'images, et mettre les images dans les nouveaux répertoires. Résultats dans :03_classer/images
.05_suivre_donnees.R
. Créer un rapport l'exhaustivité, la cohérence, et la vraisemblance des données. Résultats dans :05_suivre/rapport
.05_suivre_images.R
. Créer un rapport sur la réutilisation d'image et d'image des unités "autre". Résultats dans :05_suivre/rapport
.
En cas de problème :
- Lire les messages d'erreur. Parfois, ils indiquent le problème et quelques pistes de solution.
- Lire les problèmes fréquemment rencontrés ici-bas.
- Contacter l'équipe de développement, en fournissant les étapes suivies et les messages d'erreur (e.g. captures d'écran)
Voici quelques problèmes fréquemments rencontrés :
- Serveur n'existe pas à l'adresse fourie
- Impossible d'installer les packages
- `curl::curl_fetch_memory()
- Problème L'adresse fournie ne permet pas au programme de se connecter au site.
- Solution. Vérifier l'adresse et/ ou la connexion. Par exemple:
- Voir si cette adresse amène au serveur lorsque mise dans un navigateur web
- Voir si le serveur est en ligne / joignable
- Confirmer que des règles du pare-feu n'empêche pas l'accès au serveur avec la connexion.
- Problème. Le programme cherche à installer, au niveau du projet, les packages requis. Or l'installation peut échouer pour plusieurs raisons.
- Solution. Confirmer:
- Installation de pré-requis.
- Chez le système d'exploitation Windows, l'installation de RTools. Pour certains packages, R se sert de code en d'autres langues (e.g., C++ pour des opérations plus performantes). Pour l'employer dans un package, il faut le "compiler". Pour ce faire, on a besoin de RTools. Dans l'absence de ce programme, impossible d'installer certains packages.
- Chez le système d'exploitation Linux, l'installation a besoins de certains packages Linux. Si cela s'applique à vous, veuillez contacter l'équipe de développement de ce programme pour une liste des packages Linux requis.
- Ouverture du projet comme un projet. Pour installer les packages requis dans la manière escomptée, il faut ouvrir ce projet en tant que tel. Voir ici pour plus de détails.
- Installation de pré-requis.
- Problème. Le serveur a trop tardé à répondre au programme (i.e., à l'outil employé par le programme pour communiquer avec le serveur). Le programme échoue en raison de non-réponse du serveur.
- Solution. Une recherche de solution est en cours. Ce problème s'applique au téléchargement automatisé des données et des images, respectivement. En attendant une meilleure solution, si le téléchargement échoue, il est conseillé de télécharger manuellement dans le bon répertoire et de lancer les autre programmes normalement.
Pour les données :
- Télécharger ici :
01_obtenir\01_donnees
- Décomprimer dans des sous-dossiers dans ce même dossier
Pour les images :
- Télécharger ici
01_obtenir\02_images
- Décomprimer dans des sous-dossiers dans ce même dossier