-
Notifications
You must be signed in to change notification settings - Fork 11
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Quelle méthode adopter pour estimer le besoin en aide alimentaire ? #4
Comments
@martindaniel4 t'entends quoi par construire un proxy ? Niveau méthodo on peut construire un clustering de type EM à partir de l'ensemble des données que tu cites + taille de la ville, aide reçu, répartition des revenues (pour voir si fort écart dans la ville), proximiter à une grande ville, ... Ensuite on essaie à posteriori de ranker les clusters du plus nécessiteux au moins nécessiteux et on regarde le taux d'implantation de la croix rouge dans chaque cluster. T'en penses quoi ? |
@RomainWarlop : ça me parait top. Faut tester. On a aussi des données sur les @samronsin, @c-o vous en pensez quoi ? |
@martindaniel4 ok, du coup dans l'idéal il faut avoir toutes les variables dispo sur les bénéficiaires dans notre table servant au clustering, ça nous aidera pour le ranking a posteriori |
@martindaniel4 Je pense aussi que des données INSEE pourraient être très utiles pour modéliser la demande. Un des problèmes avec les données CRF c'est qu'on ne verra pas de demande là où ils ne sont pas... |
@RomainWarlop @martindaniel4 Une fois qu'on a modélisé une demande, on ne manquera pas de méthodes pour la comparer avec l'offre CRF (peut-être le plus simple à modéliser par ailleurs). Je dis juste ça pour ne pas s'arrêter au clustering, qui serait une excellente approche parmi d'autres, a priori. Du coup ma suggestion serait de commencer par l'offre CRF telle qu'elle est actuellement histoire de se faire la main, puis la demande avec des données INSEE, puis plancher sur des offres CRF optimisées. Qu'en pensez-vous? |
@samronsin, @martindaniel4 yes je suis aussi d'accord pour les données INSEE. Pour moi y'a deux tables distinctes, une avec toute sorte de données dont INSEE et une avec les données sur les bénéficiaires. La première sert pour le clustering, la deuxième pour le ranking des clusters. Y'a pas besoin de géo loc avec la deuxième table, elle sert au descriptif des profils. Je vais essayer de lister les variables accessibles. @samronsin yes on peut commencer par là. |
@RomainWarlop @samronsin j'ai ajouté des données INSEE là, c'est inspiré de ce post. Je vais les documenter dans le Wiki @RomainWarlop si tu commences à documenter des tables, hésite pas à renseigner ça sur le Wiki ici |
@samronsin @RomainWarlop y a aussi les autres centres de distribution à prendre en compte (Restos du coeur, secours populaire, banque alimentaire) |
J'ai demandé à un pote à Étalab s'ils avaient ces données, on verra ce qu'il en dit... |
@samronsin cool. J'ai aussi demandé à un contact aux Restos du coeur. |
@samronsin "Un des problèmes avec les données CRF c'est qu'on ne verra pas de demande là où ils ne sont pas...", c'était justement pour ça l'histoire du proxy: si on arrive à corréler un modèle CRF avec un modèle INSEE, on peut extrapoler pour les zones sans CRF |
@c-o, @RomainWarlop, @samronsin Je vous conseille la lecture du rapport 2014 de l'action sociale de la croix rouge. Il y a notamment une carte, du taux de pauvreté monétaire et des
Il semble également qu'on puisse récupérer la localisation des bénévoles, puisqu'à la page 9, il y a une carte de la répartition des 33 000 bénévoles : La partie sur l'aide alimentaire et vestimentaire se trouve p.37. Intéressant notamment l'exemple des jardiniers solidaires. C'est exactement ce genre de partenariat, local, avec la grande distribution qu'il faudrait arriver à monter
|
@samronsin @RomainWarlop @lefko200 @rquilliet @c-o @NebJ : est ce que vous êtes chauds pour faire une rencontre ensemble (dans la vraie vie) et taffer 2h ensemble sur un premier livrable ? On pourrait se donner rendez vous lundi ou mardi semaine prochaine. Who's in ? |
Yo Martin, Pas possible pour moi lundi / mardi. Suis à l'étranger ... Mais complètement opé pour la vraie vie :) Remi Le 16 avril 2015 12:48, Martin Daniel [email protected] a écrit :
|
Yo, ouais trop, la vraie vie c'est cool. Romain |
@martindaniel4 I'm in! |
Nous devons pouvoir estimer le besoin en aide alimentaire d'une zone géographique (ville, canton, département) et le comparer avec l'actuelle distribution proposée par les centres croix rouge.
Pour chaque centre croix rouge (avec nom de ville et département), nous disposons d'une vue agrégée sur les bénéficiaires, avec notamment :
La première approche à laquelle nous pensons est la suivante: consturire un proxy du besoin en aide alimentaire à partir de données ouvertes (taux de chômage, revenus par foyer, densité urbaine, toute autre données INSEE ou autre de niveau locale). Ce proxy serait construit/appris à partir des données de distribution actuelles. Les "outliers" d'un tel modèle mettraient en évidence les zones surinvesties / sous-investies.
The text was updated successfully, but these errors were encountered: