Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Quelle méthode adopter pour estimer le besoin en aide alimentaire ? #4

Open
martindaniel4 opened this issue Apr 10, 2015 · 17 comments

Comments

@martindaniel4
Copy link
Contributor

Nous devons pouvoir estimer le besoin en aide alimentaire d'une zone géographique (ville, canton, département) et le comparer avec l'actuelle distribution proposée par les centres croix rouge.

Pour chaque centre croix rouge (avec nom de ville et département), nous disposons d'une vue agrégée sur les bénéficiaires, avec notamment :

  • Les tranches de revenu
  • La CSP
  • Le nombre de membres de la famille

La première approche à laquelle nous pensons est la suivante: consturire un proxy du besoin en aide alimentaire à partir de données ouvertes (taux de chômage, revenus par foyer, densité urbaine, toute autre données INSEE ou autre de niveau locale). Ce proxy serait construit/appris à partir des données de distribution actuelles. Les "outliers" d'un tel modèle mettraient en évidence les zones surinvesties / sous-investies.

  • Cette approches est-elle convenable ? Quelles sont ses faibless ?
  • Quelle autre approche serait possible?
@c-o c-o changed the title Quelle méthode adopter pour estimer la demande en aide alimentaire ? Quelle méthode adopter pour estimer le besoin en aide alimentaire ? Apr 13, 2015
@RomainWarlop
Copy link
Contributor

@martindaniel4 t'entends quoi par construire un proxy ?

Niveau méthodo on peut construire un clustering de type EM à partir de l'ensemble des données que tu cites + taille de la ville, aide reçu, répartition des revenues (pour voir si fort écart dans la ville), proximiter à une grande ville, ... Ensuite on essaie à posteriori de ranker les clusters du plus nécessiteux au moins nécessiteux et on regarde le taux d'implantation de la croix rouge dans chaque cluster. T'en penses quoi ?

@martindaniel4
Copy link
Contributor Author

@RomainWarlop : ça me parait top. Faut tester. On a aussi des données sur les
bénéficiaires - ce qu ils demandent ainsi que certaines caractéristiques (revenu, sexe, charges etc..), je me dis qu on peut lier ça à des donnés INSEE.

@samronsin, @c-o vous en pensez quoi ?

@RomainWarlop
Copy link
Contributor

@martindaniel4 ok, du coup dans l'idéal il faut avoir toutes les variables dispo sur les bénéficiaires dans notre table servant au clustering, ça nous aidera pour le ranking a posteriori

@samronsin
Copy link

@martindaniel4 Je pense aussi que des données INSEE pourraient être très utiles pour modéliser la demande. Un des problèmes avec les données CRF c'est qu'on ne verra pas de demande là où ils ne sont pas...

@samronsin
Copy link

@RomainWarlop @martindaniel4 Une fois qu'on a modélisé une demande, on ne manquera pas de méthodes pour la comparer avec l'offre CRF (peut-être le plus simple à modéliser par ailleurs). Je dis juste ça pour ne pas s'arrêter au clustering, qui serait une excellente approche parmi d'autres, a priori.

Du coup ma suggestion serait de commencer par l'offre CRF telle qu'elle est actuellement histoire de se faire la main, puis la demande avec des données INSEE, puis plancher sur des offres CRF optimisées. Qu'en pensez-vous?

@martindaniel4
Copy link
Contributor Author

@samronsin @RomainWarlop 👍

@RomainWarlop
Copy link
Contributor

@samronsin, @martindaniel4 yes je suis aussi d'accord pour les données INSEE. Pour moi y'a deux tables distinctes, une avec toute sorte de données dont INSEE et une avec les données sur les bénéficiaires. La première sert pour le clustering, la deuxième pour le ranking des clusters. Y'a pas besoin de géo loc avec la deuxième table, elle sert au descriptif des profils. Je vais essayer de lister les variables accessibles.

@samronsin yes on peut commencer par là.

@martindaniel4
Copy link
Contributor Author

@RomainWarlop @samronsin j'ai ajouté des données INSEE , c'est inspiré de ce post. Je vais les documenter dans le Wiki

@RomainWarlop si tu commences à documenter des tables, hésite pas à renseigner ça sur le Wiki ici

@martindaniel4
Copy link
Contributor Author

@samronsin @RomainWarlop y a aussi les autres centres de distribution à prendre en compte (Restos du coeur, secours populaire, banque alimentaire)

@samronsin
Copy link

J'ai demandé à un pote à Étalab s'ils avaient ces données, on verra ce qu'il en dit...

@martindaniel4
Copy link
Contributor Author

@samronsin cool. J'ai aussi demandé à un contact aux Restos du coeur.

@c-o
Copy link
Contributor

c-o commented Apr 14, 2015

@samronsin "Un des problèmes avec les données CRF c'est qu'on ne verra pas de demande là où ils ne sont pas...", c'était justement pour ça l'histoire du proxy: si on arrive à corréler un modèle CRF avec un modèle INSEE, on peut extrapoler pour les zones sans CRF
@RomainWarlop j'aime bien l'idée de clustering car il pourrait donner des informations intelligibles si on arrive à tagger correctement les clusters (genre cluster des familles nombreuse en zone non dense avec 1 travail temps partiel). Pour que la CRF arrive localement à mieux prouver leur nécessité, c'est plus "vendeur" d'avoir des règles intelligibles.
pour moi CRF ça voulait dire Conditionnal Random Field, mais ça ne marchait pas dans la conversation :)

@martindaniel4
Copy link
Contributor Author

@c-o, @RomainWarlop, @samronsin Je vous conseille la lecture du rapport 2014 de l'action sociale de la croix rouge.

Il y a notamment une carte, du taux de pauvreté monétaire et des quartiers prioritaires définis par la Croix Rouge, cf :

L’identification de ces nouveaux quartiers se fonde sur le critère unique de la pauvreté, c’est-à-dire la concentration des populations ayant des ressources inférieures à 60 % du revenu médian.

capture d ecran 2015-04-15 a 10 28 08

Il semble également qu'on puisse récupérer la localisation des bénévoles, puisqu'à la page 9, il y a une carte de la répartition des 33 000 bénévoles :

capture d ecran 2015-04-15 a 10 37 40

La partie sur l'aide alimentaire et vestimentaire se trouve p.37. Intéressant notamment l'exemple des jardiniers solidaires. C'est exactement ce genre de partenariat, local, avec la grande distribution qu'il faudrait arriver à monter

Les jardiniers solidaires
L’Unité Locale de Moulins a choisi de sensibiliser les jardiniers à les offrir à la Croix Rouge afin d’améliorer la diversité des denrées proposées lors des aides alimentaires en renforçant la part de légumes et fruits frais. Et pourquoi ne pas inciter également les cultivateurs à mettre quelques plants destinés à notre association ? Cette initiative, relayée par TF1 et FR3 en 2013, a permis d’accroître considérablement les apports de l’aide alimentaire en récupérant 1,5 T de légumes et fruits en 2013, chiffre largement dépassé en 2014.

@martindaniel4
Copy link
Contributor Author

@samronsin @RomainWarlop @lefko200 @rquilliet @c-o @NebJ : est ce que vous êtes chauds pour faire une rencontre ensemble (dans la vraie vie) et taffer 2h ensemble sur un premier livrable ?

On pourrait se donner rendez vous lundi ou mardi semaine prochaine.

Who's in ?

@rquilliet
Copy link
Contributor

Yo Martin,

Pas possible pour moi lundi / mardi. Suis à l'étranger ...

Mais complètement opé pour la vraie vie :)

Remi

Le 16 avril 2015 12:48, Martin Daniel [email protected] a écrit :

@samronsin https://github.com/samronsin @RomainWarlop
https://github.com/RomainWarlop @lefko200 @rquilliet
https://github.com/rquilliet @c-o https://github.com/c-o @NebJ
https://github.com/NebJ : est ce que vous êtes chauds pour faire une
rencontre ensemble (dans la vraie vie) et taffer 2h ensemble sur un premier
livrable ?

On pourrait se donner rendez vous lundi ou mardi semaine prochaine.

Who's in ?


Reply to this email directly or view it on GitHub
#4 (comment)
.

@RomainWarlop
Copy link
Contributor

Yo, ouais trop, la vraie vie c'est cool.
Perso le jeudi me va un peu mieux la semaine prochaine, lundi pas possible et mardi s'il le faut j'viendrai.

Romain

@samronsin
Copy link

@martindaniel4 I'm in!

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

5 participants