Concept très relatif, la vulnérabilité d’une personne, d’une communauté est une équation dont les principales inconnues sont le choc subis et la résilience (capacité à faire face au choc). L’action humanitaire dont le but est de sauver des vies est généralement apportée aux tranches les plus fragiles d’une population affectée par un choc. Mais comment sont-ils identifiés ces vulnérables ? Quels sont les critères de ciblage de ces vulnérables ? Existe –il une démarche (ou une théorie) pour cibler des bénéficiaires de l’assistance humanitaire ? Ces questions, notamment la dernière, méritent d’être examiner de près. En effet, il serait souhaitable, selon les caractéristiques du choc et la nature de la réponse humanitaire, d’établir une démarche pour le ciblage des vulnérables. La littérature courante mentionne quatre types de ciblage adaptables selon les contextes et surtout selon la nature des programmes à mettre en œuvre. Dans cette note, je propose d’utiliser l’approche « data mining » pour cibler les bénéficiaires de l’assistance alimentaire. Le data mining est défini comme un Processus non-trivial d’identification de structures inconnues, valides et potentiellement exploitables dans les bases de données.
Résultat du test 1 de l’outil d’analyse de la vulnérabilité Cas du camp de Mugunga 3/ Nord Kivu
Par Ollo Sib
Le concept de vulnérabilité
Concept très relatif, la vulnérabilité d’une personne, d’une communauté est une équation dont les principales inconnues sont le choc subis et la résilience (capacité à faire face au choc). L’action humanitaire dont le but est de sauver des vies est généralement apportée aux tranches les plus fragiles d’une population affectée par un choc.
Mais comment sont-ils identifiés ces vulnérables ? Quels sont les critères de ciblage de ces vulnérables ? Existe –il une démarche (ou une théorie) pour cibler des bénéficiaires de l’assistance humanitaire ?Ces questions, notamment la dernière, méritent d’être examiner de près. En effet, il serait souhaitable, selon les caractéristiques du choc et la nature de la réponse humanitaire, d’établir une démarche pour le ciblage des vulnérables.
1 La littérature courante mentionne quatre types de ciblage adaptables selon les contextes et surtout selon la nature des programmes à mettre en œuvre.
Dans cette note, je propose d’utiliser l’approche« data mining » pour cibler les bénéficiaires de l’assistance alimentaire. Le data mining est défini comme un Processus non-trivial d’identification de structures inconnues, valides et potentiellement exploitables dans les bases de données.
Les déterminants de l’insécurité au Nord Kivu
Le PAM en collaboration avec le gouvernement provincial du Nord Kivu a mis en place une importante base de données contenant plus de 300 indicateurs de la sécurité alimentaire. Ces indicateurs ont été collectés sur environ 5000 ménages entre 2008 et 2011.
1 L’auto sélectionn’impose pas de conditions d’éligibilité mais repose sur la qui mise en œuvre d’incitations qui encouragent la participation des plus démunis et découragent les plus nantis. Les incitations s’appuient sur l’existence de différences entre pauvres et non pauvres du point de vue de leurs coûts d’opportunité à participer ou non au programme. En d’autres termes, les mécanismes d’attribution font en sorte que le coût implicite de la participation au programme soit proportionnel au niveau de revenu ou de richesses des participants ;
Le ciblage par critère d’éligibilité consisteà identifier les bénéficiaires des programmes à mettre en œuvre à partir de leurs caractéristiques. Les critères définis portent généralement sur un indicateur de niveau de vie (Mean testing) ou sur des variables supposées corrélées au niveau de vie (Proxy-mean testing) ;
Le ciblage communautaireconsiste à demander à la communauté d’identifier en son sein les bénéficiaires pour un programme donné. Cela suppose généralement que soit les communautés connaissent très bien le type de programme (distribution gratuite par exemple) ou bien des critères sont établis soit conjointement avec les membres de la communauté soit par l’institution qui met en œuvre le type de programme.
Le ciblage géographiqueà identifier des entités géographiques dans consiste lesquelles un programme doit être mis en œuvre mais cela suppose que la population à l’intérieur de cette entité soit homogène du point de vue des caractéristiques retenues.
Ollo Sib : VAM/WFP-Goma
L’un des indicateurs de cette base est le score de consommation alimentaire, calculé sur la base d’un rappel sur les derniers jours, des groupes d’aliments consommés par le ménage. C’est un donc indicateur proxy de la sécurité alimentaire qui traduit un régime alimentaire diversifié et riche.Ce score permet donc de mesurer l’insécurité alimentaire sans toutefois l’expliquer.
Alors,quels sont les facteurs qui expliquent l’insécurité alimentaire ?Ou encore quels sont les déterminants de cette insécurité alimentaire mesurée par le score de consommation alimentaire ?
J’ai répondu à cette question par une analyse statistique de la base de données existante. Pour ce faire, j’ai procédé à une régression linéaire, en considérant l’insécurité alimentaire (établit par le score de consommation alimentaire) comme variable dépendante qui serait expliquée par 51 autres variables. Ces 51 variables explicatives peuvent être agrégées comme suit :
Sexeduchefdeménage: Ce critère est une variable dichotomique qui prend les valeurs 0 (femme) et 1 (homme). Les ménages ayant comme chef une femme sont généralement plus affectés par l’insécurité alimentaire.
La taille du ménage : c’est le nombre de personnes que compte le ménage ;elle indique le nombre de bouches à nourrir. Les ménages de grande taille pourraient êtredavantage en insécurité alimentaire notamment quand la proportion de population dépendante augmente.
Nombre d’enfants de moins de 5 ans: c’est la tranche de la population la plus fragile et généralement la plus touchée par les problèmes nutritionnels et alimentaires. Les ménages qui comptent plus d’enfants de moins de cinq ans pourraient êtret davantage exposés à l’insécurité alimentaire.
Les biens durables (actifs productifs): Machine à coudre, outils agricoles (houe, hache etc.), Charrette, Moulin, Bicyclette ou moto, Radio, Matériel de pêche, Matériel de chasse (fusil), téléphone portable, bœufs, chèvres, moutons, lapins, porcs, volaille. Globalement, la possession de biens a un effet positif sur la sécurité alimentaire. Ces critères sont considérés comme des variables dichotomiques qui prennent les valeurs 1 (oui) et 0 (non).
L’accès à la terre: l’on regarde aussi bien la superficie agricole utile (surface cultivée) que la totalité des terres possédée par le ménage et les cultures pratiquées (la rentabilité par surface donnée pouvant énormément varier suivant la culture). Dans le Nord Kivu, où la population est essentiellement agricole, la terre a une importante fonction sociale et économique.
Lesstratégiesdesurvie: elles sont les réponses des ménages face aux difficultés d’accès à la nourriture. Elles traduisent le niveau de stress du ménage face au choc et sa résilience future. L’on considère aussi bien les stratégies alimentaires que non alimentaires. Ces critères sont des variables dichotomiques qui prennent les valeurs 1 (oui) et 0 (non). Sourcesetniveauderevenu: les ménages cumulent parfois plusieurs sources de revenue. Pour les ménages pauvres, la vente de force de travail a toujours constitué la principale source de nourriture. Généralement, il s’agit de travailler sur base journalière, pour la nourriture directement ou de l’argent. Les autres sources Page | 1
de revenu ont été également intégrés au modèle pour avoir une vue d’ensemble du niveau de vie des ménages. Ces critères sont considérés comme des variables dichotomiques qui prennent les valeurs 1 (oui) et 0 (non).
Durée des stocks aliments (champs et greniers): les stocks disponibles chez le ménage traduit sa capacité à accéder facilement à la nourriture. Elle est estimée ici en durée (mois) ou et non en quantité de vivres stockés par le ménage.
Le modèle linéaire obtenu (analyse faite sur le logiciel SPSS) a les caractéristiques suivantes: R=0,579 et R²=0,335. Bien que relativement robuste, les discussions avec les experts de la sécurité alimentaire dans le Nord Kivu ont permis de valider ce modèle. Il a été par la suite appelé outil d’analyse de la vulnérabilité à l’insécurité alimentaire.
Une fois cette validation obtenue, j’ai procédé à deux tests du modèle, d’abord sur le staff du PAM à Goma puis à Mugunga 3, un camp de 1811 personnes considérées vulnérables par l’approche CCCM.
Caractéristiques des échantillons
Echantillon test: 81 staff (PAM, FAO) Echantillon d’apprentissage: les bénéficiaires IDPs dans le camp de Mugunga 3. Sur ce site le PaM assiste (aout 2011) 1811 personnes (486 ménages). L’on tire dans cette population un échantillon aléatoire de 330 personnes reparties sur 195 ménages.
Tous ces ménages ont été soumis à l’outil d’analyse de la vulnérabilité à l’insécurité alimentaire. Les données collectées ont été par la suite analysées. L’approche «data mining» a été principalement retenue pour l’analyse. Les résultats obtenus sont édifiants.
Data mining & le ciblage
Dans cette section, l’analyse est faite à l’aide du logiciel TANAGRA.
L’analyse indique que tous les employés du PAM et la FAO sont en sécurité alimentaire. Mais, les cadres et ceux qui ont un contrat de travail d’une durée d’au moins 6 mois ont un score de consommation alimentaire moyen de 81 contre 46 pour la catégorie des employés journaliers.
Donc les cadres ont une meilleure situation alimentaire que les journaliers. L’outil d’analyse de la vulnérabilité a permis de différentier à l’intérieur d’un groupe les caractéristiques de ces sous-groupes. Ce test est donc positif.
81,6% des ménages dans le camp de Mugunga 3 seraient en insécurité alimentaire.
Le ménage en insécurité alimentaire réalise un score de consommation alimentaire de 32,4. C’est un ménage de taille 4 dirigé par une femme de 49 ans, avec 3 enfants de moins de cinq. Ce ménage expérimente régulièrementdes stratégies de survie alimentaires sévères et ne dispose presque pas de stock alimentaire. Aussi, ce ménage a très peu accès à l’information, car il ne possède ni radio ni téléphone portable.
Partial Least Squares Discriminant Analysis
Ollo Sib : VAM/WFP-Goma
Cette technique vise à prédire les valeurs prises par la variable sécurité alimentaire (avec ces deux modalités: insécurité alimentaire/ insécurité alimentaire) à partir des variables explicatives.
Le taux d’erreur, indiqué dans la matrice de confusion est égal à 4,35%. C’est donc un taux bas ! Les coefficients de la fonction discriminante sont affichés (tableau 1) également pour chaque modalité (insécurité alimentaire et sécurité alimentaire).
Importance des variables
Dans le tableau 1, l’on note que toutes les variables descriptrices de l’insécurité alimentaire n’ont pas la même importance explicative de ce problème.
Tableau : Coefficients de la fonction discriminante
Insécurité Sécurité Attribut VIP alimentaire alimentaire constant 0,971611 0,028389-Score de consommation alimentaire -0,01258 0,012583,264 Radio (O=1/ N=0) -0,184655 0,1846552,1437 Téléphone portable (O=1/ N=0) -0,220562 0,2205621,8882 Acheter des produits alimentaires à crédit (O=1/ N=0) -0,087981 0,0879811,6849 Vente de la production agricole (O=1/ N=0) -0,406675 0,4066751,4314 Retirer les enfants de l'école (O=1/ N=0) 0,047291 -0,0472911,3679 Machine à coudre (O=1/ N=0) 0,161762 -0,1617621,244 Petit commerce (O=1/ N=0) 0,041938 -0,0419381,1615 Emploi dans une entreprise privée ou une ONG (O=1/ N=0)1,1489-0,190613 0,190613 Sexe du chef du ménage (H=1/F=0) -0,048104 0,0481041,1025 Charrette (O=1/ N=0) -0,526434 0,5264341,0781 Bicyclette ou moto (O=1/ N=0) -0,124473 0,1244731,0617 Travail agricole salarie ou emploi comme ouvrier (O=1/ N=0)1,05780,136761 -0,136761 Travail indépendant (ex. Menuiserie) (O=1/ N=0) -0,088497 0,0884971,0225 Combien d'hectares disposez-vous? 0,082821 -0,0828211,0074 Avez-vous cultive cette année? (O=1/ N=0) 0,017312 -0,0173121,0026 Diminuer les dépenses de soins de santé (O=1/ N=0) 0,126342 -0,1263420,9965 Disposez-vous de terres cultivables? (O=1/ N=0)-0,021876 0,0218760,952 Emprunter des aliments (O=1/ N=0) -0,067361 0,0673610,8894 Volailles (O=1/ N=0) -0,079969 0,0799690,8851 Recourir à des aliments moins appréciés et moins chers (O=1/ N=0)0,186902 -0,1869020,8513 Combien de personne vivent actuellement dans ce ménage ?0,010579 -0,0105790,8349 Limiter la taille des parts pendant les repas (O=1/ N=0) -0,090168 0,0901680,8178
La colonne VIP : Variable Importance in Projection (dans la figure 1) nous donne l’importance de chaque variable pour la prédiction de l’insécurité alimentaire à travers les principaux facteurs retenus.
Page | 2
La VIP nous permet de hiérarchiser les variables selon leur pouvoir explicatif sur l’insécurité alimentaire. Une variable est à considérer avec attention dès lors que VIP≥1. Aussi, une autre règle serait de supprimer les variables dont la VIP ≤0,8; le coefficient de régression associé étant très petit en valeur absolue. Le tableau 1 ci-dessus indique que 16 variables (en couleur), avec une VIP≥ 1 expliquent le mieux l’insécurité alimentaire chez les ménages du camp.A ces 16 variables, j’ai ajouté sept autres variables dont la VIP≥0,8.
Par conséquent, ce résultat indique qu’il est possible de construire un score qui sera une somme de ces variables pondérés par leur coefficient de régression. Les individus seront classés par ordre croissant deleur score. Les individus avec un score élevé seront les plus vulnérables à l’insécurité alimentaire.
Ce score ainsi obtenu détermine la vulnérabilité des individus à l’insécurité alimentaire. Plus ce score est élevé, plus grande sera la vulnérabilité de l’individu à l’insécurité alimentaire.
L’on note qu’en plus du score de consommation alimentaire, indicateur proxy de la sécurité alimentaire, ce score de vulnérabilité à l’insécurité alimentaire intègre d’autres indicateurs liés aux stratégies de survie, aux sources de revenu et aux biens. De ce fait, il devrait faciliter davantage la prise de précision.
Maintenant que le score est construit pour chaque individu, nous pouvons évaluer la performance du ciblage. Pour ce faire, je vais utiliser la courbe LIFT.
Cette courbe décrit le pourcentage de population vulnérable à l’insécurité alimentaire retrouvé pour différentes taille de la cible.
Dans le cas de Mugunga 3, l’on obtient le tableau 2 ci-dessous. Pour différentes tailles de la cible (target size), l’on a la proportion de ménages vulnérables à l’insécurité alimentaire (TP-rate).
Sur la base de ces données, l’on peut construire la courbe LIFT ci-dessous. En abscisse, je mets la population du camp assistée (1 correspond à 100% de la population considérée vulnérable selon le CCCM, soit 1811 personnes). En ordonnée, je mets la proportion de la population vulnérable à l’insécurité alimentaire (1 correspond à 100% des ménages en insécurité alimentaire, soit 1477 personnes).
Figure : Courbe LIFT
Processus de décision
Par définition, le data mining est du domaine de la statistique décisionnelle. Comme indiqué plus haut, je l’ai adapté à l’action humanitaire en vue de facilité la décision, notamment dans le choix des plus vulnérables. Très souvent, les ressources (humaines, financières et matérielles) limitées obligent les acteurs humanitaires au ciblage.
Arbre de décision actuel pour l’aide alimentaire
Jusqu’à présent, dans le camp de Mugunga 3, la décision d’octroi de l’assistance alimentaire a été faite sur la base du score de consommation. L’arbre de décision a été le suivant : ·Score de consommation alimentaire < 56,0447 then Aide alimentaire car vulnérable (Yes/No) = Yes (91,03 % of 78 examples) ·Score de consommation alimentaire >= 56,0447 then Aide alimentaire car vulnérable (Yes/No) = No (100,00 % of 52 examples) Le taux d’erreur associé à cette décision est de 7,18%.
L’on note que le seuil du score de consommation alimentaire n’a été respecté. Normalement, seuls les ménages avec un score de consommation alimentaire inférieur à 42 (tout au plus) devraient recevoir l’assistance alimentaire. Il y a donc une inclusion relativement importante.
Le scoring permet d’éviter ce type d’inclusion et offre des options résolutives larges pour une réponse pertinente à l’insécurité alimentaire chez les ménages.
Page | 3
Considérons donc le cas du camp de Mugunga 3, où le PAM assiste sans ciblage 1811 personnes, alors que la population totale en insécurité alimentaire serait de 1477 personnes.
Le classement des individus par ordre décroissant du score de vulnérabilité à l’insécurité alimentaire indique que 90% des plus vulnérables auraient besoin d’une assistance alimentaire directe.
Cela représente 1329 personnes les plus vulnérables choisis sur 1477 globalement en insécurité alimentaire.
Cela voudrait dire que l’on fait une inclusion maximale de 482 personnes dans l’assistance alimentaire directe. Le nombre minimum de personnes incluses étant de 334 personnes (en considérant que l’on donne de la nourriture aux 100% à priori en insécurité alimentaire).
L’on voit qu’avec un bon ciblage, le PAM distribuerait la nourriture à 90% de ménages les plus vulnérables qui représenterait environ 75% de la population total actuellement assistée.
Cela aura des implications à la fois sur les quantités distribuées mais également sur l’utilisation de la nourriture après distribution. En effet, en donnant la nourriture à des ménages les plus vulnérables à l’insécurité alimentaire, l’on est assuré d’une consommation maximale des vivres.
Les 10% des ménages avec des scores les plus bas, ont dans une large proportion un accès à en moyenne 10 ares de terres cultivables et ont cultivé cette année. Pour ces ménages, en situation transitoire, l’aide alimentaire directe continue ne saurait être indiquée. Un projet de création d’actifs de trois mois conviendrait certainement mieux à cette catégorie de ménages.
Estimation des quantités de vivres perdues sans ciblage
Par mois, pour ces 1811 personnes du camp, le PAM fournit 30,15 Métriques Tonnes (MT) de vivres, si l’on considère une ration complète par personne (555 grammes).
Par contre, si le ciblage est correctement fait et que les vivres vont aux 1329 personnes les plus vulnérables, ce tonnage tomberait à 22,13 MT.
Par conséquent, chaque mois,au plus 8,02 MT sont perdus (vendus ?)alors qu’ils pourraient être distribués à d’autres ménages vulnérables installés en dehors du camp. Il faut savoir que les résidents autour de ce camp sont les principaux acheteurs des vivres distribués aux bénéficiaires.
Points forts de l’outil de vulnérabilité à l’insécurité alimentaire
Ecrire le score de consommation alimentaire comme une fonction l linéaire d’une combinaison de facteurs simplifie son calcul. Tout le monde peut le calculer sans être un VAM officer! Aussi, le fait d’intégrer plusieurs facteurs permet une meilleure explication de l’insécurité alimentaire constatée chez les ménages.
Habituellement, les ménages avec des scores de consommation alimentaire pauvre et limite sont ciblés pour l’assistance. Aussi, de plus en plus, l’on recommande également d’assister les ménages avec un score de consommation alimentaire acceptable mais qui appliquent des stratégies de survie sévères. L’outil de vulnérabilité
Ollo Sib : VAM/WFP-Goma
permet de générer un score (pour chaque ménage) qui est une combinaison du score de consommation alimentaire, des stratégies, des sources de revenus et des biens. De ce fait, ce score est suffisant et pertinent pour la prise de décision.
Construit à partir d’une base d’enquêtes auprès de ménages, l’outil d’analyse de la vulnérabilité est représentatif de la zone géographique où les données de base ont été collectées. De ce fait, c’est un outil contextuel et dynamique.
Roll Out de l’outil de vulnérabilité
Test par des partenaires de distribution L’outil sera mis à disposition des partenaires de coopération, notamment les ONGs locales. Ces dernières, après formation, l’utilisation pour le ciblage de leurs activités de vivres pour actifs. Ces tests interviendront d’ici la fin octobre 2011
Test dans cinq camps de Masisi Pour ce mois de septembre, l’outil d’analyse de la vulnérabilité à l’insécurité alimentaire sera testé dans les cinq camps de Masisi où aucune identification des vulnérables n’a été faite.Ces tests seront menés avec le cluster sécurité alimentaire du Nord Kivu en collaboration avec le groupe de travail CCCM.
2012, application à grande échelle et programmation sur PDA (Personal Digital Assistant) Les différents tests devraient permettre d’affiner l’outil pour 2012. Puis l’on passera à une application systématique en cas de mouvements de population et pour des projets de sécurité alimentaire.
Les tests ont indiqué qu’il faut en moyenne 10 minutes pour interroger un ménage et encoder les données sur une base Excel. De ce fait, la programmation de l’outil sur PDA permettra de réduire considérablement le temps entre la collecte des données, l’émission de la liste des ménages les plus vulnérables et la précise de décision.