La méthode généralisée de la balance de l’accroissement démographique

Données disponibles
Résultats souhaités

Description de la méthode

Kenneth Hill (Hill 1987) a proposé une généralisation de la méthode de Brass de la balance de l’accroissement démographique (Brass growth balance method) faite pour estimer la complétude de l’enregistrement des décès par rapport à une estimation de la population, et qui repose sur l’hypothèse que la population est démographiquement stable. Cette généralisation s’applique au cas où la population n’est plus stable, mais reste fermée aux migrations. Elle peut s’utiliser dans le cas où l’on dispose des données sur les effectifs de population par groupe d’âge à deux recensements, et du nombre de décès par groupe d’âge entre les dates des deux recensements. Avec l’information supplémentaire des deux recensements, il est possible d’estimer les taux de croissance par âge, au lieu de prendre un taux constant comme on le fait dans l’hypothèse d’une population stable. Mais la méthode repose toujours sur les mêmes autres hypothèses : les proportions de décès déclarés et la complétude du recensement sont constants aux âges adultes, et les données déclarées sont précises. De plus, dans sa formulation la plus simple, la méthode repose sur l’hypothèse que la population est fermée aux migrations ; on peut cependant adapter la méthode pour prendre en compte les migrations si on dispose des données correspondantes.

Dans toutes les populations fermées, la relation suivante est vérifiée : r(x+)=b(x+)d(x+) , où le taux partiel de natalité, b(x+) , est défini comme le taux auquel la population atteint l’âge x au sein de la population âgée de x années et plus ; et le taux partiel de mortalité, d(x+) , est défini comme le taux de mortalité dans la population âgée de x années et plus. Si, dans cette population, les décès sont sous-déclarés dans une même proportion à tous les âges, alors la relation devient : b(x+)r(x+)= d r (x+) /c , où d r (x+) est le taux de mortalité déclaré au-delà de l’âge x, et c est la proportion de décès qui sont effectivement déclarés. En pratique, les recensements de population qui servent au calcul de r(x+) peuvent ne pas être complets ; on fera alors l’hypothèse que la sous-déclaration est la même à tous les âges, ce qui permet de trouver c d’après la relation linéaire entre les points donnés par : b(x+)r(x+) et d r (x+) . Les taux de mortalité corrigés s’obtiennent alors en divisant les nombres de décès déclarés dans chaque groupe d’âge par c, et en divisant ces nombres par l’estimation de la population au risque. Ceci permet de calculer les taux partiel de natalité, de mortalité et de croissance. De plus, un sous-produit de cette procédure est de permettre de corriger un des deux recensements, dans le cas où l’un des deux est moins complet que l’autre, de manière à ce que les deux soient cohérents, même s’ils ne sont ni l’un ni l’autre parfaitement complets.

Données requises et hypothèses

Tabulation des données nécessaires

  • Effectifs de femmes (ou d’hommes), par groupe d’âge de 5 ans, et pour l’intervalle d’âge ouvert A+ (A étant aussi élevé que possible), à deux instants donnés, le plus souvent provenant de deux recensements exhaustifs (voir les mises-en-garde ci-dessous pour le cas où l’on utilise des enquêtes par sondage au lieu des recensements).
  • Nombre de décès de femmes (ou d’hommes), par groupe d’âge de 5 ans, et pour l’intervalle d’âge ouvert A+, au cours de la période située entre les deux recensements ou les deux enquêtes.

Hypothèses importantes

  • La couverture de chaque recensement est la même à tous les âges.
  • La complétude de la déclaration des décès est la même à tous les âges au-delà d’un âge minimal (en général 5 ans ou 15 ans).
  • La population est fermée aux migrations. On peut cependant adapter la méthode pour tenir compte des migrations, mais les données précises des effectifs de migrations nettes n’existent que rarement. Pour les populations nationales, les migrations nettes sont souvent suffisamment faibles pour être négligées. Mais dans les situations où les migrations sont importantes, il convient de les prendre en compte pour interpréter les résultats et décider de l’estimation finale de la complétude.

Travaux préparatoires et recherches préliminaires

Avant d’appliquer la méthode, il convient d’analyser la qualité des données, au moins en ce qui concerne les dimensions suivantes :

  • structure par âge de la population;
  • structure par sexe de la population;
  • structure par âge des décès; et
  • structure par sexe des décès.

Lorsque les décès déclarés se rapportent à une période autre que celle comprise entre les deux recensements, il convient d’estimer les nombre de décès qui auraient dû être déclarés pendant la période intercensitaire. Ainsi, lorsqu’on dispose des décès déclarés à l’état civil par année de calendrier, l’ajustement consistera à répartir proportionnellement les décès de l’année du premier recensement et ceux de l’année du second recensement. Si l’on dispose des décès déclarés par les ménages au cours des 12 derniers mois avant chaque recensement, il faudra estimer le nombre de décès au cours de la période intercensitaire par interpolation entre les deux estimations précédentes (voir la feuille de calcul : AM_Estimating deaths.xlsx).

Précautions et mises en garde

Pour appliquer cette méthode, les analystes devront faire attention tout particulièrement aux points suivants.

Les processus d’interprétation et d’estimation finale doivent tenir compte de la source des données sur les décès (décès déclarés à l’état civil, décès déclarés par les ménages lors d’un recensement, décès enregistrés dans les hôpitaux), comme cela est expliqué ci-dessous. Mais les biais associés aux sources de données tendent à avoir moins d’impact sur l’estimation de la complétude obtenue par la méthode de la balance de l’accroissement démographique, que par la méthode de l’extinction des cohortes synthétiques.

La question des migrations devient plus importante lorsqu’on applique la méthode à des zones géographiques régionales.

Le choix de l’intervalle d’âge utilisé pour ajuster la ligne droite aux taux partiels de natalité et de mortalité, qui détermine l’estimation de la complétude, est important. Les problèmes en la matière sont les suivants : le meilleur choix pour l’âge de début de l’intervalle ouvert lorsqu’on sait que l’âge est exagéré ; comment traiter les points qui sont situés au-dessus de la droite de régression aux âges élevés, du fait de la baisse de la complétude ; celle-ci peut être due aux migrations associées à la retraite de personnes qui migrent de l’urbain vers le rural où l’enregistrement des décès est moins complet. Enfin, il faut décider s’il convient d’exclure les âges en-dessous de 30 ou 35 ans lorsqu’on ne peut pas corriger l’effet des migrations.

Si la complétude semble être inférieure à 60%, alors le degré d’incertitude devient grand, et ce point doit être pris en compte pour interpréter les résultats.

Dans la situation où les données sur la population et les décès des ménages sont collectées lors d’un recensement unique, il est tentant de chercher à utiliser des données d’une enquête par sondage pour avoir une répartition par âge de la population à une autre date, antérieure ou postérieure, de manière à pouvoir utiliser la méthode. Mais, pour des raisons qui ne sont pas claires et qui n’ont pas fait l’objet de recherches approfondies, une telle combinaison de sources de données très différentes donne rarement des résultats satisfaisants.

Application de la méthode

D’un point de vue purement technique, on pourrait appliquer cette méthode à des données présentées par année d’âge, mais ce type de données est sujet à de fortes erreurs sur l’âge, si bien que, en pratique, on travaille le plus souvent avec des données présentées par groupe d’âge de 5 ans. Comme la plupart des données disponibles sont publiées selon ce format, la feuille de calcul correspondante est organisée pour travailler avec des groupes d’âge quinquennaux classiques. Il faut remarquer que John Blacker (Blacker 1988) a montré que ces groupes d’âge classiques sont sensibles aux préférences pour les chiffres ronds ; dans ce cas on pourra adapter la méthode pour travailler avec des groupes d’âge quinquennaux différents, centrés sur les chiffres qui font l’objet de l’attraction (12-17, 18-21 etc.), plutôt qu’avec des groupes d’âge commençant par ces chiffres (15-19, 20-24, etc.).

Etape 1: Lorsque ce nombre n’est pas immédiatement disponible, estimer le nombre de décès déclarés au cours de la période entre les deux estimations de population

Dans le cas où l’on dispose de données de l’état civil par année de calendrier, l’ajustement consiste à répartir proportionnellement les décès de la première et de la dernière année. On les répartit proportionnellement à la fraction de l’année couverte après le premier recensement et avant le second recensement. Sauf si la distribution des décès par âge change très rapidement au cours de l’année, cette approximation n’aura pas d’effet notable sur les résultats.

Dans le cas où l’on ne dispose pas des décès entre les deux enquêtes, mais si l’intervalle tombe entre deux périodes pour lesquelles on a de telles données (par exemple dans le cas où chaque recensement inclut la question sur les décès des douze derniers mois dans le ménage), alors on peut utiliser la feuille de calcul suivante : AM_Estimating deaths. Cette feuille de calcul permet d’estimer le nombre de décès entre deux instants donnés d’après les décès qui se sont produits au-cours de deux périodes les encadrant. Pour utiliser cette feuille de calcul, on a besoin du nombre de décès répartis par groupes d’âge quinquennaux pour les deux périodes, les dates de début et de fin de chaque période, ainsi que les dates de début et de fin de la période au cours de laquelle on veut estimer le nombre de décès.

Etape 2: Cumuler la population, les décès et les migrants vers les plus jeunes âges

Pour calculer les taux partiels de natalité, mortalité (et migration), on doit cumuler les effectifs de population, le nombre de décès (et le nombre de migrations nettes), pour les âges au-delà de x. Ainsi, dans le cas de la population, on utilise la formule suivante :

N(x+)= y=x A5 5 N y + N A

A désigne l’âge au début du groupe d’âge ouvert. On utilise des formules équivalentes pour calculer les décès cumulés au-delà de l’âge x, soit D(x+). On peut faire de même pour les migrations nettes (même si cela est peu probable), et cumuler leur nombre au-delà de l’âge x, soit NM(x+). Lorsque le nombre de migrants est inconnu, on laisse cette colonne en blanc (ou bien on fixe les effectifs à zéro), et la méthode s’utilise en prenant en compte cette omission, comme cela est expliqué plus loin.

Etape 3: Calcul des personnes-années vécues, PYL(x+)

Pour calculer les taux partiels de natalité et de mortalité (ainsi que les taux partiels de migration nette s’ils sont disponibles), on doit calculer les personnes-années vécues au risque. On utilise pour cela la formule suivante :

PYL(x+)=( t 2 t 1 ) ( N x ( t 1 )× N x ( t 2 ) ) 1 2

t1 est la date du premier recensement, et t2 la date du second recensement.

Etape 4: Calcul du nombre de personnes qui atteignent leur x-ème anniversaire, N(x)

Le nombre de personnes qui atteignent leur x-ème anniversaire (c’est à dire ceux arrivent, ou sont ‘nés’, dans le groupe d’âge x+) dans la population se calcule comme la moyenne géométrique des effectifs de la cohorte au temps t1 et t2 divisé par 5, multiplié par la durée de la période entre les deux recensements, exprimée en années, selon la formule suivante :

N(x)= t 5 ( 5 N x5 ( t 1 )× 5 N x ( t 2 ) ) 1 2

Etape 5 : Calcul des taux partiels de natalité et de mortalité, b(x+) et d(x+), et de croissance r(x+), corrigés des migrations, i(x+)

Les taux partiels de natalité et de mortalité se calculent selon les formules suivantes :

b(x+)= N(x) PYL(x+)

 

d(x+)= D(x+) PYL(x+)

 

Alors, le taux partiel de croissance, moins le taux partiel de migration, se calcule selon la formule suivante:

r(x+)nm(x+)= N x ( t 2 ) N x ( t 1 )NM(x+) PYL(x+)

Etape 6 : Représentation graphique de b(x+) - r(x+) + nm(x+) en fonction de d(x+), et examen visuel pour décider de l’intervalle d’âge sur lequel on ajustera une droite

On commence en prenant pour âge minimal l’âge de 50 ans, et pour âge maximal A-1, où A est l’âge du début de l’intervalle ouvert. On examine ensuite le graphique, et on décide de l’intervalle d’âge sur lequel on ajustera une droite. Lorsque l’exagération des âges au décès est plus forte que celle des âges des survivants dans la population, les points situés à droite du graphique (qui représentent les âges élevés) vont tendre à baisser progressivement avec l’âge en-dessous de la droite. Ceci indique qu’il faut rechercher un âge maximal plus faible, de proche en proche tous les 5 ans, jusqu’à ce que l’effet soit éliminé. De plus, si la valeur des résidus est trop forte aux âges extrêmes (par exemple s’ils excèdent 1%), alors l’âge maximal devra être abaissé, pour éviter que ces points erronés influencent la pente de la droite ajustée. Mais si l’exagération de l’âge est la même pour la population et pour les décès, alors ceci n’aura pas d’influence sur la pente ni sur l’estimation de la complétude de la déclaration des décès ; par contre, les taux de mortalité par âge seront sous-estimés à ces âges élevés.

Lorsque les points placés sur le graphique correspondants aux âges jeunes (c’est-à-dire la partie gauche du graphique), surtout aux âges entre 15 et 30 ans, dévient notablement de la ligne droite, et si l’on n’a pas introduit de données sur les migrations, ceci indique probablement qu’il y a un niveau important de migrations (sauf s’il y a une couverture du recensement différentielle selon l’âge). Dans ce cas, il convient d’augmenter l’âge minimal du début de l’intervalle utilisé pour ajuster la droite à 30 ou 35 ans, selon celui qui produit le meilleur ajustement aux données.

Etape 7 : Ajustement d’une droite, et estimation de la complétude (c)

Pour estimer la complétude de l’enregistrement des décès par rapport à la population, on commence par tracer un graphique représentant les points d’abscisse : d(x+) et d’ordonnées : b(x+) – r(x+) + i(x+). On calcule les coefficients de la droite liant les deux séries de points par régression orthogonale, selon la formule suivante :

b= σ y σ x = 1 n1 i=1 n ( y i μ y ) 2 1 n1 i=1 n ( x i μ x ) 2

et

a= μ y b μ x

b représente la pente de la droite, et a l’ordonnée à l’origine. La série des ordonnées yi représente les points: b(x+) - r(x+) + i(x+), la série des abscisses xi représente les points d(x+), et les variables μ y et μ x représentent, respectivement, les moyennes des deux séries.

Lorsque l’on a tracé la droite de régression, on observe la position des points par rapport à la droite, ainsi que les résidus, de manière à décider quel est le meilleur intervalle d’âge à garder pour calculer la complétude de l’enregistrement des décès. La manière de le faire est discutée plus en détail plus loin, mais on considère qu’il faut exclure les points dont les résidus sont supérieurs à 1% en valeur absolue. Après exclusion des points aberrants, une nouvelle droite est ajustée, et on calcule de nouvelles valeurs de a et b. En règle générale, on recommande de ne pas terminer à un âge qui se termine par zéro dans les populations qui font preuve d’une forte attraction des chiffres ronds.

On calcule alors la complétude de l’enregistrement des décès, c, d’après les valeurs de a et de b, comme suit. Comme:

a= ln( k 1 / k 2 ) t 2 t 1

et

b= ( k 1 k 2 ) 1 2 c

k 1 k 2 = e a( t 2 t 1 )

on fait alors l’hypothèse que le maximum de k1 et k2 = 1. Si k 1 k 2 <1 , on suppose que k2 = 1, et donc

k 1 = e a( t 2 t 1 )

et si k 1 k 2 >1 , on suppose que k1 = 1, et donc :

k 2 = e a( t 2 t 1 )

et

c= ( k 1 k 2 ) 1 2 b .

Etape 8 : Estimer les taux de mortalité après correction de la complétude des décès déclarés

Afin de calculer les taux de mortalité corrigés, il convient au préalable de corriger les recensements de population en tenant compte de leurs couvertures relatives. Ceci se fait en divisant les effectifs du premier recensement par k1 et les effectifs du second recensement par k2.

Ensuite, on doit corriger les nombres de décès du sous-enregistrement, en divisant les nombres de décès déclarés par l’estimation de la complétude c.

Les personnes-années vécues corrigées, PYLa(x,5), se calculent de la même manière qu’avant, mais en utilisant les effectifs corrigés du sous-enregistrement relatif des recensements, soit :

PY L a (x,5)=( t 2 t 1 ) ( 5 N x ( t 1 )/ k 1 × 5 N x ( t 2 )/ k 2 ) 1 2

Ensuite, on calcule les taux de mortalité corrigés de tous les biais (complétude de l’enregistrement des décès et couverture des recensements) en divisant les effectifs corrigés des décès et des personnes-années vécues, soit:

5 m x = 5 D x /c PY L a (x,5)

Remarquons que, d’un point de vue purement technique, on pourrait omettre le coefficient d’ajustement k1/k2 et obtenir les mêmes valeurs pour les taux de mortalité corrigés (puisqu’on fait la même correction au numérateur et au dénominateur). Mais dans ce cas, l’estimation de la complétude correspondrait à la moyenne des populations recensées et ignorerait le fait qu’ils ont des couvertures différentes.

Etape 9 : Lissage à l’aide d’une table-type et d’un système relationnel logit

Lorsque les taux de mortalité par âge sont erratiques, on peut les lisser à l’aide d’un modèle. Ceci peut se faire à l’aide du système relationnel logit de Brass et d’une table-type du même sexe que l’on considère avoir le même schéma par âge que celui qui s’applique à la population étudiée.

Le classeur Excel correspondant à cette méthode comporte une feuille de calcul qui permet de produire des taux de mortalité lissés à l’aide d’un système relationnel logit et d’une table type de mortalité. L’utilisateur a le choix entre un standard du modèle Général de la famille des tables-type des Nations Unies, ou l’un des quatre modèles régionaux des tables-type de Princeton. La transformation logit de ces tables-type de mortalité, ainsi qu’une table-type d’une population affectée par l’épidémie de sida (Timæus 2007) sont donnés dans la feuille de calcul intitulée Modèles. Cette feuille de calcul permet aussi à l’utilisateur de choisir comme standard une autre table de mortalité sous forme de logit, s’il y a de bonnes raisons de penser que cette table a un schéma par âge similaire à celui de la population étudiée.

Pour ajuster le modèle logit, on calcule d’abord les quotients quinquennaux de mortalité, 5qx, d’après les taux corrigés de mortalité, 5mx, selon la formule :

5 q x = 5 5 m x 1+2,5 5 m x .

Puis on calcule la table de mortalité de proche en proche, en partant d’une racine l5 = 1 , selon la formule de récurrence suivante :

l x+5 = l x ( 1 5 q x )

Les coefficients, α et β , du système relationnel logit se calculent par régression linéaire, comme:

γ x =α+β γ x s

où la fonction logit est définie comme: γ x =0,5ln( 1 l x l x ) et où l’exposant s désigne les valeurs de la table de mortalité de référence (le standard).

La table de mortalité lissée se calcule ensuite en appliquant les coefficients α and β comme suit :

γ x fitted =α+β γ x s

et

l x fitted = 1 exp( 1+2 γ x fitted )

Les taux de mortalité lissés se calculent dans la table de mortalité comme suit:

5 m x fitted = l x fitted l x+5 fitted T x T x+5

 

et

m x fitted = l x fitted T x

T x = x=x,5 ω 5 2 ( l x fitted + l x+5 fitted )

soit :

T x = T x+5 + 5 2 ( l x fitted + l x+5 fitted )

ω désigne l’âge au-delà duquel il ne reste plus de survivants.

Exemple

Cet exemple utilise les données de la population masculine d’Afrique du Sud, recueillies au recensement de 2001 et à l’enquête de communauté de 2007, et les données des décès enregistrés à l’état civil au cours des années de 2001 à 2007. Le solde migratoire est estimé d’après le changement du nombre de personnes nées à l’étranger repérées aux deux enquêtes, moins une estimation du nombre de sud-africains qui ont émigré à l’étranger entre les deux enquêtes. Cet exemple est détaillé dans le classeur Excel intitulé : AM_GGB_South Africa_males.

Etape 1: Calculer le nombre de décès déclarés au cours de la période située entre les deux estimations de population

Les décès déclarés au cours des années 2001 à 2007 pour les hommes sud-africains apparaissent dans le tableau 1.

Tableau 1 : Calcul des décès déclarés entre les deux dates des recensements, sud-africains de sexe masculin, 2001-2007

Age

20012002–20062007Total entre les deux recensements
0–429 005186 34640 314197 912
5–92 11814 7332 85415 566
10–141 74510 5352 23311 207
15–194 47023 8574 86025 473
20–248 93151 58810 87554 960
25–2916 83496 70518 405102 802
30–3420 892137 35528 245145 588
35–3921 068137 50229 258145 900
40–4419 322128 21726 973135 936
45–4917 881113 89124 761121 010
50–5416 883104 50822 790111 157
55–5914 54490 91921 31796 854
60–6415 09784 35117 41089 930
65–6913 01177 68017 87882 843
70–7414 03568 14713 77173 036
75–7910 84659 85912 53463 871
80–849 16144 9868 87248 163
85+

7 602

43 233

10 009

46 196

La date de référence du recensement de 2001 était la nuit du 9 au 10 octobre 2001. L’enquête de communauté se déroula sur plusieurs semaines en février, et on prendra comme date de référence la nuit du 14 au 15 février 2007. Donc, en supposant que les décès sont répartis uniformément au cours de l’année, on peut répartir proportionnellement les décès de 2001 et de 2007, et les ajouter au total des années 2002 à 2006. Ceci donne le total des décès qui se sont produits entre les deux dates de recensement. Par exemple, pour le groupe d’âge 20-24 ans, le nombre se calcule comme suit :

(22+30+31) 365 8931+51588+ (31+14) 365 10875=54960.

Etape 2: Cumul de la population, des décès et des migrants vers le bas

On cumule alors les effectifs de la population, des décès et des migrants, vers le bas, de l’âge x jusqu’au dernier groupe d’âge (tableau 2).

Tableau 2 : Calcul des effectifs cumulés de population, décès et migrants, Afrique du sud, sexe masculin, 2001-2007

Age5Nx(t1)5Nx(t2)5Dx5NMxP1(x+)P2(x+)D(x+)NM(x+)
02 223 0062 505 744197 91210 60521 434 04523 348 6791 568 404128 946
52 425 0662 560 64215 5662 84819 211 03920 842 9351 370 492118 341
102 518 9852 452 33911 2075 15316 785 97318 282 2931 354 926115 492
152 453 1562 553 29325 47316 57414 266 98815 829 9551 343 719110 339
202 099 4172 362 51954 96014 80311 813 83213 276 6621 318 24693 766
251 899 2752 033 165102 8024 7149 714 41510 914 1431 263 28678 963
301 594 6241 875 483145 58813 3317 815 1408 880 9771 160 48474 249
351 441 6571 548 185145 9009 6936 220 5167 005 4951 014 89660 918
401 233 8131 306 900135 9367 4644 778 8595 457 310868 99651 225
45967 7441 104 294121 0108 7193 545 0464 150 410733 06043 761
50769 627888 042111 1579 4132 577 3023 046 116612 05035 042
55552 402708 81296 8544 6401 807 6752 158 074500 89325 629
60444 592491 87189 9305 0811 255 2731 449 261404 03920 989
65304 835394 30582 8434 922810 681957 391314 10815 908
70232 604241 97673 0364 334505 846563 086231 26610 986
75136 466163 11263 8712 980273 242321 110158 2296 652
8090 85687 69848 1631 662136 776157 99894 3593 672
85

45 920

70 299

46 196

2 009

45 920

70 299

46 196

2 009

Etape 3: Calcul des personnes-années vécues, PYL(x+)

Le calcul des personnes-années vécues nécessite de connaître d’intervalle de temps entre les deux recensements. Ceci peut se calculer à l’aide de la fonction YEARFRAC dans Excel d’après des dates de référence des deux recensements (soit 5,3541 années). Le décompte des jours entre les deux dates divisé par 365 (soit 5,3507 années) n’est pas identique, mais cette différence a un impact négligeable sur l’estimation de la complétude.

Les personnes-années vécues apparaissent en colonne 2 du tableau 3, et se calculent d’après les effectifs cumulés de population qui figurent en colonne 2 et 3 du tableau 2. Par exemple, pour l’âge de 20 ans, le calcul est le suivant :

PYL(20+)=5,3541 (2099417×2362519) 1 2 =67053861.

Tableau 3 : Calcul des effectifs cumulés de la population, des décès et des migrants, Afrique du sud, sexe masculin, 2001-2007

Age PYL(x+) N(x) b(x+) r(x+)-i(x+) d(x+) = X b(x+)-r(x+) +i(x+) = Y a+bx Résidus y-(a+bx) 
0119 775 275  #N/A0,00000 -0,0047 
5107 136 8372 554 8100,023850,014130,012790,009720,00930,0004
1093 793 4582 611 3550,027840,014720,014450,013120,01110,0020
1580 461 8352 715 6700,033750,018050,016700,015700,01350,0022
2067 053 8612 577 8890,038450,020420,019660,018030,01680,0013
2555 129 8862 212 3290,040130,020330,022910,019800,0203-0,0005
3044 604 9152 020 9910,045310,022230,026020,023080,0237-0,0006
3535 344 0711 682 4980,047600,020490,028710,027120,02660,0005
4027 342 3201 469 8260,053760,022940,031780,030820,03000,0008
4520 537 1601 249 9160,060860,027350,035690,033520,0343-0,0007
5015 001 678992 6840,066170,028910,040800,037260,0398-0,0026
5510 574 924790 8970,074790,030710,047370,044080,0470-0,0029
607 221 483558 1710,077290,023960,055950,053340,0564-0,0030
654 716 866448 3430,095050,027730,066590,067320,0680-0,0006
702 857 463290 8260,101780,016190,080930,085590,08360,0020
751 585 932208 5770,131520,025990,099770,105530,10410,0014
80787 071117 1440,148840,022300,119890,126540,12610,0005
85

304 201

       

Etape 4 : Calcul du nombre de personnes qui atteignent l’âge x dans la population, N(x)

Les nombres de personnes qui atteignent l’âge x figurent en colonne 3 du tableau 3. Par exemple, le nombre de personnes qui atteignent l’âge de 20 ans se calcule d’après les effectifs de population qui figurent en colonne 2 et 3 du tableau 1, comme suit :

N(20)= 5,3541 5 (2518985×2553293) 1 2 =25778889.

Etape 5 : Calcul des taux partiels de natalité et de mortalité, b(x+) et d(x+), et du taux partiel de croissance r(x+) après correction des migrations, i(x+)

Les taux partiels de natalité et de mortalité figurant en colonne 4 et 6 du tableau 3. Par exemple, pour l’âge de 20 ans, les taux partiels de natalité et de mortalité se calculent à partir des naissances partielles (colonne 3 du tableau 3) et des décès partiels (colonne 8 du tableau 2) comme suit :

b(20+)= 2577889 67053861 =0,03845

et

d(20+)= 1318246 67053861 =0,01966.

Le taux partiel de croissance, diminué du taux partiel de migration nette, figure en colonne 5 du tableau 3. Par exemple, pour l’âge de 20 ans, il se calcule à partir des populations cumulées qui figurent en colonne 2 et 3 du tableau 3, et des migrations nettes cumulées qui figurent dans la dernière colonne du tableau 2, comme suit :

r(20+)i(20+)= 132766621181383293766 67053861 =0,02042.

Etape 6: Représentation graphique de b(x+) - r(x+) + i(x+) en fonction de d(x+), et analyse de la figure pour décider quel intervalle d’âges choisir pour ajuster la droite

Pour tracer le graphique et ajuster la droite liant tous les points, on commence par fixer l’âge minimal à 5 ans, et l’âge maximal à 84 ans (car, dans cet exemple, l’intervalle d’âge ouvert est de 85 ans et plus). La figure 1 donne le graphique des points de coordonnées : b(x+) - r(x+) + i(x+) et d(x+).

L’analyse visuelle des points de ce graphique (figure 1) montre que ceux-ci sont assez bien alignés, et assez proches de la ligne de régression, ce qui indique que l’essentiel des migrations a bien été pris en compte. Dans ce cas, il n’y a pas de raison de changer l’intervalle d’âge sur lequel la droite est ajustée. Et donc, comme on peut s’y attendre, augmenter l’âge minimal n’aurait que peu d’effet sur l’estimation de la complétude, qui est ici de 91%. De même, l’estimation de la complétude ne serait guère affectée en diminuant l’âge maximal, c’est-à-dire en excluant le dernier ou les deux derniers points, même si les résultats sont un peu affectés par une baisse de la complétude aux âges élevés (voir l’application de la méthode d’extinction des cohortes synthétiques). Par contre, éliminer d’autres points conduirait à augmenter la complétude et atteindre des niveaux irréalistes, ce qui suggère un problème de qualité des données (probablement les données de population).

 

Image
Figure 1 Graphique de diagnostic, Afrique du sud, sexe masculin, 2001-2007
Figure 1 Diagnostic plots, South African males, 2001-2007

Etape 7: Ajustement de la droite, et estimation de la complétude, c

Les coefficients de la droite ajustant au mieux les points de la Figure 1 se calculent comme suit:

b= σ y σ x = 0,03483 0,03193 =1,0907 a=0,04441,0907×0,045=0,00467

et la couverture relative des deux recensements se calcule comme suit:

k 1 k 2 =exp(0,00467×5,3541)=0,9753.

Comme k2>k1 on considère que k2 = 1 et donc que k1 = 0,9753 (c’est-à-dire que le décompte du premier recensement est sous-estimé de 2,5% par rapport au second).

La complétude de la déclaration des décès, c, est estimée à 91% (relativement au décompte de l’enquête de 2007), et se calcule comme suit :

c= ( 0,9753 ) 1 2 1,0907 =0,9054.

Etape 8: Calcul des taux de mortalité corrigés de la sous-déclaration des décès

On corrige d’abord la population au premier recensement, en divisant la population recensée, qui figure en colonne 2 du tableau 2, par k1. Par exemple, pour l’âge de 20 ans, la population corrigée se calcule comme :

2099417 0,9753 =2152629.

La population corrigée au second recensement se calcule de même, comme la population recensée, qui figure en colonne 3 du tableau 2, divisée par by k2.  Comme, par hypothèse, on a pris k2 = 1, ces nombres sont donc les mêmes que ceux qui figurent en colonne 3 du tableau 2.

Ensuite, les décès sont corrigés pour tenir compte de la sous-déclaration, en divisant les nombres de décès déclarés dans chaque groupe d’âge, qui figurent en colonne 4 du tableau 2, par l’estimation de la complétude. Ces nombres figurent en colonne 4 du tableau 4. Par exemple, pour l’âge de 20 ans, le nombre se calcule à partir du nombre de décès déclarés : 54 960 décès, comme suit :

54960 0,9054 =60701.

Les personnes-années vécues corrigées (colonne 5 du tableau 4) se calculent comme la moyenne géométrique des populations qui figurent en colonne 2 et 3 du tableau 4, multipliées par la durée (en années) de la période intercensitaire, qui est de 5,3541 années. Par exemple, pour l’âge de 20 ans, cela donne :

PYL(20,5)=5,3541 (2152629×2362519) 1 2 =12074140.

Les taux de mortalité corrigés du sous-enregistrement des décès (colonne 6 du tableau 4) se calculent en divisant les décès corrigés par les personnes-années vécues corrigées. Par exemple, pour le groupe d’âge de 20-24 ans, le taux de mortalité corrigé se calcule comme suit :

60701 12074140 =0,0050.

Table 4 : Calcul des taux de mortalité corrigés, Afrique du Sud, sexe masculin, 2001-2007

AgeValeurs corrigées du sous-enregistrement
   5Nx(t1  5Nx(t2)5Dx PYL(x,5)  5mx 

0

 

 

 

 

 

5

2 486 532

2 560 642

17 193

13 510 001

0,0013

10

2 582 831

2 452 339

12 378

13 474 797

0,0009

15

2 515 334

2 553 293

28 134

13 568 508

0,0021

20

2 152 629

2 362 519

60 701

12 074 140

0,0050

25

1 947 414

2 033 165

113 541

10 653 675

0,0107

30

1 635 041

1 875 483

160 796

9 375 725

0,0172

35

1 478 197

1 548 185

161 141

8 099 564

0,0199

40

1 265 085

1 306 900

150 136

6 884 383

0,0218

45

992 273

1 104 294

133 651

5 604 563

0,0238

50

789 134

888 042

122 768

4 482 045

0,0274

55

566 403

708 812

106 972

3 392 442

0,0315

60

455 861

491 871

99 325

2 535 277

0,0392

65

312 561

394 305

91 497

1 879 609

0,0487

70

238 500

241 976

80 666

1 286 217

0,0627

75

139 925

163 112

70 543

808 863

0,0872

80

93 159

87 698

53 194

483 940

0,1099

85

47 084

70 299

51 021

308 032

0,1656

Etape 9: Lissage en utilisant une table-type et un système relationnel logit

Les quotients quinquennaux de mortalité, corrigés du sous-enregistrement, qui figurent en colonne 2 du tableau 5, se calculent à partir des taux de mortalité corrigés, qui figuraient en colonne 6 du tableau 4. Par exemple, la probabilité pour un homme de décéder entre 20 et 25 ans, se calcule comme suit :

5 q 20 = 5×0,005 1+2,5×0,005 =0,0248.

Les survivants de la table de mortalité à l’âge x+5 se calculent à partir des survivants à l’âge x à partir des quotients quinquennaux, et figurent en colonne 3 du tableau 5. Par exemple, la proportion de survivants à l’âge de 25 ans se calcule comme suit :

l 25 =0,9789(10,0248)=0,9546.

Tableau 5 : Calcul des taux de mortalité lissés à l’aide d’une table-type et d’un système relationnel logit, Afrique du sud, sexe masculin, 2001-2007

Age

5qx

 lx/l5


Y(x) obs.

Sida Cdn.
ls(x)

Logit
standard
Ys(x)

Logit
lissé
Y(x)

Surviv.
lissé
l(x)

T(x)

Taux
lissé
5mx 

0

         

5

0,00631 

1,0000

  150,6990,0032

10

0,00460,9937-2,5270

0,9785

-1,9081-2,05510,983945,7390,0030

15

0,01030,9891-2,2542

0,9632

-1,6326-1,72920,969540,8560,0025

20

0,02480,9789-1,9186

0,9512

-1,4853-1,55500,957336,0390,0043

25

0,05190,9546-1,5229

0,9324

-1,3120-1,35000,937031,3030,0090

30

0,08220,9051-1,1273

0,8969

-1,0818-1,07770,896226,7220,0159

35

0,09480,8306-0,7951

0,8420

-0,8365-0,78750,828522,4150,0206

40

0,10340,7519-0,5544

0,7794

-0,6311-0,54460,748218,4820,0241

45

0,11250,6742-0,3636

0,7148

-0,4593-0,34140,664414,9640,0244

50

0,12820,5983-0,1992

0,6560

-0,3228-0,17990,589011,8480,0234

55

0,14610,5216-0,0433

0,6048

-0,2127-0,04970,52489,0840,0258

60

0,17840,44540,1097

0,5530

-0,10640,07600,46216,6400,0337

65

0,21700,36590,2749

0,4918

0,01630,22120,39124,5300,0503

70

0,27110,28650,4562

0,4119

0,17810,41250,30472,8140,0717

75

0,35800,20890,6659

0,3178

0,38190,65360,21301,5420,1008

80

0,43110,13410,9327

0,2173

0,64080,95980,12790,7080,1470

85

#N/A

0,0763

1,2470

0,1201

0,9959

1,3799

0,0595

0,252

0,2081

La transformation logit appliquée aux proportions de survivants figure en colonne 4 du tableau 5. Par exemple, à l’âge de 20 ans, le logit de l20 se calcule comme suit:

γ 20 =0,5ln( 10,9789 0,9789 )=1,919.

La table-type utilisée est une table-type qui tient compte du sida, avec une espérance de vie de e0 = 50 ans. Les logits des survivants de la table-type conditionnelle (qui figurent en colonne 5 du tableau 5) apparaissent en colonne 6 du tableau 5. Comme on peut le voir sur la figure 2, la table-type qui tient compte du sida n’ajuste pas bien les données, mais elle marche mieux que toute autre table-type qui ne tient pas compte de l’impact du sida sur la mortalité.

 

Image
Figure 2 Logits des proportions de survivants et taux de mortalité obtenus après correction, comparés aux valeurs correspondantes de la table-type de mortalité obtenue en tenant compte du sida, Afrique du sud, sexe masculin, 2001-2007
Figure 2 Observed logits and adjusted mortality rates against expected derived from the male AIDS model life table, South African males, 2001-2007

Les coefficients, α et β, sont déterminés comme la pente et l’ordonnée à l’origine de la droite qui ajuste au mieux les transformations logit, qui figurent en colonnes 4 et 6 du tableau 5, dans l’intervalle d’âge choisi par l’utilisateur (entre 45 et 80 ans dans cet exemple), soit ici 0,2119 et 1,1893 respectivement.

On applique ensuite ces coefficients aux logits de la table de mortalité conditionnelle, afin de produire les logits lissés (colonne 7 du tableau 5). Par exemple, pour l’âge de 20 ans, le logit lissé se calcule comme suit :

γ 20 fitted =0,2119+1,1893×(1,4853)=1,555.

Ces valeurs sont ensuite prises pour calculer la table de mortalité lissée (colonne 8 du tableau 5). Par exemple, la probabilité de survie à 20 ans se calcule comme suit :

l 20 fitted = 1 1+exp( 2×(1,555) ) =0,9573.

Les personnes-années vécues cumulées au-delà de l’âge x, soit Tx, figurent en colonne 9 du tableau 5, et se calculent à partir de la table de mortalité lissée. Ces valeurs sont alors utilisées pour calculer les taux de mortalité lissés, qui figurent en colonne 10 du tableau 5. Par exemple, à l’âge de 80 ans :

T 80 =0,2523+ 5 2 (0,1248+0,0577)=0,7085

5 m 80 fitted = 0,12480,0577 0,70850,2523 =0,1470 .

Diagnostics, analyse et interprétation

Contrôles et validation

L’estimation de la complétude est de 91%. La première vérification à faire sur ce résultat est la comparaison avec le résultat correspondant pour l’autre sexe. Ainsi, en appliquant la même méthode décrite pour les hommes aux données concernant les femmes au cours de la même période (voir la feuille de calcul : AM_GGB_South Africa_females) donne une estimation de la complétude de 89%. Des recherches antérieures (Dorrington, Moultrie and Timæus 2004) ont montré que l’on peut s’attendre à des résultats voisins pour les deux sexes, et le fait que ces résultats le sont en effet valide par conséquent ces estimations.

Une seconde vérification des résultats consiste à les comparer avec ceux obtenus par la Méthode de l’extinction des cohortes synthétiques (voir la feuille de calcul : AM_SEG_South Africa_males). Cette méthode donne une estimation de la complétude de 94% sur l’intervalle d’âge de 5 à 84 ans, ce qui  est aussi assez proche pour valider les résultats précédents.  

Une troisième vérification consiste à comparer diverses estimations de la mortalité avec d’autres sources, telles que des estimations antérieures pour le pays, ou les Perspectives de la population mondiale (UN Population Division 2011). L’estimation du quotient de mortalité de 15 à 60 ans, 45q15, est de 523 pour 1000 après correction pour tenir compte de la sous-déclaration des décès, une valeur très proche des 528 pour 1000 retenue par les Perspectives de la population mondiale pour la période 2000-2005, ce qui une fois encore montre qu’il y a peu de raisons de mettre en question les résultats obtenus par la méthode.

Il est intéressant de remarquer que l’application de la Méthode de Brass de la balance de l’accroissement démographique à ces mêmes données, en prenant pour population moyenne la population au milieu de l’intervalle entre les deux recensements, donne une estimation de 85% lorsqu’on utilise le même intervalle d’âge. Si on augmente l’âge minimal à 35 ans pour ajuster la droite, on augmente l’estimation à 88%, toujours un peu plus faible que l’estimation de 91% produite par la méthode utilisée ci-dessus.

Interprétation

Comme il a déjà été mentionné plus haut, tous les derniers intervalles d’âge entre 75 et plus et 85 ans et plus retenus pour ajuster la droite fournissent des estimations équivalentes de la complétude de l’enregistrement des décès. Par contre, si on s’arrête avant 75 ans et plus, l’estimation augmente, et atteint 100% pour 70 ans et plus, 105% pour 65 ans et plus, et 108% pour 60 ans et plus. Bien qu’il soit probable que le recensement de 2001 et l’enquête de 2007 sous-estiment le nombre d’hommes dans la population, il est vraisemblable que la sous-estimation soit concentrée chez les jeunes adultes, mais improbable qu’elle soit suffisamment forte pour produire une estimation supérieure à 100% pour la complétude de l’enregistrement des décès par rapport au recensement. De plus, toutes choses égales par ailleurs, plus le seuil du groupe d’âge ouvert est bas, moins les estimations de la complétude sont robustes. En conséquence, on préfèrera les estimations plus modestes obtenues avec un groupe d’âge ouvert commençant à un âge plus élevé.

Problèmes d’interprétation spécifiques de la méthode

Source des données sur les décès déclarés

On trouve en général deux types de problèmes avec les données concernant les décès : ceux qui conduisent à un biais de déclaration (sous- ou sur-déclaration) constant par âge, ce qui est précisément ce que la méthode vise à corriger, et ceux qui conduisent à des biais de déclaration qui varient selon l’âge, qui peuvent entraîner une distorsion dans les estimations finales. Bien que l’approche générale reste essentiellement la même quelle que soit la source des données, des sources différentes peuvent être sujettes à des biais spécifiques, qui peuvent avoir un effet sur l’interprétation des résultats. On va illustrer ces cas par des exemples concrets, et d’une manière générale, l’analyse devra prêter attention aux biais suivants dans les données concernant les décès.

(i) Décès déclarés à l’état civil

Si la répartition de la population entre les zones urbaines et rurales (ou une division équivalente) diffère significativement par âge, et que la complétude de la déclaration des décès en milieu urbain est significativement supérieure à celle du milieu rural, alors l’hypothèse que la complétude est indépendante de l’âge sera vraisemblablement violée, et la complétude va tendre à baisser avec l’âge au-delà de 50 ans si la proportion de personnes qui migrent de l’urbain vers le rural au moment de leur retraite. Si on l’ignore, cette violation de l’hypothèse produira probablement une sous-estimation du niveau moyen de la complétude.

(ii) Décès déclarés par les ménages

Ces données sont sujettes à quatre problèmes potentiels :

  • Si une proportion significative des ménages sont dissous après le décès d’une personne clé (comme la  seule personne à subvenir aux besoins du ménage), alors les décès de ces personnes risquent de ne pas être déclarés, ce qui conduit à violer l’hypothèse que la complétude est constante selon l’âge. Si une proportion significative des décès dans certains groupes d’âge sont relatifs à des individus qui ne vivent pas dans des ménages ordinaires (par exemple, ceux qui vivent dans des maisons pour personnes âgées), la violation de l’hypothèse peut même être encore plus sévère. Mais ce n’est pas encore un problème dans la plupart des pays en développement.
  • Dans les situations où les jeunes adultes quittent leur famille lorsqu’ils grandissent, pour aller vivre en ville, il est possible qu’ils soient considérés comme membres de plusieurs ménages (ou d’aucun ménage), et leurs décès peuvent être déclarés plus d’une fois (ou jamais), ce qui conduit encore à une violation de l’hypothèse de déclaration des décès constante selon l’âge. Dans ce cas, on peut en limiter l’impact en ignorant les données concernant les décès d’âge inférieur à un âge donné pour estimer la complétude.
  • Erreurs sur la période de référence. Comme il arrive fréquemment qu’il y ait confusion sur la période précise au cours de laquelle on doit déclarer les décès, sans même parler d’erreurs sur la date précise du décès, il est possible que cela se traduise par soit une sous-déclaration, soit une sur-déclaration des décès. En supposant que l’on puisse faire l’hypothèse que ces biais sont indépendants de l’âge des décédés, cette distorsion sera prise en compte dans l’estimation de la complétude, et ne constituera pas un problème pour le calcul des taux de mortalité corrigés.
  • La période de référence ne couvre qu’une petite partie de la période intercensitaire. Par exemple, on a fréquemment le cas suivant, où l’on demande aux ménages de déclarer les décès au cours des 12 derniers mois précédant le recensement. Non seulement une période très courte comme celle-ci produit de fortes fluctuations aléatoires, mais de plus le problème qui se pose est d’estimer la population au début de cette période de référence. On illustrera ce point dans les exemples ci-dessous, et on expliquera comment résoudre le problème. Par contre, si en plus on dispose des décès déclarés par les ménages au premier recensement, on peut utiliser les deux ensembles de données sur les décès pour estimer le nombre de décès qui sont produit entre les deux recensements, comme cela a été expliqué ci-dessus. Mais, comme la question sur les décès des 12 derniers mois au sein des ménages n’a été posée que relativement peu fréquemment avant le cycle des recensements des années 2010, il se peut que l’on ait un seul ensemble de données sur les décès. Dans ce cas, en supposant qu’il n’y ait pas de raison de présumer que le schéma par âge de mortalité ait changé rapidement au cours de la période, on recommande de calculer les taux de mortalité par âge pour l’année concernée, et d’appliquer ces taux aux personnes-années vécues au cours de l’intervalle intercensitaire, de manière à obtenir une estimation des décès au cours de la période. Mais si l’on a de bonnes raisons de penser que la mortalité a changé rapidement, par exemple du fait de l’épidémie de VIH/sida, alors cette adaptation va vraisemblablement biaiser les résultats, soit en sous-estimant, soit en surestimant la mortalité, et dans ce cas on ne recommande pas d’utiliser cette méthode de répartition des décès.

(iii) Décès enregistrés dans les centres de santé

On sait peu de choses à propos de cette source de données, ni comment elle fonctionne. On peut cependant supposer que la complétude dépendra de la répartition géographique des centres de santé auprès desquels les données seront collectées. Dans de nombreux pays en développement, ce type de services a tendance à être concentré dans les zones urbaines. Alors, une nouvelle fois, si la proportion de la population vivant en milieu urbain plutôt qu’en milieu rural varie selon l’âge, on ne pourra pas supposer que la complétude est indépendante de l’âge. Il est aussi possible que certaines causes de décès soient plus fréquentes dans les centres de santé, et si ces causes sont importantes en nombre et qu’elles sont liées à l’âge, tout ceci pourrait entrainer une nouvelle violation de l’hypothèse de la complétude constante selon l’âge.

Exemples utilisant les décès déclarés par les ménages dans les recensements et enquêtes

Les exemples présentés ci-dessous utilisent les mêmes données de population que celles qui sont présentées dans les classeurs Excel : AM_GGB_South Africa_males et AM_GGB_South Africa_females, mais on a utilisé les données des décès des 12 derniers mois déclarés par les ménages au recensement de 2001 et à l’enquête de communauté de 2007, au lieu d’utiliser les données de l’état civil pour la période 2001-2007. Ces données figurent dans le tableau 6.

Tableau 6 : Décès déclarés par les ménages au-cours des 12 mois précédant le recensement ou l’enquête, Afrique du sud

Age

Recensement de 2001

 

Enquête de communauté de 2007

Sexe masculin

Sexe féminin

Sexe masculin

Sexe féminin

0-4

35 873

32 096

 

48 322

44 418

5-9

3 868

3 155

 

4 505

5 216

10-14

2 590

2 284

 

3 442

3 259

15-19

5 628

5 122

 

8 246

7 878

20-24

10 976

13 246

 

16 360

21 702

25-29

17 787

19 727

 

27 551

35 840

30-34

20 038

18 292

 

34 832

42 576

35-39

19 816

15 521

 

38 061

34 809

40-44

17 417

12 124

 

33 604

28 823

45-49

15 840

10 105

 

27 829

20 973

50-54

15 077

9 144

 

28 223

18 891

55-59

12 781

7 755

 

22 868

13 118

60-64

13 428

10 367

 

18 775

14 912

65-69

11 820

10 195

 

17 532

14 298

70-74

11 885

10 809

 

14 879

14 645

75-79

8 794

8 393

 

12 966

14 151

80-84

7 484

9 371

 

9 204

12 063

85+

7 115

12 389

 

11 735

18 178

Les effectifs de décès qui se sont produits entre la date du recensement (nuit du 9 au 10 octobre 2001) et la date de l’enquête de communauté (supposée être la nuit du 14 au 15 février 2007) sont estimés dans les feuilles de calcul suivantes : AM_Estimating deaths_South Africa_males_hhd et AM_Estimating deaths_South Africa_females_hhd.

L’application de la méthode généralisée de la balance de l’accroissement démographique à ces données pour les hommes est fournie dans la feuille de calcul : AM_GGB_South Africa_males_hhd. Les résultats suggèrent que les décès sont approximativement aussi bien déclarés que ceux de l’état civil. Cependant, l’estimation du quotient de mortalité de 15 à 60 ans, 45q15, est de 548 pour 1000, ce qui est un peu plus élevé que l’estimation produite par les données de l’état civil (523 pour 1000). Mais lorsqu’on applique la méthode généralisée de la balance de l’accroissement démographique aux données du sexe féminin, (voir le classeur Excel AM_GGB_South Africa_females_hhd), on trouve une complétude des décès de femmes déclarés par les ménages inférieure à celle obtenue par les décès de l’état civil. On trouve donc une estimation du quotient de mortalité de 15 à 60 ans, 45q15, de 509 pour 1000, bien supérieure aux 420 pour 1000 obtenus par les décès de l’état civil, et bien moins plausible si on la compare au quotient obtenu pour les hommes.

On peut rechercher les raisons pour lesquelles la méthode semble moins bien marcher lorsqu’elle est appliquée aux décès de sexe féminin déclarés par les ménages en comparant les effectifs de décès calculés d’après les décès déclarés par les ménages aux effectifs de décès attendus par ceux de l’état civil après correction du sous-enregistrement, comme cela apparaît dans le tableau 7. Cette comparaison montre que le nombre de décès de femmes de 55 ans et plus est nettement plus faible. Ceci pourrait être dû au fait que les ménages sont dissous après le décès de ces femmes, car il est fréquent que les femmes qui décèdent à cet âge aient été le chef du ménage.

La comparaison suggère aussi un sur-enregistrement des décès d’hommes de moins de 30 ans et de femmes de moins de 25 ans. Ceci pourrait être dû au fait que leurs décès sont déclarés dans plusieurs ménages, ou au fait que l’état civil est moins complet chez les moins de 25 ans.

Tableau 7 : Rapport des estimations des décès déclarés par les ménages aux décès attendus, déclarés à l’état civil après correction du sous-enregistrement, Afrique du sud

Age

Sexe masculin

 

Sexe féminin

Déclarés

Attendus

Rapport

Déclarés

Attendus

Rapport

0-4

   

 

   

5-9

22 683

17 193

132%

 

22 995

14 670

157%

10-14

16 462

12 378

133%

 

15 173

10 417

146%

15-19

38 013

28 134

135%

 

35 666

27 050

132%

20-24

74 934

60 701

123%

 

95 993

85 167

113%

25-29

124 403

113 541

110%

 

152 718

155 452

98%

30-34

150 792

160 796

94%

 

166 488

171 801

97%

35-39

159 016

161 141

99%

 

137 837

142 328

97%

40-44

140 172

150 136

93%

 

111 910

116 506

96%

45-49

120 016

133 651

90%

 

85 284

94 022

91%

50-54

118 989

122 768

97%

 

76 941

82 330

93%

55-59

97 977

106 972

92%

 

57 353

72 605

79%

60-64

88 088

99 325

89%

 

69 220

79 395

87%

65-69

80 451

91 497

88%

 

67 007

86 665

77%

70-74

72 827

80 666

90%

 

69 536

94 017

74%

75-79

59 632

70 543

85%

 

61 942

88 894

70%

80-84

45 365

53 194

85%

 

58 410

77 590

75%

85+

51 779

51 021

101%

 

83 753

108 712

77%

Pour simuler une situation dans laquelle seul le dernier recensement possède la question sur les décès des 12 derniers mois, on calcule ici une estimation du nombre de décès dans chaque groupe d’âge entre l’instant du recensement de 2001 et l’enquête de communauté de 2007 en utilisant seulement les décès déclarés à l’enquête de communauté de 2007 selon la formule suivante :

5 D x ( t 2 ) 5 N x ( t 2 ) ( t 2 t 1 ) ( 5 N x ( t 1 )× 5 N x ( t 2 ) ) 1 2

En appliquant la méthode à ces nouveaux effectifs de décès, on trouve des estimations des quotients de mortalité à 15-59 ans, 45q15 , de 586 pour 1000 chez les hommes et de 578 pour 1000 chez les femmes. Mais, à la différence des estimations précédentes, ce sont des estimations de mortalité qui se rapportent essentiellement à l’année qui précède l’enquête de 2007. On pouvait donc s’attendre à une mortalité plus forte que la moyenne de la période 2001-2007 car la mortalité était en augmentation au cours de la période du fait de l’épidémie de VIH/sida. Il est bien évident que lorsqu’on fait une estimation à partir des décès d’une seule année (qui plus est provenant d’une enquête par sondage, sur un échantillon relativement faible) on peut s’attendre à des résultats moins fiables, ce qui semble être le cas ici, surtout pour les femmes. D’autres estimations faites pour l’année 2006 (Bradshaw, Dorrington and Laubscher 2012) donnent des valeurs proches de 550 pour 1000 chez les hommes et de 450 pour 1000 chez les femmes.

Description détaillée de la méthode

Exposé mathématique

La méthode généralisée de la balance de l’accroissement démographique suit la même logique que la méthode de Brass de la balance de l’accroissement démographique (Brass 1975). Cette dernière a pour origine les travaux de Carrier (1958), qui le premier a proposé une méthode d’estimation de la mortalité à partir de la distribution par âge de décès. La méthode est fondée sur une relation simple, l’équation de l’équilibre des populations, que l’on suppose par convention être fermée aux migrations. Dans une telle population fermée, le nombre de personnes vivantes au temps t2 est égal au nombre de personnes vivantes au temps t1 plus les naissances qui se produisent entre les instants t1 et t2, moins les décès qui se produisent entre les instants t1 et t2, qui peut s’écrire : N 0 ( t 2 )= N 0 ( t 1 )+BD B sont les naissances et D sont les décès qui se produisent entre les instants t1 et t2. On peut généraliser cette équation à la population d’âge x et plus. Dans ce cas, les naissances correspondent aux personnes qui atteignent leur x-ème anniversaire au cours de la période entre les instants t1 et t2, noté N x , et les décès sont les décès d’âge x et plus qui se produisent entre les instants t1 et t, noté D x . L’équation s’écrit alors :

N x ( t 2 )= N x ( t 1 )+ N x D x

L’équation (1) peut se réécrire comme suit :

N x ( t 2 ) N x ( t 1 )= N x D x .

On peut diviser les deux termes par les personnes-années vécues au cours de la période entre les instants t1 et t2, soit :

t 1 t 2 N x (t) dt

et l’équation de la balance de l’accroissement démographique s’écrit :

r(x+)=b(x+)d(x+)

r(x+)= N x ( t 2 ) N x ( t 1 ) t 1 t 2 N x (t) dt

b(x+)= N x t 1 t 2 N x (t) dt

et

d(x+)= D x t 2 t 1 N x (t)dt .

On appelle souvent les taux b(x+) et d(x+) respectivement les ‘taux partiels’ de natalité et de mortalité, ou parfois les ‘taux segmentiels’ (segmental birth and death rates).

Ces relations ne sont vérifiées que dans le cas où l’enregistrement des décès est complet pour tous les âges entre les instants t1 et t2, que les âges sont exacts, et qu’il en va de même pour le décompte de la population aux instants t1 et t2.

Supposons maintenant qu’au lieu d’un enregistrement complet, seule une certaine proportion de décès sont déclarés, la même à tous les âges, et qu’il en va de même pour les recensements de population, c'est-à-dire qu’une certaine proportion est recensée, qui peut être différente d’un recensement à l’autre, et différente de celle des décès. On a alors, au lieu des vraies valeurs : N x ( t 1 ) , N x ( t 2 ) et D x des valeurs déclarées, notées : N x r ( t 1 ) , N x r ( t 2 ) et D x r telles que : N x r ( t 1 )= k 1 N x ( t 1 ) , N x r ( t 2 )= k 2 N x ( t 2 ) et D x r =c D x .

Alors, si on utilise les approximations suivantes :

r(x+) ln( N x ( t 2 ) N x ( t 1 ) ) t 2 t 1

N x ( t 2 t 1 ) N n xn ( t 1 )× n N x ( t 2 ) n

et

t 1 t 2 N x (t) dt( t 2 t 1 ) ( N x ( t 1 )× N x ( t 2 ) ) 1 2

alors on a :

r(x+)= r r (x+)+ ln( k 1 k 2 ) t 2 t 1

r r (x+)= ln( N x r ( t 2 ) N x r ( t 1 ) ) t 2 t 1

b(x+)= b r (x+)= ( t 2 t 1 ) ( n N x5 r ( t 1 )× n N x r ( t 2 ) ) 1 2 /n ( t 2 t 1 ) ( N x r ( t 1 )× N x r ( t 2 ) ) 1 2

et

d(x+)= ( k 1 k 2 ) 1 2 c d r (x+)

et où

d r (x+)= D x r ( t 2 t 1 ) ( N x r ( t 1 )× N x r ( t 2 ) ) 1 2

L’équation 2 devient alors :

r r (x+)+ ln( k 1 k 2 ) t 2 t 1 = b r (x+) d r (x+) ( k 1 k 2 ) 1 2 c ,

c’est-à-dire :

b r (x+) r r (x+)=a+b d r (x+)

avec :

a= ln( k 1 / k 2 ) t 2 t 1

et

b= ( k 1 k 2 ) 1 2 c .

On peut donc résoudre cette équation pour k1, k2 et c, en faisant l’hypothèse que la complétude du meilleur des recensements est de 100%, c'est-à-dire en prenant la valeur du maximum de k1 et k2 = 1.

Ajustement de la droite de régression

Deux aspects doivent être considérés pour ajuster au mieux la droite qui décrit la relation entre le taux partiel de natalité et le taux partiel de mortalité : le choix de la méthode de régression, et le choix des points qui sont retenus pour calculer la pente et l’ordonnée à l’origine.

L’ajustement d’une droite en utilisant une régression non-pondérée et la méthode des moindres carrés n’est pas recommandé ici, car il donne trop de poids aux points aberrants qui ne sont pas fiables, surtout ceux qui représentent les âges élevés. On recommande plutôt une méthode plus robuste, telle que la ligne des moyennes (mean line), c’est-à-dire la droite qui joint deux points fixes, qui eux-mêmes sont les moyennes en abscisse et en ordonnée de la première moitié et de la seconde moitié des points correspondant à l’intervalle d’âge retenu. On peut aussi utiliser la ligne des moyennes tronquées (trimmed mean line) : c’est une ligne analogue, qui joint deux points fixes qui eux-mêmes sont les moyennes pondérées des points, les pondérations étant choisies pour donner moins de poids aux points qui sont moins fiables, en général les points situés aux extrémités. Ces méthodes sont expliquées en détail dans le Manuel X (UN Population Division 1984: 147–148). Une autre alternative est décrite dans le  Manuel des Nations Unies sur la Mortalité Adulte (UN Population Division 2002: 105–110). Cette méthode est là encore analogue à la méthode de la ligne des moyennes, mais dans ce cas on divise les points en trois groupes de même taille, et on choisit la droite qui joint les médianes des points en abscisse et en ordonnée correspondant au premier tiers et au dernier tiers des points classés par âge. 

Mari Bhat signale que chaque méthode a ses points faibles (Bhat 2002). Puisque les taux partiels de natalité et de mortalité sont traités tous deux comme des variables dépendantes, il propose d’utiliser la régression orthogonale comme la meilleure méthode pour tenir compte d’éventuelles erreurs sur les âges. Cette stratégie permet de tenir compte à la fois des distances horizontales et verticales à la ligne de régression, puisqu’elle minimise la somme des carrés des résidus orthogonaux (ORSS), définis comme suit :

i x i 2 y i 2 x i 2 + y i 2 .

L’utilisation de cette méthode conduit à calculer la complétude de la déclaration des décès, c, comme le rapport des écarts-types des taux partiels de mortalité et de natalité. La valeur de l’ordonnée à l’origine est la différence entre la moyenne des taux partiels de natalité et la moyenne des taux partiels mortalité divisés par c. C’est cette approche qui est utilisée dans l’application de la méthode de Brass de la balance généralisée de l’accroissement démographique présentée dans le classeur Excel joint à ce manuel.

Limites de la méthode

Cette méthode est moins vulnérable aux erreurs sur l’âge que la Méthode de l’extinction des cohortes synthétiques. Cependant, la tendance fréquente à exagérer l’âge au décès tel qu’il est déclaré (par rapport à l’âge déclaré au recensement) se manifestera dans le graphique : les points correspondants à l’intervalle d’âge où l’âge est exagéré auront tendance à se placer en-dessous de la droite de régression. On peut alors traiter ce problème en diminuant l’âge de début du dernier intervalle, en le choisissant en-dessous de l’âge qui correspond aux points qui font problème.

Les migrations ne sont pas prises en compte par ce modèle, mais elles peuvent affecter la population des jeunes adultes (surtout entre 20 et 35 ans). Elles ont en général beaucoup moins d’effet sur les décès, car ceux-ci sont concentrés aux âges élevés. Ignorer les immigrations va tendre à diminuer la pente de la droite, et donc à surestimer le sous-enregistrement des décès, et par conséquent à sous-estimer les taux de mortalité corrigés. Ignorer les émigrations aura l’effet contraire.

Les estimations du nombre de migrations nettes par âge au cours de la période intercensitaire font souvent défaut. Dans une telle situation, on peut procéder en suivant les recommandations suivantes. Si les migrations sont importantes mais restent inconnues, et que les points situés au-delà de l’âge de 30 ans sont bien alignés, on peut estimer la complétude en ajustant une droite restreinte aux points correspondants aux âge de 35 ans et plus. Si les migrations sont peu importantes, certains démographes préconisent d’ajuster une droite en partant de l’âge de 5 ans, pour réduire cette distorsion, en faisant l’hypothèse que toute différence entre le sous-enregistrement des décès à ces âges jeunes et celui aux âges élevés n’entrainera pas de distorsion sensible, puisque la mortalité reste très faible entre 5 et 14 ans. Dans le cas où les migrations sont peu importantes, d’autres auteurs (Hill, You and Choi 2009) proposent une autre stratégie : on pourrait obtenir une meilleure estimation en prenant la moyenne entre l’estimation de la complétude obtenue avec cette méthode et celle obtenue en appliquant la méthode de l’extinction des cohortes synthétiques aux mêmes données. Il reste possible que ces adaptations produisent de meilleurs estimations que celles obtenues en ignorant les migrations, mais on ne dispose que de peu de recherches sur ce point, ainsi que sur la précision des estimations de la complétude obtenues en procédant à de telles adaptations.

Les variations de la complétude de la déclaration des décès en fonction de l’âge peuvent introduire une courbure dans l’alignement des points du graphique. En conséquence, une des forces de cette méthode est que si les points qui représentent les groupes d’âge successifs sont approximativement situés sur une ligne droite, on peut alors raisonnablement supposer que la complétude est approximativement constante selon l’âge. Mais si certains points sont sur la ligne, et que d’autres en sont éloignés, une méthode pour décider quels points rejeter consiste à calculer le taux partiel de croissance pour chacun des intervalles ouverts successifs, et de garder seulement les points pour lesquels les valeurs de r a+ sont assez cohérentes.

Une des principales limites de cette méthode est peut-être que la valeur du diagnostic fait à partir de la représentation graphique des taux partiels de natalité et de mortalité reste faible, hormis les exceptions mentionnées ci-dessus.

Extensions de la méthode

Si les âges sont précis, et si l’hypothèse de la couverture constante par âge des recensements est vérifiée, alors la méthode peut être adaptée aux cas où la complétude de la déclaration des décès n’est constante que sur un intervalle d’âges limité, (x to x + n). Dans ce cas on restreint le groupe d’âge choisi pour l’équation de la balance de la croissance démographique. L’équation 2 devient alors :

n r x =b(x+) n d x b( (x+n)+ ) ,

n r x = n N x ( t 2 ) n N x ( t 1 ) t 1 t 2 n N x (t) dt

b(x+)= N x t 1 t 2 N x (t) dt

et

n d x = n D x t 1 t 2 n N x (t)dt .

La partie gauche de l’équation de régression qui correspond aux observations sélectionnées devient alors : b r (x+) b r (x+n+) r n x r . Mais on a très peu d’expérience sur la manière dont cette approche alternative fonctionne en pratique, probablement parce que les données des pays en développement sont rarement assez précises.

Autres lectures et références

L’analyse de la sensibilité de cette méthode aux erreurs de données les plus fréquentes et aux violations des hypothèses reste assez limitée. Toutefois, on renvoie le lecteur à Hill, You et Choi (2009) pour ce qui concerne les hypothèses de la méthode de la répartition des décès dans les populations sans sida, et à Dorrington et Timæus (2008) pour le cas des populations souffrant d’une forte épidémie de VIH/sida. Murray, Rajaratnam, Marcus et al. (2010) ont utilisé des simulations stochastiques et conclu que ces méthodes ne sont pas vraiment fiables. Mais leur travail n’a eu jusqu’ici qu’un impact très limité sur l’utilisation de ces méthodes, peut-être parce que ces auteurs ne fournissent que peu de détails sur la description de leurs simulations, ou peut-être que leur étude est basée sur des hypothèses irréalistes concernant une fréquence élevée des migrations. 

 

Bhat M. 2002. "General Growth Balance method: A reformulation for populations open to migration", Population Studies 56(1):23-34. doi: https://dx.doi.org/10.1080/00324720213798

Blacker J. 1988. An Evaluation of the Pakistan Demographic Survey. Karachi: Pakistan Federal Bureau of Statistics.

Bradshaw D, RE Dorrington and R Laubscher. 2012. Rapid Mortality Surveillance Report 2012. Cape Town: South African Medical Research Council. https://www.mrc.ac.za/bod/RapidMortality2011.pdf

Brass W. 1975. Methods for Estimating Fertility and Mortality from Limited and Defective Data. Chapel Hill NC: Carolina Population Centre.

Carrier NH. 1958. "A note on the estimation of mortality and other population characteristics, given death by age", Population Studies 12(2):149-163. doi: https://dx.doi.org/10.2307/2172187

Division de la Population des Nations Unies. 1984. Manuel X. Techniques indirectes d’estimation démographique. New York : Nations Unies, Département des affaires économiques et sociales internationales, ST/ESA/SER.A/81. https://unstats.un.org/unsd/demographic/standmeth/handbooks/Manuel_X-fr.pdf

Dorrington RE, TA Moultrie and IM Timæus. 2004. Estimation of mortality using the South African 2001 census data. Monograph 11. Centre for Actuarial Research, University of Cape Town. https://blogs.lshtm.ac.uk/iantimaeus/files/2024/03/Dorrington-Moultrie-Timaeus-Mono11.pdf

Dorrington RE and IM Timæus. 2008. "Death Distribution Methods for Estimating Adult Mortality: Sensitivity Analysis with Simulated Data Errors, Revisited," Paper presented at Population Association of America 2008 Annual Meeting. New Orleans, Louisiana, 17-19 April.

Hill K. 1987. "Estimating census and death registration completeness", Asian and Pacific Census Forum 1(3):8-13, 23-24. https://hdl.handle.net/10125/3602.

Hill K, D You and Y Choi. 2009. "Death distribution methods for estimating adult mortality: Sensitivity analysis with simulated data error", Demographic Research 21(Article 9):235-254. doi: https://dx.doi.org/10.4054/DemRes.2009.21.9

Murray CJL, JK Rajaratnam, J Marcus, T Laakso and AD Lopez. 2010. "What can we conclude from death registration? Improved methods for evaluating completeness", PLoS Med 7(4):e1000262. doi: https://dx.doi.org/10.1371/journal.pmed.1000262

Timæus IM. 2007. "Impact of HIV on mortality in Southern Africa: Evidence from demographic surveillance", in Caraël M and JR Glynn (eds). HIV, Resurgent Infections and Population Change in Africa, Springer, pp 229–243. doi: https://dx.doi.org/10.1007/978-1-4020-6174-5_12

UN Population Division. 2002. Methods for Estimating Adult Mortality. New York: United Nations, Department of Economic and Social Affairs, ESA/P/WP.175. https://www.un.org/esa/population/techcoop/DemEst/methods_adultmort/methods_adultmort.html

UN Population Division. 2011. World Population Prospects: The 2010 Revision, Volume I: Comprehensive Tables. New York: United Nations, Department of Economic and Social Affairs, ST/ESA/SER.A/313. https://www.un.org/development/desa/pd/sites/www.un.org.development.desa.pd/files/files/documents/2020/Jan/un_2010_world_population_prospects-2010_revision_volume-i_comprehensive-tables.pdf

Author
Dorrington RE
Suggested citation
Dorrington RE. 2014. La méthode généralisée de la balance de l’accroissement démographique. In Moultrie TA, Dorrington RE, Hill AG, Hill K, Timæus IM and Zaba B (eds). Tools for Demographic Estimation. Paris: International Union for the Scientific Study of Population. https://demographicestimation.iussp.org/fr/content/la-methode-generalisee-de-la-balance-de-laccroissement-demographique. Accessed 2025-01-16.