Evaluation de la qualité des données sur la fécondité récente tirées des recensements

Données disponibles
Méthode
Résultats souhaités

Introduction

Avant d’évaluer la qualité des données sur la fécondité récente recueillies dans un recensement, il importe d’examiner le libellé précis des questions utilisées pour saisir l’information sur les naissances récentes en consultant le questionnaire. Des questions très différentes ont été utilisées au gré des pays et des vagues successives de recensements. La formulation peut affecter la validité des estimations et le sens et l’ampleur des biais ou des erreurs dans les données.

Les formes génériques des questions sur la fécondité récente dans les recensements appartiennent à trois grandes catégories :

  • Avez-vous donné naissance à un enfant au cours de la dernière année (ou une autre période de référence) ?

Cette question produit une réponse binaire simple. Les naissances multiples au cours de la même période de référence ne sont pas saisies. Celles-ci peuvent résulter soit de la naissance de jumeaux ou de triplés lors d’une seule grossesse soit d’un très court intervalle séparant deux grossesses différentes. Aucune de ces éventualités n’est susceptible d’affecter substantiellement les taux fécondité car les intervalles entre naissances inférieurs à un an sont rares et la probabilité qu’une grossesse donne lieu à des naissances multiples est inférieure à 2 % dans la plupart des populations (à l’exception peut-être de l’Afrique sub-saharienne). Face à des données collectées sous cette forme, il est recommandé de faire l’hypothèse simplificatrice que toutes les naissances ont eu lieu au milieu de la période de référence, et que chaque grossesse ne donne lieu qu’à une naissance.

  • A combien d’enfants avez-vous donné naissance au cours de l’année écoulée (ou de toute autre période de référence) ?

Cette question est plus raffinée que la précédente. Elle ne donne pas d’information sur le calendrier de la naissance au cours de la période de référence, mais elle saisit l’information sur les naissances multiples qu’aurait eues une femme, sans distinguer toutefois entre les jumeaux et les intervalles courts entre naissances. Cette fois encore, il est raisonnable pour les calculs de supposer que les naissances se sont produites à la mi-temps de la période de référence.

  • Quelle a été la date de votre dernière naissance vivante ?

Cette question cherche à déterminer la date du dernier accouchement avec un plus grand degré de précision, même si, en général, seuls le mois et l’année de la dernière naissance sont enregistrés. S’il y a en outre des questions sur le nombre de naissances qui se sont produites à cette date, l’ensemble donne une information plus précise sur le nombre de naissances récentes.

D’autres questions sont parfois posées (par exemple, sur la survie du dernier né, son sexe ou la date de naissance de l’enfant précédent). On peut en tirer des estimations directes sur les taux de mortalité infantile par sexe ou le rapport de masculinité à la naissance, par exemple.

L’évaluation de la qualité des données sur la fécondité récente peut inclure les contrôles suivants :

  1. Comparaison du nombre total de naissances avec le nombre attendu (par exemple, avec les nombres tirés du système d’enregistrement à l’état civil ou de l’application d’une série précise de taux de fécondité par âge à la population recensée des femmes – bien que, dans ce cas, le sous-dénombrement systématique des femmes puisse aussi causer une sous-estimation des taux) ;
  2. Evaluation de la vraisemblance de la distribution des taux de fécondité par âge tirés directement des données. Des distributions plausibles de la fécondité par âge sont presque invariablement uni modales, concaves, légèrement asymétriques à droite, et proches de zéro aux deux âges extrêmes de la période féconde. La distribution doit également présenter une évolution raisonnablement régulière des taux de fécondité d’un âge à l’autre ;
  3. Contrôle de la vraisemblance des nombres déclarés de naissances dans la période de référence. Dans certains recensements (par exemple l’Afrique du sud 1996), une proportion significative de répondantes confondent les questions sur le nombre total d’enfants déjà nés et celles sur la fécondité récente et donnent la même réponse aux deux questions. Cette erreur se manifeste par une forte diagonale dans les tableaux croisés des nombres d’enfants déjà nés par les nombres d’enfants nés dans l’année écoulée par âge de la mère (Moultrie and Timæus 2002) ;
  4. Si les données ont été recueillies sur le sexe du dernier né, le rapport de masculinité à la naissance doit faire l’objet d’un contrôle. Le rapport de masculinité à la naissance est habituellement de l’ordre de 1,05, mais peut n’être que de 0,95 dans les populations africaines, et atteindre 1,1 dans certaines populations d’Asie. Des valeurs hors de l’intervalle 0,99-1,06 doivent être examinées soigneusement.

Dans tous les cas, il est indispensable d’identifier précisément l’univers des femmes à qui sont adressées les questions (en particulier les âges et l’état matrimonial des répondantes éligibles), ainsi que les règles d’enregistrement et de codage des non réponses et des données incorrectes.

Evaluation de la qualité des données sur la fécondité actuelle

Avant d’analyser les taux de fécondité par âge, il est recommandé d’évaluer dans quelle mesure les données sur les naissances récentes sont manquantes ou peu vraisemblables. L’absence de toute donnée manquante indique presque certainement que les données ont été corrigées. Si c’est le cas, d’autres recherches doivent porter sur l’ampleur des corrections et/ou des imputations dans la mesure du possible, par exemple, en examinant la distribution de valeurs imputées lorsque des étiquettes d’imputation ont été ajoutées aux données.

La proportion de données manquantes doit aussi être vérifiée. Si elle dépasse 5 % du nombre total des enregistrements permettant d’établir les données de fécondité actuelle, des recherches plus approfondies sont nécessaires. Il faut en particulier examiner la distribution par âge des cas manquants. Si ceux-ci sont concentrés aux jeunes âges ou chez les quadragénaires, on peut penser que les cas manquants correspondent à des femmes qui n’ont pas eu de naissance au cours de la période de référence, l’agent recenseur n’ayant pas enregistré de réponse au lieu d’indiquer zéro. C’est une erreur de même type que celle conduisant à la correction d’el Badry.

Quand les données donnent lieu à des tableaux par nombre de naissances dans la période de référence (plutôt que d’indiquer simplement si, oui ou non, une naissance a eu lieu au cours de la période de référence), on doit s’attacher aux nombres respectifs de naissances simples et multiples. En général, moins de 2 % des grossesses donnent naissance à plusieurs enfants. Les triplés et plus sont extrêmement rares (moins de 0,5 % des accouchements). Si la proportion de naissances multiples au cours de la période de référence semble trop élevée, il est recommandé d’établir des tableaux croisant le nombre total d’enfants déjà nés et les naissances au cours de l’année écoulée dans chaque groupe d’âge de femmes. Si le total d’enfants déjà nés et les naissances de l’année écoulée sont identiques dans une large proportion de cas, même pour des parités de deux ou plus, on peut penser que les personnes recensées ou les agents recenseurs n’ont pas compris la distinction entre les questions sur la descendance et sur la fécondité récente. Il se peut toutefois qu’une large proportion de jeunes femmes n’ayant qu’un enfant déjà né ait eu la naissance correspondante au cours de la période de référence, et une coïncidence fréquente entre des descendances d’un seul enfant et des déclarations d’une naissance récente par les jeunes femmes peut très bien ne pas indiquer des erreurs de déclaration.

Mesure directe de la fécondité à partir des données de recensement

Quand la qualité des données est suffisante, on peut estimer directement les taux de fécondité par âge. Quand la qualité des données est médiocre, les taux de fécondité par âge obtenus par calcul direct sont incorporés dans diverses méthodes visant à produire des estimations plus fiables du niveau de fécondité par recours à des techniques indirectes.

La forme exacte des taux de fécondité par âge qu’on peut calculer dépend de la nature des données recueillies. Un taux de fécondité par âge à un âge (ou dans un groupe d’âge) donné est le rapport du nombre de naissances des femmes de cet âge (dans ce groupe d’âge) dans une période définie au nombre de femmes-années vécues par les femmes du même âge (dans le même groupe d’âge) dans la même période. Pour que le calcul soit exact, il faut connaître de façon fiable les dates de naissance des mères (pour déterminer l’âge de la mère) et de leurs enfants. On peut alors calculer précisément l’âge de la mère à la naissance de son enfant, et allouer son exposition au risque aux âges ou groupes d’âge appropriés au long de la période couverte par la recherche.

Les données nécessaires pour ces calculs précis ne sont généralement pas disponibles dans les micro-données de recensement, soit parce que les dates complètes ne sont pas recueillies sur le terrain, soit parce qu’il y aurait un risque de violation de la confidentialité si les dates de naissance complètes étaient accessibles aux utilisateurs finaux des données. En outre, les données de recensement sont rarement de qualité suffisante pour justifier un tel surcroit de précision. L’attraction exercée par certains mois de naissance (par exemple janvier) ainsi que certaines années de naissance (par exemple celles finissant par 0 ou 5) pose fréquemment problème. Des périodes de dénombrement étendues peuvent créer des problèmes quand il s’agit de passer de la période de référence (par exemple les douze mois écoulés jusqu’à la date d’interview) à une période calendaire (par exemple 2008). En outre, les questions rétrospectives sur les naissances récentes posées dans un recensement excluent évidemment l’information relative aux naissances des mères qui sont décédées ou ont quitté le pays depuis leur accouchement.

Il y a quatre combinaisons possibles d’ informations essentielles relatives à la mère et aux naissances récentes (Tableau 1).

Tableau 1 Taxonomie des données relatives à la mère et aux enfants pour l’estimation de la fécondité récente

 

 

Informations sur la mère

 

 

Age révolu au recensement

Date de naissance
(au moins
mois, année)

Information sur les enfants nés au cours de la période précédant le recensement(*)

Nombre d’enfants nés
(ou simplement, oui/non)

(1)

(2)

Date de naissance du dernier né
(au moins
mois, année)

(3)

(4)

(*)En général la période précédant le recensement est de 12 mois, mais l’analyste doit être attentif à la possibilité de périodes non-standards, fondée par exemple sur le temps écoulé depuis un événement national important.

Même dans le cas (4) du tableau 1, qui repose sur les informations les plus détaillées, le souci de calculer précisément l’exposition au risque ne donne pas forcément des résultats garantis, du fait que l’attraction exercée par certains mois lors de la déclaration des dates et autres problèmes de qualité des données peuvent sévèrement altérer les estimations. Le recours à de simples approximations pour le calcul des taux de fécondité à partir des données de recensement est généralement suffisant. Dans la section sur la mesure directe de la fécondité à partir des données d’enquête [13], nous décrivons le calcul plus précis de l’exposition au risque et l’estimation des taux de fécondité à partir de données de bonne qualité.

Cas 1 et 2 : Estimation des taux de fécondité par âge directement à partir de données ne fournissant pas d’information sur la date de naissance de l’enfant

Dans les cas (1) et (2) du tableau 1, ce qui est connu sur la fécondité récente de la mère se limite au fait qu’elle a donné naissance (ou non) à au moins un enfant au cours de la période précédant le recensement. Dans des variantes plus informatives de la question sur la fécondité récente, la mère peut être interrogée sur le nombre de naissances vivantes qu’elle a eues dans la période précédant le recensement. Une telle question permet d’identifier à la fois les naissances multiples issues d’une même grossesse (jumeaux, triplés, etc.), et les cas où plus d’une grossesse arrive à son terme au cours de la période de référence.

Comme l’âge de la mère à l’accouchement n’est pas connu, l’approximation couramment utilisée consiste à classer les taux de fécondité selon l’âgé déclaré par la mère à la date du recensement. On fait alors l’hypothèse supplémentaire que les naissances ont toutes eu lieu au milieu de l’intervalle en question. Ceci signifie qu’au moment du recensement les mères sont, en moyenne, plus âgées de la moitié de la durée de l’intervalle. Il en résulte que les âges auxquels les taux de fécondité se réfèrent réellement sont plus jeunes que les âges des femmes déclarés au recensement. La plupart des méthodes standards d’estimation indirecte de la fécondité corrigent les âges de ce décalage.

L’information supplémentaire (sur le mois et l’année de naissance de la mère) dont on dispose dans le deuxième cas ne permet guère d’affiner les estimations de la fécondité car on continue d’avoir besoin d’hypothèses supplémentaires d’uniformité de la distribution des dates de naissance des enfants. Donc, dans le cas (2) comme dans le cas (1) du tableau 1, les taux de fécondité sont estimés en divisant le nombre de naissances déclarées au cours de la période de référence (classées par âge de la mère à la date du recensement) par le nombre de femmes de cet âge. Le nombre total de naissances au cours de la période de référence déclaré par les femmes âgées x à la date du recensement, Bx, est donné par

B x = k=0 ω k. N x,k

k est le nombre déclaré de naissances au cours de la période de référence, ω est la valeur maximale de k dans les données et Nx,k est le nombre de femmes âgées de x au recensement déclarant avoir eu k naissances au cours de la dernière année. Si ω est exprimé comme un intervalle ouvert, par exemple 3 naissances ou plus au cours de la période de référence, les femmes dans cette catégorie sont supposées avoir eu le nombre de naissances qui ouvre cet intervalle (soit 3 naissances ici). L’erreur qui en résulte est de nouveau faible.

Le nombre de femmes âgées de x est donné par

N x = k=0 ω N x,k

Les femmes dont les naissances récentes ne sont pas connues ou n’ont pas été déclarées doivent être exclues à la fois du numérateur et du dénominateur, avec l’hypothèse implicite que leur fécondité ne diffère pas de celle des femmes dont la fécondité récente est connue. Les taux de fécondité par âge x sont égaux à

f x = B x / N x

Dans l’intervalle d’âge conventionnel (de 15 ans à 49 ans, inclus), l’indice synthétique de fécondité (TF) calculé à partir des taux par année d’âge est égal à

TF= a=15 49 f a

L’indice synthétique de fécondité désigne le nombre d’enfants qu’une femme aurait si elle survivait jusqu’à 50 ans (considéré comme la fin de la période féconde) en ayant, au long de sa vie reproductive, les taux de fécondité par âge observés au cours de la période précédant immédiatement le recensement.

Il convient de calculer et de représenter graphiquement les taux de fécondité par année d’âge afin de vérifier la cohérence interne des données. Les taux de fécondité par âge sont en général moins erratiques que les numérateurs ou les dénominateurs eux-mêmes et ils peuvent indiquer des niveaux et des distributions vraisemblables de la fécondité. Une série de taux par âge fortement erratique, s’écartant fortement de la forme prévisible en n, laisse fortement supposer que les données de fécondité récente posent problème et invite à pousser les recherches plus avant.

Enfin  on peut calculer des taux de fécondité par groupes d’âges quinquennaux, 5fx, où x = 15, 20,…, 45 :

f i = f 5 x = x=5i+10 5i+14 B x x=5i+10 5i+14 N x

où l’indice i est égal à i=(x/5) - 2. La mesure de l’indice synthétique de fécondité est donc

TF=5. i=1 7 f i

Alors que l’indice synthétique est une mesure de la fécondité standardisée par l’âge (la distribution par âge de la population féminine d’âge fécond étant supposée implicitement uniforme par groupe d’âge), le taux de fécondité de chaque groupe d’âge n’est pas standardisé au sein du groupe. Il peut en résulter un léger écart entre les indices synthétiques résultant respectivement d’un calcul par groupe d’âge et par année d’âge, mais cet écart ne porte généralement que sur la deuxième ou la troisième décimale.

L’indice synthétique de fécondité doit être comparé aux estimations tirées d’autres sources de données pour le même pays (par exemple des EDS). Il faut toutefois se souvenir que les taux de fécondité par âge et les indices synthétiques obtenus par cette méthode ne prennent pas en compte la vraie exposition au risque dans la détermination du dénominateur. En outre, le numérateur inclut des événements ayant eu lieu pendant la période de référence classés selon l’âge de la mère à la fin de celle-ci, et non par son âge au moment où l’événement a eu lieu. La plupart des méthodes d’estimation indirecte de la fécondité corrigent les taux de fécondité calculés pour tenir compte de ce décalage. Dans des comparaisons de base visant à évaluer les forme et le niveau des distributions de fécondité), les différences dans les classements par âge ont peu d’importance. La variante F-seulement du modèle relationnel de Gompertz offre toutefois une méthode pour ne pas décaler les taux de fécondité lors de leur lissage, si on le souhaite.

Exemple : Calcul direct de la fécondité

Au recensement de 2008 au Cambodge, les femmes ont été interrogées sur le nombre d’enfants qu’elles ont eu l’année précédente. L’âge des mères est l’âge à la date du recensement. Les données figurent au tableau 2.

Tableau 2 Fécondité récente par âge de la mère à la date du recensement, Cambodge, recensement de 2008.

 

Naissances au cours de l’année précédente

 

 

 

Age

0

1

2

3

4

Manquant

Naissances

Femmes

Taux*

15

160 980

120

0

0

0

80

120

161 180

0,0007

16

152 710

500

0

0

0

50

500

153 260

0,0033

17

144 970

1 250

10

10

0

20

1 300

146 260

0,0089

18

182 500

3 540

20

0

0

40

3 580

186 100

0,0192

19

127 840

5 640

10

0

0

30

5 660

133 520

0,0424

20

147 990

8 840

80

0

0

90

9 000

157 000

0,0574

21

123 960

9 500

30

0

0

70

9 560

133 560

0,0716

22

126 030

11 600

80

0

0

30

11 760

137 740

0,0854

23

123 750

11 830

70

10

0

110

12 000

135 770

0,0885

24

121 820

11 010

150

10

20

80

11 420

133 090

0,0859

25

137 460

12 420

100

0

0

60

12 620

150 040

0,0841

26

115 370

11 320

110

0

0

80

11 540

126 880

0,0910

27

117 840

11 580

190

0

0

40

11 960

129 650

0,0923

28

118 270

10 690

110

0

10

30

10 950

129 110

0,0848

29

82 990

7 600

120

0

0

40

7 840

90 750

0,0864

30

77 690

5 950

40

10

0

30

6 060

83 720

0,0724

31

58 800

4 820

50

20

0

30

4 980

63 720

0,0782

32

67 110

4 480

150

20

0

110

4 840

71 870

0,0674

33

67 080

4 240

40

0

0

50

4 320

71 410

0,0605

34

67 010

3 800

30

10

10

70

3 930

70 930

0,0555

35

90 720

4 570

60

20

0

30

4 750

95 400

0,0498

36

77 950

3 800

10

10

0

30

3 850

81 800

0,0471

37

81 320

4 070

50

10

10

10

4 240

85 470

0,0496

38

92 290

3 780

30

20

30

30

4 020

96 180

0,0418

39

74 030

2 920

50

0

0

30

3 020

77 030

0,0392

40

88 940

2 720

70

10

10

50

2 930

91 800

0,0319

41

71 250

2 140

0

0

0

20

2 140

73 410

0,0292

42

81 560

2 010

30

0

0

60

2 070

83 660

0,0248

43

72 930

1 270

10

0

0

30

1 290

74 240

0,0174

44

69 660

930

10

0

0

50

950

70 650

0,0135

45

84 290

760

30

10

10

30

890

85 130

0,0105

46

67 330

510

0

50

30

40

780

67 960

0,0115

47

66 220

270

10

0

10

0

330

66 510

0,0050

48

74 790

310

10

10

0

30

360

75 150

0,0048

49

57 600

120

0

20

10

20

220

57 770

0,0038

TOTAL

3 473 050

170 910

1 760

250

150

1 600

175 780

3 647 720

1,6157

* Taux de fécondité par âge

La colonne « Manquant » indique que seulement 1 600 femmes sur près de 3,65 millions âgées entre 15 et 49 ans n’ont pas eu leur fécondité récente enregistrée. Ceci représente 0,04 % de l’ensemble des femmes et n’aura pas d’impact sur la fécondité estimée des femmes au Cambodge. Un contrôle supplémentaire portant sur la distribution par âge de ces cas ne fait pas apparaître de schéma particulier d’omission. Le nombre de naissances est égal à la somme pondérée des femmes déclarant 1, 2, 3 ou 4 accouchements, sur la dernière ligne. 173 070 femmes (170 910 + 1 760 + 250 + 150) ont eu un total de 175 780 naissances (1x170 910 + 2×1 760 + 3×250 + 4×150) au cours de l’année précédant le recensement. Parmi ces femmes, 98,8 % (170 910 / 173 070) ont eu une seule naissance, 1,0 % ont eu des jumeaux et 0,2 % des triplés ou plus. L’éventualité de quintuplés (ou de cinq naissances en deux accouchements au cours de la période) est si faible qu’elle peut être ignorée. Si le recensement n’avait pas comptabilisé les naissances multiples séparément, le taux brut de natalité aurait été sous-estimé par un facteur de 173 070/175 780 = 0,984. La sous-estimation est donc de 1,6 %.

A partir des données ci-dessus, la série des taux de fécondité par année d’âge est obtenue en divisant le nombre total de naissances issues des femmes de chaque âge par le nombre de femmes ayant déclaré leur fécondité récente, c’est-à-dire en excluant les femmes qui n’ont pas déclaré combien de naissances elles ont eu au cours de l’année passée. Les taux sont représentés sur la figure 1. Alors que le nombre de femmes dénombrées à chaque âge est erratique, les taux de fécondité par année d’âge sont relativement lisses, avec un schéma de fécondité clairement défini et un pic caractéristique aux environs de 25 ans.

 

Image
Figure 1 Age-specific fertility rates, Cambodia 2008 census
Figure 1 Age-specific fertility rates, Cambodia 2008 census

Selon ces données, l’indice synthétique de fécondité est de 1,61 enfants par femme. Le calcul conduit par groupes d’âges quinquennaux donne le même résultat (tableau 3), même si les mesures diffèrent à la troisième décimale, comme on l’a évoqué plus haut.

Tableau 3 Taux de fécondité par groupes d’âge quinquennaux, Cambodge, recensement de 2008 et Enquêtes Démographiques et de Santé 2005 et 2010

Groupe d’âge

Femmes

Manquant

Naissances

Taux

 

EDS2005

EDS2010

15-19

780 320

220

11 160

0,014

 

0,047

0,046

20-24

697 160

380

53 740

0,077

 

0,175

0,173

25-29

626 430

250

54 910

0,088

 

0,180

0,167

30-34

361 650

290

24 130

0,067

 

0,142

0,121

35-39

435 880

130

19 880

0,046

 

0,091

0,071

40-44

393 760

210

9 380

0,024

 

0,041

0,028

45-49

352 520

120

2 580

0,007

 

0,005

0,004

TF

 

 

 

1,61

 

3,41

3,05

Source: Recensement, nos calculs ; EDS, StatCompiler (www.statcompiler.com)

Même en l’absence de contrôle externe, les résultats tirés des données du recensement de 2008 font apparaître des niveaux de fécondité invraisemblablement bas au Cambodge. Les données sont également incohérentes avec les parités moyennes calculées plus haut à la section sur l’évaluation de la qualité des données sur les descendances. Ceci suggère que les données sur la fécondité récente recueillies dans ce recensement sont fortement déficientes. Des contrôles externes le confirment, sous forme d’estimations de fécondité tirées de deux EDS réalisées avant et après le recensement. Selon les données des deux dernières colonnes du tableau 3, l’indice synthétique de fécondité estimé à partir de l’EDS 2010 (fondé sur les naissances des trois ans précédant l’enquête) est de 3,1 enfants par femme. L’estimation à partir de l’EDS de 2005 était de 3,4 enfants par femme. Seulement la moitié environ des naissances survenues dans l’année précédant le recensement ont été déclarées aux agents recenseurs.

Le graphique de gauche sur la figure 2 représente les taux de fécondité par âge calculés à partir du recensement de 2008 et des deux EDS. Les taux tirés du recensement diffèrent clairement de ceux tirés des EDS. Ces derniers, de leur côté, présentent un schéma plutôt étrange d’évolution de la fécondité en cinq ans, marquée par des réductions à peu près constante entre 25 et 44 ans. Le graphique de droite de la figure 2 représente les même taux mais ramenés à un même indice synthétique de fécondité de un enfant par femme. Malgré des différences fortes dans le niveau global de la fécondité, la forme des trois distributions par âge est très semblable, la seule réelle différence entre elles étant à 20-24 ans. C’est pourquoi il semble peu vraisemblable qu’il y ait d’importantes différences dans la qualité de la déclaration de la fécondité récente selon l’âge des femmes dans le recensement de 2008 au Cambodge.

Même si le niveau de la fécondité tiré des données du recensement de 2008 est sérieusement biaisé, la forme de la distribution par âge de la fécondité est raisonnablement précise. Ceci est une condition préalable à l’application de nombreuses méthodes indirectes d’estimation de la fécondité.

 

Image
Figure 2 Age-specific fertility rates, and standardized age-specific fertility rates, Cambodia 2008 census, 2005 DHS and 2010 DHS
Figure 2 Age-specific fertility rates, and standardized age-specific fertility rates, Cambodia 2008 census, 2005 DHS and 2010 DHS

 

Cas 3 et 4 : Estimation des taux de fécondité par âge quand la date de naissance de l’enfant est connue

Si les données sont classées par date de naissance du dernier né des femmes, il convient de choisir  une période appropriée pour les analyses sur la fécondité. En général, il est conseillé de ne pas prendre des périodes beaucoup plus longues qu’un an car des périodes plus longues accroissent la probabilité que les femmes aient eu plus d’une grossesse au cours de cette période. Les naissances ayant eu lieu plus anciennement sont donc omises (la condition requise étant de déclarer la date de naissance du dernier né, pas de tous les enfants nés au cours de la période), ce qui signifie que les estimations de la fécondité excluront systématiquement des naissances dans le passé le plus ancien. En outre, si la fécondité a évolué rapidement, allonger la période de recherche au-delà d’un an signifie que les estimations représenteront une sorte de moyenne de la fécondité au long de la période. Si le recensement a eu lieu assez tôt ou assez tard dans l’année, il peut être intéressant de calculer les taux sur les naissances depuis le début de l’année précédente ou de l’année courante car ce choix ne nécessite pas que les femmes se souviennent précisément du mois de naissance de leur enfant. Le nombre de naissances déclaré au cours de la période de référence peut alors être ramené à une estimation des naissances annuelles par un calcul au prorata. On peut calculer les taux à la fois de cette façon et en s’appuyant sur une période de référence de 12 mois puis comparer les résultats.

Le scénario (3) au tableau 1 ne permet pas d’obtenir une mesure tout à fait précise de la fécondité puisque l’âge de la mère à la naissance de l’enfant ne peut pas être établi précisément. La connaissance de la date de naissance de l’enfant permet bien, toutefois, de déterminer plus soigneusement le dénominateur des taux de fécondité par âge.

Dans la situation courante où la question posée porte sur le mois et l’année de naissance du dernier enfant, une démarche plus soigneuse peut permettre de déterminer le nombre de naissances au cours de l’année passée. En général la date du recensement est fixée conventionnellement. Les questions dans le questionnaire de recensement se réfèrent généralement à un jour particulier, même si le processus effectif de dénombrement prend plusieurs semaines. Une liste des dates de recensement pour les trois dernières vagues de recensement a été établie par les Nations Unies : https://unstats.un.org/unsd/demographic-social/census/censusdates ; une liste des dates de recensement pour les données diffusées par IPUMS est disponible à https://international.ipums.org/international-action/sample_details.

Lors de la détermination du numérateur, toutes les naissances déclarées dans le mois du recensement, et une proportion au prorata des naissances déclarées s’être produites le mois équivalent un an plus tôt doivent être incluses. Pour tirer cette information des données de recensement, en fonction de la capacité de traitement des dates des logiciels statistiques utilisés, on peut recourir à la procédure de numérotation des mois à partir du début du siècle des EDS.

Tableau 4 Naissances déclarées chaque mois par âge de la mère à la date de recensement (24-25 août 1999), Kenya, recensement de 1999

 

Age de la mère au recensement

Mois

15-19

20-24

25-29

30-34

35-39

40-44

45-49

Août 1998

13 240

31,300

23,120

13,940

8,940

3,220

560

Septembre 1998

9 800

22,900

17,260

9,560

6,180

2,080

680

Octobre 1998

9 240

21,580

15,520

9,600

5,880

1,880

500

Novembre 1998

9 040

21,940

16,060

9,880

5,280

1,660

540

Décembre 1998

10 200

23,700

18,000

10,580

5,940

2,080

480

Janvier1999

14 720

28,620

20,620

12,260

7,300

2,180

660

Février 1999

20 740

42,140

30,860

17,400

11,220

4,560

2,060

Mars 1999

15 620

31,480

21,320

12,520

7,340

2,820

520

Avril 1999

18 660

33,160

24,260

12,240

7,820

2,860

720

Mai 1999

19 660

33,880

22,860

13,960

7,440

2,480

760

Juin 1999

20 100

32,140

23,380

12,580

7,300

2,720

560

Juillet 1999

21 600

32,360

23,860

13,800

7,060

2,640

520

Août 1999

15 900

25,020

16,720

9,280

5,840

1,620

360

Naissances estimées l’année passée

 188 269,68

 355 987,74

 255 940,65

 146 807,74

 86 618,71

 30 307,10

 8 486,45

Nombre de femmes

  1 700 060

  1 495 180

  1 205 060

  849 620

  725 780

  519 740

  417 500

Taux de fécondité par âge

0,1107

0,2381

0,2124

0,1728

0,1193

0,0583

0,0203

Lors du recensement de 1999 au Kenya, la date de référence officielle était la nuit du 24 au 25 août 1999. Pour estimer les naissances survenues dans l’année précédant le recensement, toutes les naissances déclarées entre septembre 1998 et août 1999 doivent être incluses, ainsi que 1-24/31 (=7/31) des naissances déclarées en août 1998. Ceci suppose que les naissances sont uniformément réparties au long du mois (Tableau 4). Par exemple, le nombre estimé de naissances au cours de l’année précédant le recensement dans le groupe 30-34 ans est donné par

7 31 (13 940)+9 560+9 600 +...+9 280 =146 807,74

En l’absence d’information supplémentaire sur la date de naissance de la mère, les données ci-dessus sont classées selon le groupe d’âge de la mère à la date du recensement. Comme on l’a dit précédemment, les taux ainsi calculés doivent faire l’objet d’un décalage d’une demi-année.

Les taux de fécondité par âge sont obtenus en divisant ces naissances par le nombre de femmes dans chaque groupe d’âge. Les estimations de l’indice synthétique de fécondité qui en résultent sont sensiblement éloignées des autres estimations de la fécondité dans le pays vers cette époque. Comme au Cambodge, ceci donne à penser que les naissances au cours de l’année précédant le recensement sont fortement sous-déclarées.

On ne peut prendre une mesure précise de la fécondité que dans le cas (4), quand on dispose d’une information détaillée sur la date de naissance aussi bien de la mère que de l’enfant. Mais si certaines dates de naissance (par exemple le 1er janvier) exercent une forte attraction, le recours à des mesures affinées ne sert à rien car elles seront biaisées par l’attraction. Comme il y a peu de chances que la qualité et la cohérence interne des données recueillies lors d’un recensement soient aussi bonnes que dans une EDS, il est inutile d’appliquer le même calcul précis que celui qu’on utilise dans une EDS. Il y a toutefois des situations où l’attraction lors de la déclaration des dates de naissance et les autres erreurs dans les données jouent un rôle suffisamment limité pour qu’il vaille la peine de faire un calcul direct des estimations de fécondité. Dans ces cas, on doit appliquer les principes décrits pour le calcul des estimations de la fécondité récente à partir des données d’enquête [13].

Références

Moultrie, Tom A. and Ian M. Timæus. 2002. Trends in South African Fertility between 1970 and 1998: An Analysis of the 1996 Census and the 1998 Demographic and Health Survey. Cape Town: Medical Research Council. https://www.mrc.ac.za/sites/default/files/attachments/2022-08/trends.pdf. Access: 17 Octobre 2024.

For example, in the Kenya 1999 census, the official census date was the night of 24-25 August 1999. To estimate the births that occurred in the year preceding the census, all births reported between September 1998 and August 1999 would be included, along with 1-24/31 (=7/31) of the births reported in August 1998, on the assumption that births are uniformly distributed over the days of a month.

Image

 

Note that, in the absence of further information about the mother’s date of birth, the data above is still tabulated according to the mother’s age at the census date, and the rates so derived would still be subject to a half-year shift, as with the other methods described above.

Author
Moultrie TA
Suggested citation
Moultrie TA. 2014. Evaluation de la qualité des données sur la fécondité récente tirées des recensements. In Moultrie TA, Dorrington RE, Hill AG, Hill K, Timæus IM and Zaba B (eds). Tools for Demographic Estimation. Paris: International Union for the Scientific Study of Population. https://demographicestimation.iussp.org/fr/content/evaluation-de-la-qualite-des-donnees-sur-la-fecondite-recente-tirees-des-recensements. Accessed 2024-12-02.