Evaluation de la qualité des données sur la fécondité récente tirées des recensements

Données disponibles

Méthode

Résultats souhaités

Introduction

Avant d’évaluer la qualité des données sur la fécondité récente recueillies dans un recensement, il importe d’examiner le libellé précis des questions utilisées pour saisir l’information sur les naissances récentes en consultant le questionnaire. Des questions très différentes ont été utilisées au gré des pays et des vagues successives de recensements. La formulation peut affecter la validité des estimations et le sens et l’ampleur des biais ou des erreurs dans les données.

Les formes génériques des questions sur la fécondité récente dans les recensements appartiennent à trois grandes catégories :

Avez-vous donné naissance à un enfant au cours de la dernière année (ou une autre période de référence) ?

Cette question produit une réponse binaire simple. Les naissances multiples au cours de la même période de référence ne sont pas saisies. Celles-ci peuvent résulter soit de la naissance de jumeaux ou de triplés lors d’une seule grossesse soit d’un très court intervalle séparant deux grossesses différentes. Aucune de ces éventualités n’est susceptible d’affecter substantiellement les taux fécondité car les intervalles entre naissances inférieurs à un an sont rares et la probabilité qu’une grossesse donne lieu à des naissances multiples est inférieure à 2 % dans la plupart des populations (à l’exception peut-être de l’Afrique sub-saharienne). Face à des données collectées sous cette forme, il est recommandé de faire l’hypothèse simplificatrice que toutes les naissances ont eu lieu au milieu de la période de référence, et que chaque grossesse ne donne lieu qu’à une naissance.

A combien d’enfants avez-vous donné naissance au cours de l’année écoulée (ou de toute autre période de référence) ?

Cette question est plus raffinée que la précédente. Elle ne donne pas d’information sur le calendrier de la naissance au cours de la période de référence, mais elle saisit l’information sur les naissances multiples qu’aurait eues une femme, sans distinguer toutefois entre les jumeaux et les intervalles courts entre naissances. Cette fois encore, il est raisonnable pour les calculs de supposer que les naissances se sont produites à la mi-temps de la période de référence.

Quelle a été la date de votre dernière naissance vivante ?

Cette question cherche à déterminer la date du dernier accouchement avec un plus grand degré de précision, même si, en général, seuls le mois et l’année de la dernière naissance sont enregistrés. S’il y a en outre des questions sur le nombre de naissances qui se sont produites à cette date, l’ensemble donne une information plus précise sur le nombre de naissances récentes.

D’autres questions sont parfois posées (par exemple, sur la survie du dernier né, son sexe ou la date de naissance de l’enfant précédent). On peut en tirer des estimations directes sur les taux de mortalité infantile par sexe ou le rapport de masculinité à la naissance, par exemple.

L’évaluation de la qualité des données sur la fécondité récente peut inclure les contrôles suivants :

Comparaison du nombre total de naissances avec le nombre attendu (par exemple, avec les nombres tirés du système d’enregistrement à l’état civil ou de l’application d’une série précise de taux de fécondité par âge à la population recensée des femmes – bien que, dans ce cas, le sous-dénombrement systématique des femmes puisse aussi causer une sous-estimation des taux) ;
Evaluation de la vraisemblance de la distribution des taux de fécondité par âge tirés directement des données. Des distributions plausibles de la fécondité par âge sont presque invariablement uni modales, concaves, légèrement asymétriques à droite, et proches de zéro aux deux âges extrêmes de la période féconde. La distribution doit également présenter une évolution raisonnablement régulière des taux de fécondité d’un âge à l’autre ;
Contrôle de la vraisemblance des nombres déclarés de naissances dans la période de référence. Dans certains recensements (par exemple l’Afrique du sud 1996), une proportion significative de répondantes confondent les questions sur le nombre total d’enfants déjà nés et celles sur la fécondité récente et donnent la même réponse aux deux questions. Cette erreur se manifeste par une forte diagonale dans les tableaux croisés des nombres d’enfants déjà nés par les nombres d’enfants nés dans l’année écoulée par âge de la mère (Moultrie and Timæus 2002) ;
Si les données ont été recueillies sur le sexe du dernier né, le rapport de masculinité à la naissance doit faire l’objet d’un contrôle. Le rapport de masculinité à la naissance est habituellement de l’ordre de 1,05, mais peut n’être que de 0,95 dans les populations africaines, et atteindre 1,1 dans certaines populations d’Asie. Des valeurs hors de l’intervalle 0,99-1,06 doivent être examinées soigneusement.

Dans tous les cas, il est indispensable d’identifier précisément l’univers des femmes à qui sont adressées les questions (en particulier les âges et l’état matrimonial des répondantes éligibles), ainsi que les règles d’enregistrement et de codage des non réponses et des données incorrectes.

Evaluation de la qualité des données sur la fécondité actuelle

Avant d’analyser les taux de fécondité par âge, il est recommandé d’évaluer dans quelle mesure les données sur les naissances récentes sont manquantes ou peu vraisemblables. L’absence de toute donnée manquante indique presque certainement que les données ont été corrigées. Si c’est le cas, d’autres recherches doivent porter sur l’ampleur des corrections et/ou des imputations dans la mesure du possible, par exemple, en examinant la distribution de valeurs imputées lorsque des étiquettes d’imputation ont été ajoutées aux données.

La proportion de données manquantes doit aussi être vérifiée. Si elle dépasse 5 % du nombre total des enregistrements permettant d’établir les données de fécondité actuelle, des recherches plus approfondies sont nécessaires. Il faut en particulier examiner la distribution par âge des cas manquants. Si ceux-ci sont concentrés aux jeunes âges ou chez les quadragénaires, on peut penser que les cas manquants correspondent à des femmes qui n’ont pas eu de naissance au cours de la période de référence, l’agent recenseur n’ayant pas enregistré de réponse au lieu d’indiquer zéro. C’est une erreur de même type que celle conduisant à la correction d’el Badry.

Quand les données donnent lieu à des tableaux par nombre de naissances dans la période de référence (plutôt que d’indiquer simplement si, oui ou non, une naissance a eu lieu au cours de la période de référence), on doit s’attacher aux nombres respectifs de naissances simples et multiples. En général, moins de 2 % des grossesses donnent naissance à plusieurs enfants. Les triplés et plus sont extrêmement rares (moins de 0,5 % des accouchements). Si la proportion de naissances multiples au cours de la période de référence semble trop élevée, il est recommandé d’établir des tableaux croisant le nombre total d’enfants déjà nés et les naissances au cours de l’année écoulée dans chaque groupe d’âge de femmes. Si le total d’enfants déjà nés et les naissances de l’année écoulée sont identiques dans une large proportion de cas, même pour des parités de deux ou plus, on peut penser que les personnes recensées ou les agents recenseurs n’ont pas compris la distinction entre les questions sur la descendance et sur la fécondité récente. Il se peut toutefois qu’une large proportion de jeunes femmes n’ayant qu’un enfant déjà né ait eu la naissance correspondante au cours de la période de référence, et une coïncidence fréquente entre des descendances d’un seul enfant et des déclarations d’une naissance récente par les jeunes femmes peut très bien ne pas indiquer des erreurs de déclaration.

Mesure directe de la fécondité à partir des données de recensement

Quand la qualité des données est suffisante, on peut estimer directement les taux de fécondité par âge. Quand la qualité des données est médiocre, les taux de fécondité par âge obtenus par calcul direct sont incorporés dans diverses méthodes visant à produire des estimations plus fiables du niveau de fécondité par recours à des techniques indirectes.

La forme exacte des taux de fécondité par âge qu’on peut calculer dépend de la nature des données recueillies. Un taux de fécondité par âge à un âge (ou dans un groupe d’âge) donné est le rapport du nombre de naissances des femmes de cet âge (dans ce groupe d’âge) dans une période définie au nombre de femmes-années vécues par les femmes du même âge (dans le même groupe d’âge) dans la même période. Pour que le calcul soit exact, il faut connaître de façon fiable les dates de naissance des mères (pour déterminer l’âge de la mère) et de leurs enfants. On peut alors calculer précisément l’âge de la mère à la naissance de son enfant, et allouer son exposition au risque aux âges ou groupes d’âge appropriés au long de la période couverte par la recherche.

Les données nécessaires pour ces calculs précis ne sont généralement pas disponibles dans les micro-données de recensement, soit parce que les dates complètes ne sont pas recueillies sur le terrain, soit parce qu’il y aurait un risque de violation de la confidentialité si les dates de naissance complètes étaient accessibles aux utilisateurs finaux des données. En outre, les données de recensement sont rarement de qualité suffisante pour justifier un tel surcroit de précision. L’attraction exercée par certains mois de naissance (par exemple janvier) ainsi que certaines années de naissance (par exemple celles finissant par 0 ou 5) pose fréquemment problème. Des périodes de dénombrement étendues peuvent créer des problèmes quand il s’agit de passer de la période de référence (par exemple les douze mois écoulés jusqu’à la date d’interview) à une période calendaire (par exemple 2008). En outre, les questions rétrospectives sur les naissances récentes posées dans un recensement excluent évidemment l’information relative aux naissances des mères qui sont décédées ou ont quitté le pays depuis leur accouchement.

Il y a quatre combinaisons possibles d’ informations essentielles relatives à la mère et aux naissances récentes (Tableau 1).

Tableau 1 Taxonomie des données relatives à la mère et aux enfants pour l’estimation de la fécondité récente

		Informations sur la mère
		Age révolu au recensement	Date de naissance (au moins mois, année)
Information sur les enfants nés au cours de la période précédant le recensement(*)	Nombre d’enfants nés (ou simplement, oui/non)	(1)	(2)
	Date de naissance du dernier né (au moins mois, année)	(3)	(4)

(*)En général la période précédant le recensement est de 12 mois, mais l’analyste doit être attentif à la possibilité de périodes non-standards, fondée par exemple sur le temps écoulé depuis un événement national important.

Même dans le cas (4) du tableau 1, qui repose sur les informations les plus détaillées, le souci de calculer précisément l’exposition au risque ne donne pas forcément des résultats garantis, du fait que l’attraction exercée par certains mois lors de la déclaration des dates et autres problèmes de qualité des données peuvent sévèrement altérer les estimations. Le recours à de simples approximations pour le calcul des taux de fécondité à partir des données de recensement est généralement suffisant. Dans la section sur la mesure directe de la fécondité à partir des données d’enquête [13], nous décrivons le calcul plus précis de l’exposition au risque et l’estimation des taux de fécondité à partir de données de bonne qualité.

Cas 1 et 2 : Estimation des taux de fécondité par âge directement à partir de données ne fournissant pas d’information sur la date de naissance de l’enfant

Dans les cas (1) et (2) du tableau 1, ce qui est connu sur la fécondité récente de la mère se limite au fait qu’elle a donné naissance (ou non) à au moins un enfant au cours de la période précédant le recensement. Dans des variantes plus informatives de la question sur la fécondité récente, la mère peut être interrogée sur le nombre de naissances vivantes qu’elle a eues dans la période précédant le recensement. Une telle question permet d’identifier à la fois les naissances multiples issues d’une même grossesse (jumeaux, triplés, etc.), et les cas où plus d’une grossesse arrive à son terme au cours de la période de référence.

Comme l’âge de la mère à l’accouchement n’est pas connu, l’approximation couramment utilisée consiste à classer les taux de fécondité selon l’âgé déclaré par la mère à la date du recensement. On fait alors l’hypothèse supplémentaire que les naissances ont toutes eu lieu au milieu de l’intervalle en question. Ceci signifie qu’au moment du recensement les mères sont, en moyenne, plus âgées de la moitié de la durée de l’intervalle. Il en résulte que les âges auxquels les taux de fécondité se réfèrent réellement sont plus jeunes que les âges des femmes déclarés au recensement. La plupart des méthodes standards d’estimation indirecte de la fécondité corrigent les âges de ce décalage.

L’information supplémentaire (sur le mois et l’année de naissance de la mère) dont on dispose dans le deuxième cas ne permet guère d’affiner les estimations de la fécondité car on continue d’avoir besoin d’hypothèses supplémentaires d’uniformité de la distribution des dates de naissance des enfants. Donc, dans le cas (2) comme dans le cas (1) du tableau 1, les taux de fécondité sont estimés en divisant le nombre de naissances déclarées au cours de la période de référence (classées par âge de la mère à la date du recensement) par le nombre de femmes de cet âge. Le nombre total de naissances au cours de la période de référence déclaré par les femmes âgées x à la date du recensement, B_x, est donné par

$B_{x} = \sum_{k = 0}^{ω} k . N_{x, k}^{}$

où k est le nombre déclaré de naissances au cours de la période de référence, ω est la valeur maximale de k dans les données et N_x_,k est le nombre de femmes âgées de x au recensement déclarant avoir eu k naissances au cours de la dernière année. Si ω est exprimé comme un intervalle ouvert, par exemple 3 naissances ou plus au cours de la période de référence, les femmes dans cette catégorie sont supposées avoir eu le nombre de naissances qui ouvre cet intervalle (soit 3 naissances ici). L’erreur qui en résulte est de nouveau faible.

Le nombre de femmes âgées de x est donné par

$N_{x}^{} = \sum_{k = 0}^{ω} N_{x, k}^{}$

Les femmes dont les naissances récentes ne sont pas connues ou n’ont pas été déclarées doivent être exclues à la fois du numérateur et du dénominateur, avec l’hypothèse implicite que leur fécondité ne diffère pas de celle des femmes dont la fécondité récente est connue. Les taux de fécondité par âge x sont égaux à

$f_{x} = B_{x} / N_{x}^{}$

Dans l’intervalle d’âge conventionnel (de 15 ans à 49 ans, inclus), l’indice synthétique de fécondité (TF) calculé à partir des taux par année d’âge est égal à

$T F = \sum_{a = 15}^{49} f_{a}$

L’indice synthétique de fécondité désigne le nombre d’enfants qu’une femme aurait si elle survivait jusqu’à 50 ans (considéré comme la fin de la période féconde) en ayant, au long de sa vie reproductive, les taux de fécondité par âge observés au cours de la période précédant immédiatement le recensement.

Il convient de calculer et de représenter graphiquement les taux de fécondité par année d’âge afin de vérifier la cohérence interne des données. Les taux de fécondité par âge sont en général moins erratiques que les numérateurs ou les dénominateurs eux-mêmes et ils peuvent indiquer des niveaux et des distributions vraisemblables de la fécondité. Une série de taux par âge fortement erratique, s’écartant fortement de la forme prévisible en n, laisse fortement supposer que les données de fécondité récente posent problème et invite à pousser les recherches plus avant.

Enfin on peut calculer des taux de fécondité par groupes d’âges quinquennaux, ₅f_x, où x = 15, 20,…, 45 :

$f_{i} = {}_{5}f_{x} = \frac{\sum_{x = 5 i + 10}^{5 i + 14} B_{x}}{\sum_{x = 5 i + 10}^{5 i + 14} N_{x}^{}}$

où l’indice i est égal à i=(x/5) - 2. La mesure de l’indice synthétique de fécondité est donc

$T F =5. \sum_{i = 1}^{7} f_{i}$

Alors que l’indice synthétique est une mesure de la fécondité standardisée par l’âge (la distribution par âge de la population féminine d’âge fécond étant supposée implicitement uniforme par groupe d’âge), le taux de fécondité de chaque groupe d’âge n’est pas standardisé au sein du groupe. Il peut en résulter un léger écart entre les indices synthétiques résultant respectivement d’un calcul par groupe d’âge et par année d’âge, mais cet écart ne porte généralement que sur la deuxième ou la troisième décimale.

L’indice synthétique de fécondité doit être comparé aux estimations tirées d’autres sources de données pour le même pays (par exemple des EDS). Il faut toutefois se souvenir que les taux de fécondité par âge et les indices synthétiques obtenus par cette méthode ne prennent pas en compte la vraie exposition au risque dans la détermination du dénominateur. En outre, le numérateur inclut des événements ayant eu lieu pendant la période de référence classés selon l’âge de la mère à la fin de celle-ci, et non par son âge au moment où l’événement a eu lieu. La plupart des méthodes d’estimation indirecte de la fécondité corrigent les taux de fécondité calculés pour tenir compte de ce décalage. Dans des comparaisons de base visant à évaluer les forme et le niveau des distributions de fécondité), les différences dans les classements par âge ont peu d’importance. La variante F-seulement du modèle relationnel de Gompertz offre toutefois une méthode pour ne pas décaler les taux de fécondité lors de leur lissage, si on le souhaite.

Exemple : Calcul direct de la fécondité

Au recensement de 2008 au Cambodge, les femmes ont été interrogées sur le nombre d’enfants qu’elles ont eu l’année précédente. L’âge des mères est l’âge à la date du recensement. Les données figurent au tableau 2.

Tableau 2 Fécondité récente par âge de la mère à la date du recensement, Cambodge, recensement de 2008.

	Naissances au cours de l’année précédente
Age	0	1	2	3	4	Manquant	Naissances	Femmes	Taux*
15	160 980	120	0	0	0	80	120	161 180	0,0007
16	152 710	500	0	0	0	50	500	153 260	0,0033
17	144 970	1 250	10	10	0	20	1 300	146 260	0,0089
18	182 500	3 540	20	0	0	40	3 580	186 100	0,0192
19	127 840	5 640	10	0	0	30	5 660	133 520	0,0424
20	147 990	8 840	80	0	0	90	9 000	157 000	0,0574
21	123 960	9 500	30	0	0	70	9 560	133 560	0,0716
22	126 030	11 600	80	0	0	30	11 760	137 740	0,0854
23	123 750	11 830	70	10	0	110	12 000	135 770	0,0885
24	121 820	11 010	150	10	20	80	11 420	133 090	0,0859
25	137 460	12 420	100	0	0	60	12 620	150 040	0,0841
26	115 370	11 320	110	0	0	80	11 540	126 880	0,0910
27	117 840	11 580	190	0	0	40	11 960	129 650	0,0923
28	118 270	10 690	110	0	10	30	10 950	129 110	0,0848
29	82 990	7 600	120	0	0	40	7 840	90 750	0,0864
30	77 690	5 950	40	10	0	30	6 060	83 720	0,0724
31	58 800	4 820	50	20	0	30	4 980	63 720	0,0782
32	67 110	4 480	150	20	0	110	4 840	71 870	0,0674
33	67 080	4 240	40	0	0	50	4 320	71 410	0,0605
34	67 010	3 800	30	10	10	70	3 930	70 930	0,0555
35	90 720	4 570	60	20	0	30	4 750	95 400	0,0498
36	77 950	3 800	10	10	0	30	3 850	81 800	0,0471
37	81 320	4 070	50	10	10	10	4 240	85 470	0,0496
38	92 290	3 780	30	20	30	30	4 020	96 180	0,0418
39	74 030	2 920	50	0	0	30	3 020	77 030	0,0392
40	88 940	2 720	70	10	10	50	2 930	91 800	0,0319
41	71 250	2 140	0	0	0	20	2 140	73 410	0,0292
42	81 560	2 010	30	0	0	60	2 070	83 660	0,0248
43	72 930	1 270	10	0	0	30	1 290	74 240	0,0174
44	69 660	930	10	0	0	50	950	70 650	0,0135
45	84 290	760	30	10	10	30	890	85 130	0,0105
46	67 330	510	0	50	30	40	780	67 960	0,0115
47	66 220	270	10	0	10	0	330	66 510	0,0050
48	74 790	310	10	10	0	30	360	75 150	0,0048
49	57 600	120	0	20	10	20	220	57 770	0,0038
TOTAL	3 473 050	170 910	1 760	250	150	1 600	175 780	3 647 720	1,6157
* Taux de fécondité par âge

La colonne « Manquant » indique que seulement 1 600 femmes sur près de 3,65 millions âgées entre 15 et 49 ans n’ont pas eu leur fécondité récente enregistrée. Ceci représente 0,04 % de l’ensemble des femmes et n’aura pas d’impact sur la fécondité estimée des femmes au Cambodge. Un contrôle supplémentaire portant sur la distribution par âge de ces cas ne fait pas apparaître de schéma particulier d’omission. Le nombre de naissances est égal à la somme pondérée des femmes déclarant 1, 2, 3 ou 4 accouchements, sur la dernière ligne. 173 070 femmes (170 910 + 1 760 + 250 + 150) ont eu un total de 175 780 naissances (1x170 910 + 2×1 760 + 3×250 + 4×150) au cours de l’année précédant le recensement. Parmi ces femmes, 98,8 % (170 910 / 173 070) ont eu une seule naissance, 1,0 % ont eu des jumeaux et 0,2 % des triplés ou plus. L’éventualité de quintuplés (ou de cinq naissances en deux accouchements au cours de la période) est si faible qu’elle peut être ignorée. Si le recensement n’avait pas comptabilisé les naissances multiples séparément, le taux brut de natalité aurait été sous-estimé par un facteur de 173 070/175 780 = 0,984. La sous-estimation est donc de 1,6 %.

A partir des données ci-dessus, la série des taux de fécondité par année d’âge est obtenue en divisant le nombre total de naissances issues des femmes de chaque âge par le nombre de femmes ayant déclaré leur fécondité récente, c’est-à-dire en excluant les femmes qui n’ont pas déclaré combien de naissances elles ont eu au cours de l’année passée. Les taux sont représentés sur la figure 1. Alors que le nombre de femmes dénombrées à chaque âge est erratique, les taux de fécondité par année d’âge sont relativement lisses, avec un schéma de fécondité clairement défini et un pic caractéristique aux environs de 25 ans.

Figure 1 Age-specific fertility rates, Cambodia 2008 census

Selon ces données, l’indice synthétique de fécondité est de 1,61 enfants par femme. Le calcul conduit par groupes d’âges quinquennaux donne le même résultat (tableau 3), même si les mesures diffèrent à la troisième décimale, comme on l’a évoqué plus haut.

Tableau 3 Taux de fécondité par groupes d’âge quinquennaux, Cambodge, recensement de 2008 et Enquêtes Démographiques et de Santé 2005 et 2010

Groupe d’âge	Femmes	Manquant	Naissances	Taux	EDS2005	EDS2010
15-19	780 320	220	11 160	0,014	0,047	0,046
20-24	697 160	380	53 740	0,077	0,175	0,173
25-29	626 430	250	54 910	0,088	0,180	0,167
30-34	361 650	290	24 130	0,067	0,142	0,121
35-39	435 880	130	19 880	0,046	0,091	0,071
40-44	393 760	210	9 380	0,024	0,041	0,028
45-49	352 520	120	2 580	0,007	0,005	0,004
TF				1,61	3,41	3,05
Source: Recensement, nos calculs ; EDS, StatCompiler (www.statcompiler.com)

Même en l’absence de contrôle externe, les résultats tirés des données du recensement de 2008 font apparaître des niveaux de fécondité invraisemblablement bas au Cambodge. Les données sont également incohérentes avec les parités moyennes calculées plus haut à la section sur l’évaluation de la qualité des données sur les descendances. Ceci suggère que les données sur la fécondité récente recueillies dans ce recensement sont fortement déficientes. Des contrôles externes le confirment, sous forme d’estimations de fécondité tirées de deux EDS réalisées avant et après le recensement. Selon les données des deux dernières colonnes du tableau 3, l’indice synthétique de fécondité estimé à partir de l’EDS 2010 (fondé sur les naissances des trois ans précédant l’enquête) est de 3,1 enfants par femme. L’estimation à partir de l’EDS de 2005 était de 3,4 enfants par femme. Seulement la moitié environ des naissances survenues dans l’année précédant le recensement ont été déclarées aux agents recenseurs.

Le graphique de gauche sur la figure 2 représente les taux de fécondité par âge calculés à partir du recensement de 2008 et des deux EDS. Les taux tirés du recensement diffèrent clairement de ceux tirés des EDS. Ces derniers, de leur côté, présentent un schéma plutôt étrange d’évolution de la fécondité en cinq ans, marquée par des réductions à peu près constante entre 25 et 44 ans. Le graphique de droite de la figure 2 représente les même taux mais ramenés à un même indice synthétique de fécondité de un enfant par femme. Malgré des différences fortes dans le niveau global de la fécondité, la forme des trois distributions par âge est très semblable, la seule réelle différence entre elles étant à 20-24 ans. C’est pourquoi il semble peu vraisemblable qu’il y ait d’importantes différences dans la qualité de la déclaration de la fécondité récente selon l’âge des femmes dans le recensement de 2008 au Cambodge.

Même si le niveau de la fécondité tiré des données du recensement de 2008 est sérieusement biaisé, la forme de la distribution par âge de la fécondité est raisonnablement précise. Ceci est une condition préalable à l’application de nombreuses méthodes indirectes d’estimation de la fécondité.

Figure 2 Age-specific fertility rates, and standardized age-specific fertility rates, Cambodia 2008 census, 2005 DHS and 2010 DHS

Cas 3 et 4 : Estimation des taux de fécondité par âge quand la date de naissance de l’enfant est connue

Si les données sont classées par date de naissance du dernier né des femmes, il convient de choisir une période appropriée pour les analyses sur la fécondité. En général, il est conseillé de ne pas prendre des périodes beaucoup plus longues qu’un an car des périodes plus longues accroissent la probabilité que les femmes aient eu plus d’une grossesse au cours de cette période. Les naissances ayant eu lieu plus anciennement sont donc omises (la condition requise étant de déclarer la date de naissance du dernier né, pas de tous les enfants nés au cours de la période), ce qui signifie que les estimations de la fécondité excluront systématiquement des naissances dans le passé le plus ancien. En outre, si la fécondité a évolué rapidement, allonger la période de recherche au-delà d’un an signifie que les estimations représenteront une sorte de moyenne de la fécondité au long de la période. Si le recensement a eu lieu assez tôt ou assez tard dans l’année, il peut être intéressant de calculer les taux sur les naissances depuis le début de l’année précédente ou de l’année courante car ce choix ne nécessite pas que les femmes se souviennent précisément du mois de naissance de leur enfant. Le nombre de naissances déclaré au cours de la période de référence peut alors être ramené à une estimation des naissances annuelles par un calcul au prorata. On peut calculer les taux à la fois de cette façon et en s’appuyant sur une période de référence de 12 mois puis comparer les résultats.

Le scénario (3) au tableau 1 ne permet pas d’obtenir une mesure tout à fait précise de la fécondité puisque l’âge de la mère à la naissance de l’enfant ne peut pas être établi précisément. La connaissance de la date de naissance de l’enfant permet bien, toutefois, de déterminer plus soigneusement le dénominateur des taux de fécondité par âge.

Dans la situation courante où la question posée porte sur le mois et l’année de naissance du dernier enfant, une démarche plus soigneuse peut permettre de déterminer le nombre de naissances au cours de l’année passée. En général la date du recensement est fixée conventionnellement. Les questions dans le questionnaire de recensement se réfèrent généralement à un jour particulier, même si le processus effectif de dénombrement prend plusieurs semaines. Une liste des dates de recensement pour les trois dernières vagues de recensement a été établie par les Nations Unies : https://unstats.un.org/unsd/demographic-social/census/censusdates ; une liste des dates de recensement pour les données diffusées par IPUMS est disponible à https://international.ipums.org/international-action/sample_details.

Lors de la détermination du numérateur, toutes les naissances déclarées dans le mois du recensement, et une proportion au prorata des naissances déclarées s’être produites le mois équivalent un an plus tôt doivent être incluses. Pour tirer cette information des données de recensement, en fonction de la capacité de traitement des dates des logiciels statistiques utilisés, on peut recourir à la procédure de numérotation des mois à partir du début du siècle des EDS.

Tableau 4 Naissances déclarées chaque mois par âge de la mère à la date de recensement (24-25 août 1999), Kenya, recensement de 1999

	Age de la mère au recensement
Mois	15-19	20-24	25-29	30-34	35-39	40-44	45-49
Août 1998	13 240	31,300	23,120	13,940	8,940	3,220	560
Septembre 1998	9 800	22,900	17,260	9,560	6,180	2,080	680
Octobre 1998	9 240	21,580	15,520	9,600	5,880	1,880	500
Novembre 1998	9 040	21,940	16,060	9,880	5,280	1,660	540
Décembre 1998	10 200	23,700	18,000	10,580	5,940	2,080	480
Janvier1999	14 720	28,620	20,620	12,260	7,300	2,180	660
Février 1999	20 740	42,140	30,860	17,400	11,220	4,560	2,060
Mars 1999	15 620	31,480	21,320	12,520	7,340	2,820	520
Avril 1999	18 660	33,160	24,260	12,240	7,820	2,860	720
Mai 1999	19 660	33,880	22,860	13,960	7,440	2,480	760
Juin 1999	20 100	32,140	23,380	12,580	7,300	2,720	560
Juillet 1999	21 600	32,360	23,860	13,800	7,060	2,640	520
Août 1999	15 900	25,020	16,720	9,280	5,840	1,620	360
Naissances estimées l’année passée	188 269,68	355 987,74	255 940,65	146 807,74	86 618,71	30 307,10	8 486,45
Nombre de femmes	1 700 060	1 495 180	1 205 060	849 620	725 780	519 740	417 500
Taux de fécondité par âge	0,1107	0,2381	0,2124	0,1728	0,1193	0,0583	0,0203

Lors du recensement de 1999 au Kenya, la date de référence officielle était la nuit du 24 au 25 août 1999. Pour estimer les naissances survenues dans l’année précédant le recensement, toutes les naissances déclarées entre septembre 1998 et août 1999 doivent être incluses, ainsi que 1-24/31 (=7/31) des naissances déclarées en août 1998. Ceci suppose que les naissances sont uniformément réparties au long du mois (Tableau 4). Par exemple, le nombre estimé de naissances au cours de l’année précédant le recensement dans le groupe 30-34 ans est donné par

$\frac{7}{31} (13 940) + 9 560 + 9 600 + ... + 9 280 = 146 807,74$

En l’absence d’information supplémentaire sur la date de naissance de la mère, les données ci-dessus sont classées selon le groupe d’âge de la mère à la date du recensement. Comme on l’a dit précédemment, les taux ainsi calculés doivent faire l’objet d’un décalage d’une demi-année.

Les taux de fécondité par âge sont obtenus en divisant ces naissances par le nombre de femmes dans chaque groupe d’âge. Les estimations de l’indice synthétique de fécondité qui en résultent sont sensiblement éloignées des autres estimations de la fécondité dans le pays vers cette époque. Comme au Cambodge, ceci donne à penser que les naissances au cours de l’année précédant le recensement sont fortement sous-déclarées.

On ne peut prendre une mesure précise de la fécondité que dans le cas (4), quand on dispose d’une information détaillée sur la date de naissance aussi bien de la mère que de l’enfant. Mais si certaines dates de naissance (par exemple le 1^er janvier) exercent une forte attraction, le recours à des mesures affinées ne sert à rien car elles seront biaisées par l’attraction. Comme il y a peu de chances que la qualité et la cohérence interne des données recueillies lors d’un recensement soient aussi bonnes que dans une EDS, il est inutile d’appliquer le même calcul précis que celui qu’on utilise dans une EDS. Il y a toutefois des situations où l’attraction lors de la déclaration des dates de naissance et les autres erreurs dans les données jouent un rôle suffisamment limité pour qu’il vaille la peine de faire un calcul direct des estimations de fécondité. Dans ces cas, on doit appliquer les principes décrits pour le calcul des estimations de la fécondité récente à partir des données d’enquête [13].

Références

Moultrie, Tom A. and Ian M. Timæus. 2002. Trends in South African Fertility between 1970 and 1998: An Analysis of the 1996 Census and the 1998 Demographic and Health Survey. Cape Town: Medical Research Council. https://www.mrc.ac.za/sites/default/files/attachments/2022-08/trends.pdf. Access: 17 Octobre 2024.

For example, in the Kenya 1999 census, the official census date was the night of 24-25 August 1999. To estimate the births that occurred in the year preceding the census, all births reported between September 1998 and August 1999 would be included, along with 1-24/31 (=7/31) of the births reported in August 1998, on the assumption that births are uniformly distributed over the days of a month.

Note that, in the absence of further information about the mother’s date of birth, the data above is still tabulated according to the mother’s age at the census date, and the rates so derived would still be subject to a half-year shift, as with the other methods described above.

Author

Moultrie TA

Printer-friendly version
Log in to post comments

Suggested citation

Moultrie TA. 2014. Evaluation de la qualité des données sur la fécondité récente tirées des recensements. In Moultrie TA, Dorrington RE, Hill AG, Hill K, Timæus IM and Zaba B (eds). Tools for Demographic Estimation. Paris: International Union for the Scientific Study of Population. https://demographicestimation.iussp.org/fr/content/evaluation-de-la-qualite-des-donnees-sur-la-fecondite-recente-tirees-des-recensements. Accessed 2025-08-12.