SDG Metadata/3-3-4 — French @ Hosted Weblate: The data was modelled using a Bayesian logistic regression looking …

Translation

Key DATA_COMP

English

The data was modelled using a Bayesian logistic regression looking at the proportion of individuals that tested positive for HBsAg in each study, weighting each study by its size and using a conditional autoregressive (CAR) model accounting for spatial and economic correlations between similar countries. This model uses data from well sampled countries to estimate prevalence in more data poor countries with effects such as sex, age and vaccination status, these are also informed by the geographic and countries GDP proximity to other countries (CAR model). Under the assumption that countries that are close together economically and/or geographically will have more similar prevalence due to similar social structure and health care capabilities. 
The response variable in the model was the prevalence of Hepatitis surface antigen (HBsAg) with the explanatory variables being age (three categories, under 5, juvenile (5-15) and adult (16+), split using the average age of participants in the study), sex (proportion female in the study), study bias (e.g. a high fraction of study participants from indigenous populations), 3 dose vaccine coverage, birth dose of the vaccine and country of study. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The WHO-UNICEF estimates are annual data for the country as a whole, and did not contain information on vaccine efficacy which was not used in the analysis as no data on this was obtained. The vaccine efficacy would be implicitly estimated in the analysis as we see vaccination having a variable effect across time and space across the studies. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. More explicitly, the model uses the ages and timing of the study to calculate the years across which the participants are born, so if the if there was an age group range of 10-15 in a study that was undertaken in 2015, the birth years would be from 2000-2005, we then average the vaccination coverage from the WHO-UNICEF estimates across those 5 years assuming that each age was evenly represented in that age group in the study. The same process was used for the 3 dose and birth dose vaccination. 
 
The general logistic model equation is described below, 
Yi ~Binomial (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui 
 
Where βj are the fixed effects of the explanatory variables xii. With the spatial random effects described by 
ui~ N(u−i,σ2u/ni)
 , 
where, 
u−i= ∑j ∈ neigh(i)wiuj/ni
Where ni is the number of neighbours for country i and weights wi, are 1. 
 
The model was simulated in the Bayesian statistical package WinBUGS, and data manipulation and model initialisation run from R (3.3.1) using R2WinBUGS. The model considers the parameters of age, sex, study bias (e.g. a high fraction of study participants from indigenous populations), vaccine coverage, birth dose of the vaccine and country of study. 
The model uses the CAR-normal function, in WinBUGS, to model the spatial and economic autocorrelation related to neighbouring countries. For each country that had prevalence data, a weighted central position was calculated using the size and location of each study. For those countries with no data, we used the population centroid. In a novel approach, we considered 3 dimensions in the country adjacency matrix; we used the usual geographic dimensions, latitude and longitude and also combined these with the natural log of the country’s GDP per capita. This was to measure not only geographic but also the developmental proximity of countries. The adjacency matrix for the geo-economic distance gives a score between each country to every other country. Those countries which are close geographically and economically would have a low score and those further apart either geographically or economically would have a high score/distance. Therefore, those countries that are more alike will have a low score and those countries which are alike would have a high score. 
The way we proportioned the geographic and economic distance to produce the adjacency matrix was then explored, this is because geographic distance may be more or less important than economic similarities. Thus, by creating a number of different adjacency matrices (not definitive) we could select the most suitable matrix that explains reality best. We normalised the geographic and GDP distance and then calculated the distance between these two normalised figures. This creates a smoothed Gaussian surface that is dependent on both spatial proximity and GDP per-capita proximity. We compared ratios of, 1:0, 1:1, 2:1, 1:2 (Geographic:GDP). 
For each different adjacency matrix, we also had to select a neighbourhood distance, i.e. over what distance can a country be effected by another. Thus, we also varied the radius of distance from which to select neighbours for the neighbourhood network, we used the maximum minimum distance, twice the maximum minimum and three times the maximum minimum, thus varying the number of neighbours each country would have. 
 
Finally, to decide the magnitude of the effect one country has on another in the neighbourhood network we varied the weights of pairs of countries in the adjacency matrix, using either a neutral weighting of 1, so that each neighbour has an equal effect on each other (not dependent on the distance in the network), or decaying weights over distance with 1/distance, and 1/distance2, where the closer the country is the greater the effect it has on another country. The outcome of these 36 different combinations led to minimum DIC (Deviance Information Criterion) being found for a ratio of 1:2 (Geographic:GDP), the neighbourhood networks minimum distance being twice the maximum minimum distance and an even weighting of 1/distance for each adjacent country. 
This model structure produces estimates for all fixed effects and also individual country level risk, this provides information on which are significantly at greater or lower risk to the average risk. 
All parameters were given un-informative priors. Simulations were run with 3 MCMC chains with 50,000 burn in iterations and each parameter estimated from 1000 samples taken from a thinned 250,000 iterations to produce the posterior distribution. Convergence was attained, with r̂ values all very close to 1.000. Due to the Bayesian framework and WinBUGS software it was possible to gain estimates for countries where we had no data on prevalence, using their GDP and geographic proximity to inform this estimate. Those countries with the largest number of studies provided the estimates with the tightest confidence intervals and those with few or no data were less well defined, often producing a log normal distributed posterior distribution, giving estimates with long tails. 
Posterior distributions of parameters were inspected for convergence and to check for covariance between parameters. Where necessary parameters were centred and scaled to N (0, 1) to aid parameter convergence and remover covariance. This was done for the sex parameter, which was entered as the proportion of the sample that was female; this was seen to co-vary with the intercept and bias parameters before re-centring and scaling. However, the covariance of routine vaccination and birth dose persisted even after re-centring. This is in part unsurprising as there a few instances where birth dose is administered without the routine vaccination. Here we tried to reduce this interaction of the terms by transforming the birth dose data. We modelled birth dose using only data where the birth dose was greater than 60, 70, 80 & 90% respectively, we also modelled birth dose to the square, thus increasing the effect of high birth doses over smaller doses. Model selection dependent on which one both reduced the covariance between the parameters and returned the lowest DIC score. 
Model validation was conducted using 90% of randomly selected data against the remaining 10%, and by comparing model estimates of prevalence against observed data (Figure 3). Figure 4 shows the average prevalence in each country from all the studies plotted against the models estimate. Figure 5 shows the marginal and joint posterior distributions for the fitted parameters. Table 1 gives the estimated parameter values with associated credible intervals. 
During the validation exercise (in which countries were consulted over their estimates) it was pointed out that China had undertaken three very large-scale population-based serological surveys in order to establish baseline prevalence and progress towards HBV elimination. There were a large number of other surveys from China, that are less representative than these three nationwide surveys. We conducted a sensitivity analysis by restricting the data from China to the three nationally representative surveys. The effect of this change in input data was that the effect of vaccination was more distinct, but the estimated age effects (change in prevalence in children under 5, or juveniles (children 5-15 years)) were no longer significantly different from zero (see Table 2 and Figure 6). The deviance was significantly reduced, suggesting a much better fitting model (Table 2), albeit on a somewhat reduced dataset.

French

Les données ont été modélisées à l'aide d'une régression logistique bayésienne examinant la proportion d'individus testés positifs pour l'AgHBs dans chaque étude, en pondérant chaque étude par sa taille et en utilisant un modèle autorégressif conditionnel (CAR) tenant compte des corrélations spatiales et économiques entre pays similaires. Ce modèle utilise les données des pays bien échantillonnés pour estimer la prévalence dans les pays plus pauvres en données avec des effets tels que le sexe, l'âge et le statut vaccinal, ceux-ci sont également informés par la proximité géographique et le PIB des pays avec d'autres pays (modèle CAR). Selon l'hypothèse que les pays proches économiquement et/ou géographiquement auront une prévalence plus similaire en raison d'une structure sociale et de capacités de soins de santé similaires. 
La variable réponse du modèle était la prévalence de l'antigène de surface de l'hépatite (AgHBs), les variables explicatives étant l'âge (trois catégories, moins de 5 ans, mineur (5-15 ans) et adulte (16 ans ou plus), réparties en utilisant l'âge moyen des participants à l'étude), le sexe (proportion de femmes dans l'étude), le biais de l'étude (p. ex., une fraction élevée de participants à l'étude provenant de populations indigènes), la couverture vaccinale à 3 doses, la dose de vaccin à la naissance et le pays de l'étude. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations de couverture vaccinale correspondantes de l'OMS-UNICEF pour ce pays. Les estimations de l'OMS-UNICEF sont des données annuelles pour l'ensemble du pays et ne contiennent pas d'informations sur l'efficacité du vaccin, celle-ci n'a pas été utilisée dans l'analyse car aucune donnée à ce sujet n'a été obtenue. L'efficacité du vaccin serait implicitement estimée dans l'analyse car nous constatons que la vaccination a un effet variable dans le temps et l'espace dans les études. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations correspondantes de la couverture vaccinale de l'OMS-UNICEF pour ce pays. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations de couverture vaccinale de l'OMS-UNICEF correspondantes pour ce pays. Plus précisément, le modèle utilise les âges et le moment de l'étude pour calculer les années de naissance des participants. Ainsi, si une étude menée en 2015 portait sur une tranche d'âge de 10 à 15 ans, les années de naissance s'étendraient de 2000 à 2005, nous avons ensuite calculé la moyenne de la couverture vaccinale à partir des estimations de l'OMS-UNICEF sur ces 5 années en supposant que chaque âge était représenté de manière égale dans cette tranche d'âge dans l'étude. Le même processus a été utilisé pour la vaccination à 3 doses et la vaccination à la naissance. 
 
L'équation du modèle logistique général est décrite ci-dessous, 
Yi ~Binôme (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui 
 
où βj sont les effets fixes des variables explicatives xii. Avec les effets aléatoires spatiaux décrits par 
ui~ N(u−i,σ2u/ni)
où 
u−i= ∑j ∈ neigh(i)wiuj/ni
où ni est le nombre de voisins pour le pays i et les poids wi, valent 1. 
 
Le modèle a été simulé dans le module statistique bayésien WinBUGS, et la manipulation des données et l'initialisation du modèle exécutées à partir de R (3.3.1) en utilisant R2WinBUGS. Le modèle prend en compte les paramètres de l'âge, du sexe, du biais de l'étude (p. ex., une fraction élevée de participants à l'étude provenant de populations indigènes), de la couverture vaccinale, de la dose du vaccin à la naissance et du pays de l'étude. 
Le modèle utilise la fonction CAR-normale, dans WinBUGS, pour modéliser l'autocorrélation géographique et économique liée aux pays voisins. Pour chaque pays disposant de données de prévalence, une position centrale pondérée a été calculée en utilisant la taille et la localisation de chaque étude. Pour les pays ne disposant pas de données, nous avons utilisé le centroïde de la population. Dans une approche novatrice, nous avons considéré 3 dimensions dans la matrice d'adjacence des pays; nous avons utilisé les dimensions géographiques habituelles, la latitude et la longitude, et nous les avons également combinées avec le log naturel du PIB par habitant du pays, ceci afin de mesurer non seulement la proximité géographique mais aussi la proximité de développement des pays. La matrice d'adjacence pour la distance géo-économique donne un score entre chaque pays et tous les autres pays. Les pays qui sont proches géographiquement et économiquement ont un score faible et ceux qui sont plus éloignés géographiquement ou économiquement ont un score/distance élevé. Par conséquent, les pays qui se ressemblent le plus auront un score faible et les pays qui sont moins semblables auront un score élevé. 
On a ensuite exploré la façon dont nous avons proportionné la distance géographique et économique pour produire la matrice d'adjacence, ceci parce que la distance géographique peut être plus ou moins importante que les similitudes économiques. Ainsi, en créant un certain nombre de matrices d'adjacence différentes (non définitives), nous avons pu sélectionner la matrice la plus adaptée qui explique le mieux la réalité. Nous avons normalisé la distance géographique et la distance du PIB, puis nous avons calculé la distance entre ces deux chiffres normalisés. Cela crée une surface gaussienne lissée qui dépend à la fois de la proximité spatiale et de la proximité du PIB par habitant. Nous avons comparé des ratios de, 1:0, 1:1, 2:1, 1:2 (Géographie:PIB). 
Pour chaque matrice d'adjacence différente, nous avons également dû choisir une distance de voisinage, c.-à-d. sur quelle distance un pays peut être affecté par un autre. Ainsi, nous avons également fait varier le rayon de distance à partir duquel sélectionner les voisins pour le réseau de voisinage, nous avons utilisé la distance minimale maximale, deux fois le minimum maximal et trois fois le minimum maximal, faisant ainsi varier le nombre de voisins que chaque pays aurait. 
 
Enfin, pour décider de l'ampleur de l'effet d'un pays sur un autre dans le réseau de voisinage, nous avons fait varier les poids des paires de pays dans la matrice d'adjacence, en utilisant soit une pondération neutre de 1, de sorte que chaque voisin a un effet égal sur les autres (ne dépendant pas de la distance dans le réseau), soit des poids décroissants sur la distance avec 1/distance, et 1/distance2, où plus le pays est proche, plus son effet sur un autre pays est important. Le résultat de ces 36 combinaisons différentes a conduit à trouver un DIC (Deviance Information Criterion) minimal pour un rapport de 1:2 (Géographie:PIB), la distance minimale des réseaux de voisinage étant deux fois la distance minimale maximale et une pondération égale de 1/distance pour chaque pays adjacent. 
Cette structure de modèle produit des estimations pour tous les effets fixes et aussi pour le risque individuel au niveau du pays, cela fournit des informations sur ceux qui sont significativement plus à risque ou moins à risque par rapport au risque moyen. 
Tous les paramètres étaient a priori non informatifs. Les simulations ont été effectuées avec 3 chaînes MCMC avec 50 000 essais par itération et chaque paramètre estimé à partir de 1 000 échantillons prélevés sur un nombre réduit de 250 000 itérations pour produire la distribution postérieure. La convergence a été atteinte, avec des valeurs r̂ toutes très proches de 1,000. Grâce au cadre bayésien et au logiciel WinBUGS, il a été possible d'obtenir des estimations pour les pays pour lesquels nous n'avions pas de données sur la prévalence, en utilisant leur PIB et leur proximité géographique pour informer cette estimation. Les pays avec le plus grand nombre d'études ont fourni les estimations avec les intervalles de confiance les plus serrés et ceux avec peu ou pas de données étaient moins bien définis, produisant souvent une distribution postérieure log normale, donnant des estimations avec de longues queues. 
Les distributions postérieures des paramètres ont été inspectées pour vérifier la convergence et pour vérifier la covariance entre les paramètres. Si nécessaire, les paramètres ont été centrés et mis à l'échelle d'une loi N (0, 1) pour faciliter la convergence des paramètres et supprimer la covariance. C'est ce qui a été fait pour le paramètre de sexe, qui a été saisi comme la proportion de l'échantillon qui était féminine; on a constaté qu'il covarie avec les paramètres d'interception et de biais avant le recentrage et la mise à l'échelle. Cependant, la covariance de la vaccination systématique et de la dose à la naissance est restée même après recentrage. Ceci n'est en partie pas surprenant car il existe quelques cas où la dose à la naissance est administrée sans la vaccination systématique. Nous avons essayé de réduire cette interaction des termes en transformant les données sur la dose à la naissance. Nous avons modélisé celle-ci en utilisant uniquement les données où la dose à la naissance était supérieure à 60, 70, 80 et 90% respectivement, nous avons également modélisé la dose à la naissance au carré, augmentant ainsi l'effet des doses à la naissance élevées par rapport aux doses plus petites. La sélection du modèle dépendait de celui qui à la fois réduisait la covariance entre les paramètres et retournait le score DIC le plus bas. 
La validation du modèle a été effectuée en utilisant 90% des données sélectionnées au hasard contre les 10% restants, et en comparant les estimations de prévalence du modèle aux données observées (figure 3). La figure 4 montre la prévalence moyenne dans chaque pays à partir de toutes les études tracées contre l'estimation du modèle. La figure 5 montre les distributions marginales et conjointes postérieures des paramètres ajustés. Le tableau 1 donne les valeurs estimées des paramètres avec les intervalles de confiance associés. 
Lors de l'exercice de validation (au cours duquel les pays ont été consultés au sujet de leurs estimations), il a été souligné que la Chine avait entrepris trois enquêtes sérologiques en population de très grande envergure afin d'établir la prévalence de base et les progrès vers l'élimination du VHB. Il y avait un grand nombre d'autres enquêtes en Chine, qui sont moins représentatives que ces trois enquêtes nationales. Nous avons effectué une analyse de sensibilité en limitant les données de la Chine aux trois enquêtes représentatives au niveau national. Cette modification des données d'entrée a eu pour effet de rendre plus net l'effet de la vaccination, mais les effets estimés sur l'âge (changement de la prévalence chez les enfants de moins de 5 ans ou les jeunes (enfants de 5 à 15 ans)) n'étaient plus significativement différents de zéro (voir tableau 2 et figure 6). La déviance était significativement réduite, ce qui suggère un modèle beaucoup mieux ajusté (tableau 2), bien que sur un ensemble de données quelque peu réduit.

Needs editing

Skip

Key	English	French
REL_CAL_POLICY	<p>Second quarter of each year</p>	<p>Deuxième trimestre de chaque année</p>
DATA_SOURCE	<p>World Health Organization </p>	<p>Organisation mondiale de la Santé </p>
COMPILING_ORG	<p>World Health Organization </p>	<p>Organisation mondiale de la Santé </p>
RATIONALE	<p>The purpose is to describe the reduction in chronic hepatitis b infections. Most of the burden of disease from HBV infection comes from infections acquired before the age of 5 years. Therefore, prevention of HBV infection focuses on children under 5 years of age. The United Nations selected the cumulative incidence of chronic HBV infection at 5 years of age as an indicator of the Sustainable Development Goal target for “combating hepatitis”. This indicator is measured indirectly through the proportion of children 5 years of age who have developed chronic HBV infection (i.e. the proportion that tests positive for a marker of infection called hepatitis B surface antigen [HBsAg]). </p>	<p>L'objectif est de décrire la réduction des infections chroniques par l'hépatite B. La majeure partie du fardeau de morbidité liée à l'infection par le VHB provient d'infections acquises avant l'âge de 5 ans. C'est pourquoi la prévention de l'infection par le VHB se concentre sur les enfants de moins de 5 ans. Les Nations Unies ont choisi l'incidence cumulative de l'infection chronique par le VHB à l'âge de 5 ans comme indicateur de la cible de l'objectif de développement durable pour la « lutte contre l'hépatite ». Cet indicateur est mesuré indirectement par la proportion d'enfants de 5 ans qui ont développé une infection chronique par le VHB (c.-à-d. la proportion qui est positive pour un marqueur d'infection appelé antigène de surface de l'hépatite B [AgHBs]). </p>
REC_USE_LIM	<p>The main Limitations of the analysis is that despite the thorough and in-depth literature search and access, there are fewer data on post vaccination studies than pre- vaccination studies. The model is largely informed by pre-vaccination studies in adults. </p> <p>The quality of studies and data was assessed by reviewing representativeness of sampling. Bias factor is a dichotomous variable. </p> <p>Potential important biases included geographical representation of the data points. Also, studies were from many different sources such as blood donors and pregnant women. The former possibly having a lower proportion of Hep B prevalence than the general population as donor questionnaires often exclude individuals with risk factors for blood-borne diseases and the pregnant women possibly having a higher prevalence as were in studies to see the effect of a birth dose of vaccine to prevent vertical transmission. As the proportion of studies and size of studies that were from blood donors was significantly greater than those on pregnant women, we may presume that our estimates of prevalence of pre- vaccination may be on the low side. </p>	<p>Les principales limites de l'analyse sont que, malgré un examen exhaustif de la littérature, il existe moins de données sur les études post-vaccinales que sur les études pré-vaccinales. Le modèle s'inspire largement des études pré-vaccinales chez les adultes. </p> <p>La qualité des études et des données a été évaluée en examinant la représentativité de l'échantillonnage. Le facteur de biais est une variable dichotomique. </p> <p>Parmi les biais potentiels importants, on peut citer la représentation géographique des points de données. En outre, les études provenaient de nombreuses sources disparates, comme les donneurs de sang et les femmes enceintes. Les questionnaires destinés aux donneurs excluent souvent les personnes présentant des facteurs de risque pour les maladies transmissible par le sang et les femmes enceintes peuvent présenter une prévalence plus élevée que celle de la population générale, comme le montrent les études visant à déterminer l'effet d'une dose de vaccin à la naissance pour prévenir la transmission verticale. Étant donné que la proportion des études et la taille des études réalisées avec des donneurs de sang étaient nettement plus importantes que celles réalisées avec des femmes enceintes, nous pouvons supposer que nos estimations de la prévalence de la pré-vaccination sont peut-être faibles. </p>
DATA_COMP	<p>The data was modelled using a Bayesian logistic regression looking at the proportion of individuals that tested positive for HBsAg in each study, weighting each study by its size and using a conditional autoregressive (CAR) model accounting for spatial and economic correlations between similar countries. This model uses data from well sampled countries to estimate prevalence in more data poor countries with effects such as sex, age and vaccination status, these are also informed by the geographic and countries GDP proximity to other countries (CAR model). Under the assumption that countries that are close together economically and/or geographically will have more similar prevalence due to similar social structure and health care capabilities. </p> <p>The response variable in the model was the prevalence of Hepatitis surface antigen (HBsAg) with the explanatory variables being age (three categories, under 5, juvenile (5-15) and adult (16+), split using the average age of participants in the study), sex (proportion female in the study), study bias (e.g. a high fraction of study participants from indigenous populations), 3 dose vaccine coverage, birth dose of the vaccine and country of study. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The WHO-UNICEF estimates are annual data for the country as a whole, and did not contain information on vaccine efficacy which was not used in the analysis as no data on this was obtained. The vaccine efficacy would be implicitly estimated in the analysis as we see vaccination having a variable effect across time and space across the studies. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. More explicitly, the model uses the ages and timing of the study to calculate the years across which the participants are born, so if the if there was an age group range of 10-15 in a study that was undertaken in 2015, the birth years would be from 2000-2005, we then average the vaccination coverage from the WHO-UNICEF estimates across those 5 years assuming that each age was evenly represented in that age group in the study. The same process was used for the 3 dose and birth dose vaccination. </p> <p> </p> <p>The general logistic model equation is described below, </p> <p>Yi ~Binomial (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p> <p> </p> <p>Where βj are the fixed effects of the explanatory variables xii. With the spatial random effects described by </p> <p>ui~ N(u−i,σ2u/ni)</p> <p> , </p> <p>where, </p> <p>u−i= ∑j ∈ neigh(i)wiuj/ni</p> <p>Where ni is the number of neighbours for country i and weights wi, are 1. </p> <p> </p> <p>The model was simulated in the Bayesian statistical package WinBUGS, and data manipulation and model initialisation run from R (3.3.1) using R2WinBUGS. The model considers the parameters of age, sex, study bias (e.g. a high fraction of study participants from indigenous populations), vaccine coverage, birth dose of the vaccine and country of study. </p> <p>The model uses the CAR-normal function, in WinBUGS, to model the spatial and economic autocorrelation related to neighbouring countries. For each country that had prevalence data, a weighted central position was calculated using the size and location of each study. For those countries with no data, we used the population centroid. In a novel approach, we considered 3 dimensions in the country adjacency matrix; we used the usual geographic dimensions, latitude and longitude and also combined these with the natural log of the country’s GDP per capita. This was to measure not only geographic but also the developmental proximity of countries. The adjacency matrix for the geo-economic distance gives a score between each country to every other country. Those countries which are close geographically and economically would have a low score and those further apart either geographically or economically would have a high score/distance. Therefore, those countries that are more alike will have a low score and those countries which are alike would have a high score. </p> <p>The way we proportioned the geographic and economic distance to produce the adjacency matrix was then explored, this is because geographic distance may be more or less important than economic similarities. Thus, by creating a number of different adjacency matrices (not definitive) we could select the most suitable matrix that explains reality best. We normalised the geographic and GDP distance and then calculated the distance between these two normalised figures. This creates a smoothed Gaussian surface that is dependent on both spatial proximity and GDP per-capita proximity. We compared ratios of, 1:0, 1:1, 2:1, 1:2 (Geographic:GDP). </p> <p>For each different adjacency matrix, we also had to select a neighbourhood distance, i.e. over what distance can a country be effected by another. Thus, we also varied the radius of distance from which to select neighbours for the neighbourhood network, we used the maximum minimum distance, twice the maximum minimum and three times the maximum minimum, thus varying the number of neighbours each country would have. </p> <p> </p> <p>Finally, to decide the magnitude of the effect one country has on another in the neighbourhood network we varied the weights of pairs of countries in the adjacency matrix, using either a neutral weighting of 1, so that each neighbour has an equal effect on each other (not dependent on the distance in the network), or decaying weights over distance with 1/distance, and 1/distance2, where the closer the country is the greater the effect it has on another country. The outcome of these 36 different combinations led to minimum DIC (Deviance Information Criterion) being found for a ratio of 1:2 (Geographic:GDP), the neighbourhood networks minimum distance being twice the maximum minimum distance and an even weighting of 1/distance for each adjacent country. </p> <p>This model structure produces estimates for all fixed effects and also individual country level risk, this provides information on which are significantly at greater or lower risk to the average risk. </p> <p>All parameters were given un-informative priors. Simulations were run with 3 MCMC chains with 50,000 burn in iterations and each parameter estimated from 1000 samples taken from a thinned 250,000 iterations to produce the posterior distribution. Convergence was attained, with r̂ values all very close to 1.000. Due to the Bayesian framework and WinBUGS software it was possible to gain estimates for countries where we had no data on prevalence, using their GDP and geographic proximity to inform this estimate. Those countries with the largest number of studies provided the estimates with the tightest confidence intervals and those with few or no data were less well defined, often producing a log normal distributed posterior distribution, giving estimates with long tails. </p> <p>Posterior distributions of parameters were inspected for convergence and to check for covariance between parameters. Where necessary parameters were centred and scaled to N (0, 1) to aid parameter convergence and remover covariance. This was done for the sex parameter, which was entered as the proportion of the sample that was female; this was seen to co-vary with the intercept and bias parameters before re-centring and scaling. However, the covariance of routine vaccination and birth dose persisted even after re-centring. This is in part unsurprising as there a few instances where birth dose is administered without the routine vaccination. Here we tried to reduce this interaction of the terms by transforming the birth dose data. We modelled birth dose using only data where the birth dose was greater than 60, 70, 80 & 90% respectively, we also modelled birth dose to the square, thus increasing the effect of high birth doses over smaller doses. Model selection dependent on which one both reduced the covariance between the parameters and returned the lowest DIC score. </p> <p>Model validation was conducted using 90% of randomly selected data against the remaining 10%, and by comparing model estimates of prevalence against observed data (Figure 3). Figure 4 shows the average prevalence in each country from all the studies plotted against the models estimate. Figure 5 shows the marginal and joint posterior distributions for the fitted parameters. Table 1 gives the estimated parameter values with associated credible intervals. </p> <p>During the validation exercise (in which countries were consulted over their estimates) it was pointed out that China had undertaken three very large-scale population-based serological surveys in order to establish baseline prevalence and progress towards HBV elimination. There were a large number of other surveys from China, that are less representative than these three nationwide surveys. We conducted a sensitivity analysis by restricting the data from China to the three nationally representative surveys. The effect of this change in input data was that the effect of vaccination was more distinct, but the estimated age effects (change in prevalence in children under 5, or juveniles (children 5-15 years)) were no longer significantly different from zero (see Table 2 and Figure 6). The deviance was significantly reduced, suggesting a much better fitting model (Table 2), albeit on a somewhat reduced dataset. </p>	<p>Les données ont été modélisées à l'aide d'une régression logistique bayésienne examinant la proportion d'individus testés positifs pour l'AgHBs dans chaque étude, en pondérant chaque étude par sa taille et en utilisant un modèle autorégressif conditionnel (CAR) tenant compte des corrélations spatiales et économiques entre pays similaires. Ce modèle utilise les données des pays bien échantillonnés pour estimer la prévalence dans les pays plus pauvres en données avec des effets tels que le sexe, l'âge et le statut vaccinal, ceux-ci sont également informés par la proximité géographique et le PIB des pays avec d'autres pays (modèle CAR). Selon l'hypothèse que les pays proches économiquement et/ou géographiquement auront une prévalence plus similaire en raison d'une structure sociale et de capacités de soins de santé similaires. </p> <p>La variable réponse du modèle était la prévalence de l'antigène de surface de l'hépatite (AgHBs), les variables explicatives étant l'âge (trois catégories, moins de 5 ans, mineur (5-15 ans) et adulte (16 ans ou plus), réparties en utilisant l'âge moyen des participants à l'étude), le sexe (proportion de femmes dans l'étude), le biais de l'étude (p. ex., une fraction élevée de participants à l'étude provenant de populations indigènes), la couverture vaccinale à 3 doses, la dose de vaccin à la naissance et le pays de l'étude. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations de couverture vaccinale correspondantes de l'OMS-UNICEF pour ce pays. Les estimations de l'OMS-UNICEF sont des données annuelles pour l'ensemble du pays et ne contiennent pas d'informations sur l'efficacité du vaccin, celle-ci n'a pas été utilisée dans l'analyse car aucune donnée à ce sujet n'a été obtenue. L'efficacité du vaccin serait implicitement estimée dans l'analyse car nous constatons que la vaccination a un effet variable dans le temps et l'espace dans les études. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations correspondantes de la couverture vaccinale de l'OMS-UNICEF pour ce pays. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations de couverture vaccinale de l'OMS-UNICEF correspondantes pour ce pays. Plus précisément, le modèle utilise les âges et le moment de l'étude pour calculer les années de naissance des participants. Ainsi, si une étude menée en 2015 portait sur une tranche d'âge de 10 à 15 ans, les années de naissance s'étendraient de 2000 à 2005, nous avons ensuite calculé la moyenne de la couverture vaccinale à partir des estimations de l'OMS-UNICEF sur ces 5 années en supposant que chaque âge était représenté de manière égale dans cette tranche d'âge dans l'étude. Le même processus a été utilisé pour la vaccination à 3 doses et la vaccination à la naissance. </p> <p> </p> <p>L'équation du modèle logistique général est décrite ci-dessous, </p> <p>Yi ~Binôme (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p> <p> </p> <p>où βj sont les effets fixes des variables explicatives xii. Avec les effets aléatoires spatiaux décrits par </p> <p>ui~ N(u−i,σ2u/ni)</p> <p>où </p> <p>u−i= ∑j ∈ neigh(i)wiuj/ni</p> <p>où ni est le nombre de voisins pour le pays i et les poids wi, valent 1. </p> <p> </p> <p>Le modèle a été simulé dans le module statistique bayésien WinBUGS, et la manipulation des données et l'initialisation du modèle exécutées à partir de R (3.3.1) en utilisant R2WinBUGS. Le modèle prend en compte les paramètres de l'âge, du sexe, du biais de l'étude (p. ex., une fraction élevée de participants à l'étude provenant de populations indigènes), de la couverture vaccinale, de la dose du vaccin à la naissance et du pays de l'étude. </p> <p>Le modèle utilise la fonction CAR-normale, dans WinBUGS, pour modéliser l'autocorrélation géographique et économique liée aux pays voisins. Pour chaque pays disposant de données de prévalence, une position centrale pondérée a été calculée en utilisant la taille et la localisation de chaque étude. Pour les pays ne disposant pas de données, nous avons utilisé le centroïde de la population. Dans une approche novatrice, nous avons considéré 3 dimensions dans la matrice d'adjacence des pays; nous avons utilisé les dimensions géographiques habituelles, la latitude et la longitude, et nous les avons également combinées avec le log naturel du PIB par habitant du pays, ceci afin de mesurer non seulement la proximité géographique mais aussi la proximité de développement des pays. La matrice d'adjacence pour la distance géo-économique donne un score entre chaque pays et tous les autres pays. Les pays qui sont proches géographiquement et économiquement ont un score faible et ceux qui sont plus éloignés géographiquement ou économiquement ont un score/distance élevé. Par conséquent, les pays qui se ressemblent le plus auront un score faible et les pays qui sont moins semblables auront un score élevé. </p> <p>On a ensuite exploré la façon dont nous avons proportionné la distance géographique et économique pour produire la matrice d'adjacence, ceci parce que la distance géographique peut être plus ou moins importante que les similitudes économiques. Ainsi, en créant un certain nombre de matrices d'adjacence différentes (non définitives), nous avons pu sélectionner la matrice la plus adaptée qui explique le mieux la réalité. Nous avons normalisé la distance géographique et la distance du PIB, puis nous avons calculé la distance entre ces deux chiffres normalisés. Cela crée une surface gaussienne lissée qui dépend à la fois de la proximité spatiale et de la proximité du PIB par habitant. Nous avons comparé des ratios de, 1:0, 1:1, 2:1, 1:2 (Géographie:PIB). </p> <p>Pour chaque matrice d'adjacence différente, nous avons également dû choisir une distance de voisinage, c.-à-d. sur quelle distance un pays peut être affecté par un autre. Ainsi, nous avons également fait varier le rayon de distance à partir duquel sélectionner les voisins pour le réseau de voisinage, nous avons utilisé la distance minimale maximale, deux fois le minimum maximal et trois fois le minimum maximal, faisant ainsi varier le nombre de voisins que chaque pays aurait. </p> <p> </p> <p>Enfin, pour décider de l'ampleur de l'effet d'un pays sur un autre dans le réseau de voisinage, nous avons fait varier les poids des paires de pays dans la matrice d'adjacence, en utilisant soit une pondération neutre de 1, de sorte que chaque voisin a un effet égal sur les autres (ne dépendant pas de la distance dans le réseau), soit des poids décroissants sur la distance avec 1/distance, et 1/distance2, où plus le pays est proche, plus son effet sur un autre pays est important. Le résultat de ces 36 combinaisons différentes a conduit à trouver un DIC (Deviance Information Criterion) minimal pour un rapport de 1:2 (Géographie:PIB), la distance minimale des réseaux de voisinage étant deux fois la distance minimale maximale et une pondération égale de 1/distance pour chaque pays adjacent. </p> <p>Cette structure de modèle produit des estimations pour tous les effets fixes et aussi pour le risque individuel au niveau du pays, cela fournit des informations sur ceux qui sont significativement plus à risque ou moins à risque par rapport au risque moyen. </p> <p>Tous les paramètres étaient a priori non informatifs. Les simulations ont été effectuées avec 3 chaînes MCMC avec 50 000 essais par itération et chaque paramètre estimé à partir de 1 000 échantillons prélevés sur un nombre réduit de 250 000 itérations pour produire la distribution postérieure. La convergence a été atteinte, avec des valeurs r̂ toutes très proches de 1,000. Grâce au cadre bayésien et au logiciel WinBUGS, il a été possible d'obtenir des estimations pour les pays pour lesquels nous n'avions pas de données sur la prévalence, en utilisant leur PIB et leur proximité géographique pour informer cette estimation. Les pays avec le plus grand nombre d'études ont fourni les estimations avec les intervalles de confiance les plus serrés et ceux avec peu ou pas de données étaient moins bien définis, produisant souvent une distribution postérieure log normale, donnant des estimations avec de longues queues. </p> <p>Les distributions postérieures des paramètres ont été inspectées pour vérifier la convergence et pour vérifier la covariance entre les paramètres. Si nécessaire, les paramètres ont été centrés et mis à l'échelle d'une loi N (0, 1) pour faciliter la convergence des paramètres et supprimer la covariance. C'est ce qui a été fait pour le paramètre de sexe, qui a été saisi comme la proportion de l'échantillon qui était féminine; on a constaté qu'il covarie avec les paramètres d'interception et de biais avant le recentrage et la mise à l'échelle. Cependant, la covariance de la vaccination systématique et de la dose à la naissance est restée même après recentrage. Ceci n'est en partie pas surprenant car il existe quelques cas où la dose à la naissance est administrée sans la vaccination systématique. Nous avons essayé de réduire cette interaction des termes en transformant les données sur la dose à la naissance. Nous avons modélisé celle-ci en utilisant uniquement les données où la dose à la naissance était supérieure à 60, 70, 80 et 90% respectivement, nous avons également modélisé la dose à la naissance au carré, augmentant ainsi l'effet des doses à la naissance élevées par rapport aux doses plus petites. La sélection du modèle dépendait de celui qui à la fois réduisait la covariance entre les paramètres et retournait le score DIC le plus bas. </p> <p>La validation du modèle a été effectuée en utilisant 90% des données sélectionnées au hasard contre les 10% restants, et en comparant les estimations de prévalence du modèle aux données observées (figure 3). La figure 4 montre la prévalence moyenne dans chaque pays à partir de toutes les études tracées contre l'estimation du modèle. La figure 5 montre les distributions marginales et conjointes postérieures des paramètres ajustés. Le tableau 1 donne les valeurs estimées des paramètres avec les intervalles de confiance associés. </p> <p>Lors de l'exercice de validation (au cours duquel les pays ont été consultés au sujet de leurs estimations), il a été souligné que la Chine avait entrepris trois enquêtes sérologiques en population de très grande envergure afin d'établir la prévalence de base et les progrès vers l'élimination du VHB. Il y avait un grand nombre d'autres enquêtes en Chine, qui sont moins représentatives que ces trois enquêtes nationales. Nous avons effectué une analyse de sensibilité en limitant les données de la Chine aux trois enquêtes représentatives au niveau national. Cette modification des données d'entrée a eu pour effet de rendre plus net l'effet de la vaccination, mais les effets estimés sur l'âge (changement de la prévalence chez les enfants de moins de 5 ans ou les jeunes (enfants de 5 à 15 ans)) n'étaient plus significativement différents de zéro (voir tableau 2 et figure 6). La déviance était significativement réduite, ce qui suggère un modèle beaucoup mieux ajusté (tableau 2), bien que sur un ensemble de données quelque peu réduit. </p>
ADJUSTMENT	<p>Estimates are provided for the 194 WHO Member States and grouped accordingly to the six WHO regions. We also provide estimates according to income classification and follow UN Regional Groupings and Compositions as much as possible. </p>	<p>Des estimations sont fournies pour les 194 États membres de l’OMS et regroupées en fonction des six régions de l’OMS. Nous fournissons également des estimations selon la classification des revenus et suivons autant que possible les groupements et compositions régionaux des Nations Unies. </p>
IMPUTATION	<ul> <li><strong>At country level </strong></li> </ul> <p>All values represent the best estimates for the hepatitis B surface antigen indicator and aim to facilitate comparability across countries and over time. The estimates are not always the same as the official national estimates, because of the use of different methodologies and data sources. Estimates are provided for 194 WHO Member States. The analysis was carried out for the age groups 0-5 years and for the general population. Due to scarcity of data from some countries, the estimates are more robust at global and regional level than at country level, therefore, we suggest countries focus on the 95% Credible Intervals and not only on the reported point estimates. </p> <p> </p> <p>A thorough and robust literature review was undertaken to find studies across the 194 WHO Member States and across age groups and vaccination status. We updated the systematic review by Schweitzer et al, 2015 that included a systematic search on articles published between Jan 1, 1965, and Oct 23, 2013. We updated the systematic search to include articles published between Oct 23, 2013, and October 30, 2018 in the databases Embase, PubMed, Global Index Medicus, Popline, and Web of Science. </p> <p> </p> <p>For each country that had prevalence data, a weighted central position was calculated using the size and location of each study. For those countries with no data, we used the population centroid. Please see detailed explanation above. </p> <p> </p> <ul> <li><strong>At regional and global levels </strong></li> </ul> <p>Same as above </p>	<ul> <li><strong>Au niveau national :</strong></li> </ul> <p>Toutes les valeurs représentent les meilleures estimations de l'indicateur de l'antigène de surface de l'hépatite B et visent à faciliter la comparabilité entre les pays et dans le temps. Les estimations ne sont pas toujours les mêmes que les estimations nationales officielles, en raison de l'utilisation de méthodologies et de sources de données différentes. Des estimations sont fournies pour 194 États membres de l'OMS. L'analyse a été effectuée pour les groupes d'âge de 0 à 5 ans et pour la population générale. En raison de la rareté des données de certains pays, les estimations sont plus robustes au niveau mondial et régional qu'au niveau national, c'est pourquoi nous suggérons aux pays de se concentrer sur les intervalles de confiance de 95% et pas seulement sur les estimations ponctuelles rapportées. </p> <p> </p> <p>Une revue de littérature approfondie et solide a été entreprise pour trouver des études sur les 194 États membres de l'OMS, les différents groupes d'âge et le statut de la vaccination. Nous avons mis à jour l'examen systématique de Schweitzer et coll., 2015 qui comprenait une recherche systématique sur les articles publiés entre le 1er janvier 1965 et le 23 octobre 2013. Nous avons mis à jour la recherche systématique pour inclure les articles publiés entre le 23 octobre 2013 et le 30 octobre 2018 dans les bases de données Embase, PubMed, Global Index Medicus, Popline et Web of Science. </p> <p> </p> <p>Pour chaque pays disposant de données de prévalence, une position centrale pondérée a été calculée en fonction de la taille et du lieu de chaque étude. Pour les pays ne disposant pas de données, nous avons utilisé le centroïde de la population. Veuillez consulter l'explication détaillée ci-dessus. </p> <p> </p> <ul> <li><strong>Aux niveaux régional et mondial :</strong></li> </ul> <p>Idem à ci-dessus. </p>
REG_AGG	<p><strong>Sources of discrepancies:</strong> </p> <p>The estimates are not always the same as the official national estimates, because of the use of different methodologies and data sources. The study selection criteria were similar to (Schweitzer, et al., 2015). Observational studies on chronic HBV infection seroprevalence (HBsAg prevalence), done in the general population or among blood donors, health-care workers (HCWs), and pregnant women were considered for inclusion in this systematic review. Studies were excluded if they were systematic reviews or meta-analyses, surveillance reports, case studies, letters or correspondence, or did not contain HBsAg seroprevalence data. Studies were also excluded if they exclusively reported prevalence estimates for high-risk population groups (e.g., migrants and refugees). </p> <p>Country estimates may come from selected serosurveys. </p>	<p><strong>Sources des divergences :</strong> </p> <p>Les estimations ne sont pas toujours les mêmes que les estimations nationales officielles, en raison de l’utilisation de méthodologies et de sources de données différentes. Les critères de sélection de l’étude étaient similaires à ceux de Schweitzer et coll., 2015. Des études observationnelles sur la séroprévalence chronique de l’infection par le VHB (prévalence de l’AgHBs), réalisées dans la population générale ou chez des donneurs de sang, des travailleurs de la santé et des femmes enceintes, ont été envisagées pour une inclusion dans cette revue systématique. Les études ont été exclues s’il s’agissait de revues systématiques ou de méta-analyses, de rapports de surveillance, d’études de cas, de lettres ou de correspondance, ou si elles ne contenaient pas de données de séroprévalence de l'AgHBs. Les études ont également été exclues si elles rapportaient exclusivement des estimations de prévalence pour les groupes de population à risque élevé (p. ex., les migrants et les réfugiés). </p> <p>Les estimations nationales peuvent provenir de certaines enquêtes sérologiques. </p>
DOC_METHOD	<p>Non applicable. Estimates come from the mathematical model. </p> <p> </p> <p>Gather checklist of information that should be included in new reports of global health estimates. Gather promotes best practices in reporting health estimates. A range of health indicators are used to monitor population health and guide resource allocation throughout the world. But the lack of data for some regions and differing measurement methods present challenges that are often addressed by using statistical modelling techniques to generate coherent estimates based on often disparate sources of data. <a href="http://gather-statement.org/" target="_blank"><u>http://gather-statement.org/</u></a> </p>	<p>Sans objet. Les estimations proviennent du modèle mathématique. </p> <p> </p> <p>« Gather » (Guidelines for Accurate and Transparent Health Estimates Reporting) propose une liste de contrôle d'informations qui devraient être incluses dans les nouveaux rapports sur les estimations de la santé mondiale et promeut de meilleures pratiques en matière de communication des estimations sanitaires. Une série d'indicateurs de santé sont utilisés pour surveiller la santé de la population et orienter l'allocation des ressources dans le monde entier. Cependant le manque de données pour certaines régions et les différentes méthodes de mesure posent des problèmes qui sont souvent résolus en utilisant des techniques de modélisation statistique pour générer des estimations cohérentes basées sur des sources de données souvent disparates. <a href="http://gather-statement.org/" target="_blank"><u>(en anglais) http://gather-statement.org/</u></a> </p>
QUALITY_ASSURE	<p><strong>Quality assurance</strong> </p> <ul> <li>WHO’s estimates use a methodology reviewed by the Immunization and Vaccines Related Implementation Research Advisory Committee (IVIR-AC) and presented to the Strategic Advisory Group of Experts (SAGE). These estimates have been documented following the Guidelines for Accurate and Transparent Health Estimates Reporting (GATHER). </li> </ul> <p> </p> <ul> <li>WHO provided Member States the opportunity to review and comment on data and estimates as part of the so called country consultation process. </li> </ul>	<p><strong>Assurance de la qualité : </strong></p> <ul> <li>Les estimations de l'OMS utilisent une méthodologie examinée par le Comité consultatif de recherche sur la mise en œuvre de la vaccination et des vaccins et présentée au Groupe consultatif stratégique d'experts. Ces estimations ont été documentées en suivant les Directives pour une communication précise et transparente des estimations sanitaires (GATHER).</li> </ul> <p> </p> <ul> <li>L'OMS a donné aux États membres la possibilité d'examiner et de commenter les données et les estimations dans le cadre du processus dit de consultation des pays.</li> </ul>

Key	English	French
COLL_METHOD	<p>WHO provides Member States the opportunity to review and comment on data as part of the so called country consultation process. Member States receive an annex with their country specific estimates, the serosurveys used to inform the mathematical model and the summary of the methodology. They are provided with sufficient time to provide any additional study to be screened according to the inclusion and inclusion criteria. </p>	<p>L'OMS donne aux États membres la possibilité d'examiner et de commenter les données dans le cadre du processus dit de consultation des pays. Les États membres reçoivent une annexe contenant les estimations spécifiques à leur pays, les enquêtes sérologiques utilisées pour alimenter le modèle mathématique et le résumé de la méthodologie. Ils disposent de suffisamment de temps pour fournir toute étude supplémentaire à examiner en fonction des critères d'inclusion et de sélection. </p>
COMPARABILITY	<p>This dataset represents the best estimates for the hepatitis B surface antigen indicator and aims to facilitate comparability across countries and over time. The estimates are not always the same as the official national estimates, because of the use of different methodologies and data sources e.g. special populations or populations at risk are not included in the hepatitis b seroprevalence model. Estimates are provided for 194 WHO Member States. The conditional autoregressive model uses data from well sampled countries to estimate prevalence in more data-poor countries taking account of effects such as sex, age and vaccination status. Due to scarcity of data from some countries, the estimates are more robust at global and regional level than at country level, therefore focus should be on the 95% Credible Intervals and not only on the reported point estimates.</p> <p><strong>Sources of discrepancies:</strong></p> <p>Inclusion or exclusion criteria of the type of seroprevalence studies. Observational studies on chronic HBV infection seroprevalence (HBsAg prevalence), done in the general population or among blood donors, health-care workers (HCWs), and pregnant women were considered for inclusion. Studies were excluded if they were systematic reviews or meta-analyses, surveillance reports, case studies, letters or correspondence, or did not contain HBsAg seroprevalence data. Studies were also excluded if they exclusively reported prevalence estimates for high-risk population groups (e.g., migrants and refugees).</p>	<p>Cet ensemble de données représente les meilleures estimations pour l’indicateur de l’antigène de surface de l’hépatite B et vise à faciliter la comparabilité entre les pays et au fil du temps. Les estimations ne sont pas toujours les mêmes que les estimations nationales officielles, en raison de l’utilisation de méthodologies et de sources de données différentes, p. ex., les populations spéciales ou les populations à risque ne sont pas incluses dans le modèle de séroprévalence de l’hépatite B. Des estimations sont fournies pour 194 États membres de l’OMS. Le modèle autorégressif conditionnel utilise des données provenant de pays bien échantillonnés pour estimer la prévalence dans les pays les plus pauvres en données en tenant compte d’effets tels que le sexe, l’âge et le statut vaccinal. En raison de la rareté des données de certains pays, les estimations sont plus robustes au niveau mondial et régional qu’au niveau national, de sorte que l’accent devrait être mis sur les intervalles de confiance de 95% et pas seulement sur les estimations ponctuelles rapportées. </p> <p><strong>Sources des divergences :</strong></p> <p>Les critères d’inclusion ou d’exclusion du type d’études de séroprévalence. Des études observationnelles sur la séroprévalence chronique de l’infection par le VHB (prévalence de l’AgHBs), réalisées dans la population générale ou chez des donneurs de sang, des travailleurs de la santé (TS) et des femmes enceintes ont été envisagées. Les études ont été exclues s’il s’agissait de revues systématiques ou de méta-analyses, de rapports de surveillance, d’études de cas, de lettres ou de correspondance, ou si elles ne contenaient pas de données de séroprévalence de l'AgHBs. Les études ont également été exclues si elles rapportaient exclusivement des estimations de prévalence pour les groupes de population à risque élevé (p. ex., les migrants et les réfugiés). </p>
COMPILING_ORG	<p>World Health Organization </p>	<p>Organisation mondiale de la Santé </p>
CONTACT_ORGANISATION	<p>World Health Organization</p>	<p>Organisation mondiale de la Santé</p>
COVERAGE	<p><strong>Data availability: </strong></p> <p>Estimates are available for 194 Member States and for the six WHO Regions, as well as at global level. </p> <p><strong>Time series:</strong></p> <p>Estimates are available for pre- vaccine era, 2015 and 2018 and 2020 </p> <p><strong>Disaggregation: </strong></p> <p>age groups (i.e. under five years of age, 5 years and older (although these estimates are not reported) and the general population); sex/gender if possible. Although the data for the latter is scarce. In addition, data at national, regional and global level. </p> <p> </p>	<p><strong>Disponibilité des données :</strong></p> <p>Des estimations sont disponibles pour 194 États membres et pour les six régions de l'OMS, ainsi qu'au niveau mondial.</p> <p><strong>Séries chronologiques :</strong></p> <p>Des estimations sont disponibles pour l'ère pré-vaccinale, 2015, 2018 et 2020. </p> <p><strong>Désagrégation :</strong></p> <p>Les variables disponibles sont : groupes d'âge (c.-à-d. les moins de cinq ans, les cinq ans et plus (bien que ces estimations ne sont pas déclarées) et la population générale); sexe / genre si possible. Bien que les données concernant ce dernier point soient rares. En outre, les données sont disponibles aux niveaux national, régional et mondial. </p> <p> </p>
DATA_COMP	<p>The data was modelled using a Bayesian logistic regression looking at the proportion of individuals that tested positive for HBsAg in each study, weighting each study by its size and using a conditional autoregressive (CAR) model accounting for spatial and economic correlations between similar countries. This model uses data from well sampled countries to estimate prevalence in more data poor countries with effects such as sex, age and vaccination status, these are also informed by the geographic and countries GDP proximity to other countries (CAR model). Under the assumption that countries that are close together economically and/or geographically will have more similar prevalence due to similar social structure and health care capabilities. </p> <p>The response variable in the model was the prevalence of Hepatitis surface antigen (HBsAg) with the explanatory variables being age (three categories, under 5, juvenile (5-15) and adult (16+), split using the average age of participants in the study), sex (proportion female in the study), study bias (e.g. a high fraction of study participants from indigenous populations), 3 dose vaccine coverage, birth dose of the vaccine and country of study. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The WHO-UNICEF estimates are annual data for the country as a whole, and did not contain information on vaccine efficacy which was not used in the analysis as no data on this was obtained. The vaccine efficacy would be implicitly estimated in the analysis as we see vaccination having a variable effect across time and space across the studies. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. More explicitly, the model uses the ages and timing of the study to calculate the years across which the participants are born, so if the if there was an age group range of 10-15 in a study that was undertaken in 2015, the birth years would be from 2000-2005, we then average the vaccination coverage from the WHO-UNICEF estimates across those 5 years assuming that each age was evenly represented in that age group in the study. The same process was used for the 3 dose and birth dose vaccination. </p> <p> </p> <p>The general logistic model equation is described below, </p> <p>Yi ~Binomial (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p> <p> </p> <p>Where βj are the fixed effects of the explanatory variables xii. With the spatial random effects described by </p> <p>ui~ N(u−i,σ2u/ni)</p> <p> , </p> <p>where, </p> <p>u−i= ∑j ∈ neigh(i)wiuj/ni</p> <p>Where ni is the number of neighbours for country i and weights wi, are 1. </p> <p> </p> <p>The model was simulated in the Bayesian statistical package WinBUGS, and data manipulation and model initialisation run from R (3.3.1) using R2WinBUGS. The model considers the parameters of age, sex, study bias (e.g. a high fraction of study participants from indigenous populations), vaccine coverage, birth dose of the vaccine and country of study. </p> <p>The model uses the CAR-normal function, in WinBUGS, to model the spatial and economic autocorrelation related to neighbouring countries. For each country that had prevalence data, a weighted central position was calculated using the size and location of each study. For those countries with no data, we used the population centroid. In a novel approach, we considered 3 dimensions in the country adjacency matrix; we used the usual geographic dimensions, latitude and longitude and also combined these with the natural log of the country’s GDP per capita. This was to measure not only geographic but also the developmental proximity of countries. The adjacency matrix for the geo-economic distance gives a score between each country to every other country. Those countries which are close geographically and economically would have a low score and those further apart either geographically or economically would have a high score/distance. Therefore, those countries that are more alike will have a low score and those countries which are alike would have a high score. </p> <p>The way we proportioned the geographic and economic distance to produce the adjacency matrix was then explored, this is because geographic distance may be more or less important than economic similarities. Thus, by creating a number of different adjacency matrices (not definitive) we could select the most suitable matrix that explains reality best. We normalised the geographic and GDP distance and then calculated the distance between these two normalised figures. This creates a smoothed Gaussian surface that is dependent on both spatial proximity and GDP per-capita proximity. We compared ratios of, 1:0, 1:1, 2:1, 1:2 (Geographic:GDP). </p> <p>For each different adjacency matrix, we also had to select a neighbourhood distance, i.e. over what distance can a country be effected by another. Thus, we also varied the radius of distance from which to select neighbours for the neighbourhood network, we used the maximum minimum distance, twice the maximum minimum and three times the maximum minimum, thus varying the number of neighbours each country would have. </p> <p> </p> <p>Finally, to decide the magnitude of the effect one country has on another in the neighbourhood network we varied the weights of pairs of countries in the adjacency matrix, using either a neutral weighting of 1, so that each neighbour has an equal effect on each other (not dependent on the distance in the network), or decaying weights over distance with 1/distance, and 1/distance2, where the closer the country is the greater the effect it has on another country. The outcome of these 36 different combinations led to minimum DIC (Deviance Information Criterion) being found for a ratio of 1:2 (Geographic:GDP), the neighbourhood networks minimum distance being twice the maximum minimum distance and an even weighting of 1/distance for each adjacent country. </p> <p>This model structure produces estimates for all fixed effects and also individual country level risk, this provides information on which are significantly at greater or lower risk to the average risk. </p> <p>All parameters were given un-informative priors. Simulations were run with 3 MCMC chains with 50,000 burn in iterations and each parameter estimated from 1000 samples taken from a thinned 250,000 iterations to produce the posterior distribution. Convergence was attained, with r̂ values all very close to 1.000. Due to the Bayesian framework and WinBUGS software it was possible to gain estimates for countries where we had no data on prevalence, using their GDP and geographic proximity to inform this estimate. Those countries with the largest number of studies provided the estimates with the tightest confidence intervals and those with few or no data were less well defined, often producing a log normal distributed posterior distribution, giving estimates with long tails. </p> <p>Posterior distributions of parameters were inspected for convergence and to check for covariance between parameters. Where necessary parameters were centred and scaled to N (0, 1) to aid parameter convergence and remover covariance. This was done for the sex parameter, which was entered as the proportion of the sample that was female; this was seen to co-vary with the intercept and bias parameters before re-centring and scaling. However, the covariance of routine vaccination and birth dose persisted even after re-centring. This is in part unsurprising as there a few instances where birth dose is administered without the routine vaccination. Here we tried to reduce this interaction of the terms by transforming the birth dose data. We modelled birth dose using only data where the birth dose was greater than 60, 70, 80 & 90% respectively, we also modelled birth dose to the square, thus increasing the effect of high birth doses over smaller doses. Model selection dependent on which one both reduced the covariance between the parameters and returned the lowest DIC score. </p> <p>Model validation was conducted using 90% of randomly selected data against the remaining 10%, and by comparing model estimates of prevalence against observed data (Figure 3). Figure 4 shows the average prevalence in each country from all the studies plotted against the models estimate. Figure 5 shows the marginal and joint posterior distributions for the fitted parameters. Table 1 gives the estimated parameter values with associated credible intervals. </p> <p>During the validation exercise (in which countries were consulted over their estimates) it was pointed out that China had undertaken three very large-scale population-based serological surveys in order to establish baseline prevalence and progress towards HBV elimination. There were a large number of other surveys from China, that are less representative than these three nationwide surveys. We conducted a sensitivity analysis by restricting the data from China to the three nationally representative surveys. The effect of this change in input data was that the effect of vaccination was more distinct, but the estimated age effects (change in prevalence in children under 5, or juveniles (children 5-15 years)) were no longer significantly different from zero (see Table 2 and Figure 6). The deviance was significantly reduced, suggesting a much better fitting model (Table 2), albeit on a somewhat reduced dataset. </p>	<p>Les données ont été modélisées à l'aide d'une régression logistique bayésienne examinant la proportion d'individus testés positifs pour l'AgHBs dans chaque étude, en pondérant chaque étude par sa taille et en utilisant un modèle autorégressif conditionnel (CAR) tenant compte des corrélations spatiales et économiques entre pays similaires. Ce modèle utilise les données des pays bien échantillonnés pour estimer la prévalence dans les pays plus pauvres en données avec des effets tels que le sexe, l'âge et le statut vaccinal, ceux-ci sont également informés par la proximité géographique et le PIB des pays avec d'autres pays (modèle CAR). Selon l'hypothèse que les pays proches économiquement et/ou géographiquement auront une prévalence plus similaire en raison d'une structure sociale et de capacités de soins de santé similaires. </p> <p>La variable réponse du modèle était la prévalence de l'antigène de surface de l'hépatite (AgHBs), les variables explicatives étant l'âge (trois catégories, moins de 5 ans, mineur (5-15 ans) et adulte (16 ans ou plus), réparties en utilisant l'âge moyen des participants à l'étude), le sexe (proportion de femmes dans l'étude), le biais de l'étude (p. ex., une fraction élevée de participants à l'étude provenant de populations indigènes), la couverture vaccinale à 3 doses, la dose de vaccin à la naissance et le pays de l'étude. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations de couverture vaccinale correspondantes de l'OMS-UNICEF pour ce pays. Les estimations de l'OMS-UNICEF sont des données annuelles pour l'ensemble du pays et ne contiennent pas d'informations sur l'efficacité du vaccin, celle-ci n'a pas été utilisée dans l'analyse car aucune donnée à ce sujet n'a été obtenue. L'efficacité du vaccin serait implicitement estimée dans l'analyse car nous constatons que la vaccination a un effet variable dans le temps et l'espace dans les études. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations correspondantes de la couverture vaccinale de l'OMS-UNICEF pour ce pays. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations de couverture vaccinale de l'OMS-UNICEF correspondantes pour ce pays. Plus précisément, le modèle utilise les âges et le moment de l'étude pour calculer les années de naissance des participants. Ainsi, si une étude menée en 2015 portait sur une tranche d'âge de 10 à 15 ans, les années de naissance s'étendraient de 2000 à 2005, nous avons ensuite calculé la moyenne de la couverture vaccinale à partir des estimations de l'OMS-UNICEF sur ces 5 années en supposant que chaque âge était représenté de manière égale dans cette tranche d'âge dans l'étude. Le même processus a été utilisé pour la vaccination à 3 doses et la vaccination à la naissance. </p> <p> </p> <p>L'équation du modèle logistique général est décrite ci-dessous, </p> <p>Yi ~Binôme (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p> <p> </p> <p>où βj sont les effets fixes des variables explicatives xii. Avec les effets aléatoires spatiaux décrits par </p> <p>ui~ N(u−i,σ2u/ni)</p> <p>où </p> <p>u−i= ∑j ∈ neigh(i)wiuj/ni</p> <p>où ni est le nombre de voisins pour le pays i et les poids wi, valent 1. </p> <p> </p> <p>Le modèle a été simulé dans le module statistique bayésien WinBUGS, et la manipulation des données et l'initialisation du modèle exécutées à partir de R (3.3.1) en utilisant R2WinBUGS. Le modèle prend en compte les paramètres de l'âge, du sexe, du biais de l'étude (p. ex., une fraction élevée de participants à l'étude provenant de populations indigènes), de la couverture vaccinale, de la dose du vaccin à la naissance et du pays de l'étude. </p> <p>Le modèle utilise la fonction CAR-normale, dans WinBUGS, pour modéliser l'autocorrélation géographique et économique liée aux pays voisins. Pour chaque pays disposant de données de prévalence, une position centrale pondérée a été calculée en utilisant la taille et la localisation de chaque étude. Pour les pays ne disposant pas de données, nous avons utilisé le centroïde de la population. Dans une approche novatrice, nous avons considéré 3 dimensions dans la matrice d'adjacence des pays; nous avons utilisé les dimensions géographiques habituelles, la latitude et la longitude, et nous les avons également combinées avec le log naturel du PIB par habitant du pays, ceci afin de mesurer non seulement la proximité géographique mais aussi la proximité de développement des pays. La matrice d'adjacence pour la distance géo-économique donne un score entre chaque pays et tous les autres pays. Les pays qui sont proches géographiquement et économiquement ont un score faible et ceux qui sont plus éloignés géographiquement ou économiquement ont un score/distance élevé. Par conséquent, les pays qui se ressemblent le plus auront un score faible et les pays qui sont moins semblables auront un score élevé. </p> <p>On a ensuite exploré la façon dont nous avons proportionné la distance géographique et économique pour produire la matrice d'adjacence, ceci parce que la distance géographique peut être plus ou moins importante que les similitudes économiques. Ainsi, en créant un certain nombre de matrices d'adjacence différentes (non définitives), nous avons pu sélectionner la matrice la plus adaptée qui explique le mieux la réalité. Nous avons normalisé la distance géographique et la distance du PIB, puis nous avons calculé la distance entre ces deux chiffres normalisés. Cela crée une surface gaussienne lissée qui dépend à la fois de la proximité spatiale et de la proximité du PIB par habitant. Nous avons comparé des ratios de, 1:0, 1:1, 2:1, 1:2 (Géographie:PIB). </p> <p>Pour chaque matrice d'adjacence différente, nous avons également dû choisir une distance de voisinage, c.-à-d. sur quelle distance un pays peut être affecté par un autre. Ainsi, nous avons également fait varier le rayon de distance à partir duquel sélectionner les voisins pour le réseau de voisinage, nous avons utilisé la distance minimale maximale, deux fois le minimum maximal et trois fois le minimum maximal, faisant ainsi varier le nombre de voisins que chaque pays aurait. </p> <p> </p> <p>Enfin, pour décider de l'ampleur de l'effet d'un pays sur un autre dans le réseau de voisinage, nous avons fait varier les poids des paires de pays dans la matrice d'adjacence, en utilisant soit une pondération neutre de 1, de sorte que chaque voisin a un effet égal sur les autres (ne dépendant pas de la distance dans le réseau), soit des poids décroissants sur la distance avec 1/distance, et 1/distance2, où plus le pays est proche, plus son effet sur un autre pays est important. Le résultat de ces 36 combinaisons différentes a conduit à trouver un DIC (Deviance Information Criterion) minimal pour un rapport de 1:2 (Géographie:PIB), la distance minimale des réseaux de voisinage étant deux fois la distance minimale maximale et une pondération égale de 1/distance pour chaque pays adjacent. </p> <p>Cette structure de modèle produit des estimations pour tous les effets fixes et aussi pour le risque individuel au niveau du pays, cela fournit des informations sur ceux qui sont significativement plus à risque ou moins à risque par rapport au risque moyen. </p> <p>Tous les paramètres étaient a priori non informatifs. Les simulations ont été effectuées avec 3 chaînes MCMC avec 50 000 essais par itération et chaque paramètre estimé à partir de 1 000 échantillons prélevés sur un nombre réduit de 250 000 itérations pour produire la distribution postérieure. La convergence a été atteinte, avec des valeurs r̂ toutes très proches de 1,000. Grâce au cadre bayésien et au logiciel WinBUGS, il a été possible d'obtenir des estimations pour les pays pour lesquels nous n'avions pas de données sur la prévalence, en utilisant leur PIB et leur proximité géographique pour informer cette estimation. Les pays avec le plus grand nombre d'études ont fourni les estimations avec les intervalles de confiance les plus serrés et ceux avec peu ou pas de données étaient moins bien définis, produisant souvent une distribution postérieure log normale, donnant des estimations avec de longues queues. </p> <p>Les distributions postérieures des paramètres ont été inspectées pour vérifier la convergence et pour vérifier la covariance entre les paramètres. Si nécessaire, les paramètres ont été centrés et mis à l'échelle d'une loi N (0, 1) pour faciliter la convergence des paramètres et supprimer la covariance. C'est ce qui a été fait pour le paramètre de sexe, qui a été saisi comme la proportion de l'échantillon qui était féminine; on a constaté qu'il covarie avec les paramètres d'interception et de biais avant le recentrage et la mise à l'échelle. Cependant, la covariance de la vaccination systématique et de la dose à la naissance est restée même après recentrage. Ceci n'est en partie pas surprenant car il existe quelques cas où la dose à la naissance est administrée sans la vaccination systématique. Nous avons essayé de réduire cette interaction des termes en transformant les données sur la dose à la naissance. Nous avons modélisé celle-ci en utilisant uniquement les données où la dose à la naissance était supérieure à 60, 70, 80 et 90% respectivement, nous avons également modélisé la dose à la naissance au carré, augmentant ainsi l'effet des doses à la naissance élevées par rapport aux doses plus petites. La sélection du modèle dépendait de celui qui à la fois réduisait la covariance entre les paramètres et retournait le score DIC le plus bas. </p> <p>La validation du modèle a été effectuée en utilisant 90% des données sélectionnées au hasard contre les 10% restants, et en comparant les estimations de prévalence du modèle aux données observées (figure 3). La figure 4 montre la prévalence moyenne dans chaque pays à partir de toutes les études tracées contre l'estimation du modèle. La figure 5 montre les distributions marginales et conjointes postérieures des paramètres ajustés. Le tableau 1 donne les valeurs estimées des paramètres avec les intervalles de confiance associés. </p> <p>Lors de l'exercice de validation (au cours duquel les pays ont été consultés au sujet de leurs estimations), il a été souligné que la Chine avait entrepris trois enquêtes sérologiques en population de très grande envergure afin d'établir la prévalence de base et les progrès vers l'élimination du VHB. Il y avait un grand nombre d'autres enquêtes en Chine, qui sont moins représentatives que ces trois enquêtes nationales. Nous avons effectué une analyse de sensibilité en limitant les données de la Chine aux trois enquêtes représentatives au niveau national. Cette modification des données d'entrée a eu pour effet de rendre plus net l'effet de la vaccination, mais les effets estimés sur l'âge (changement de la prévalence chez les enfants de moins de 5 ans ou les jeunes (enfants de 5 à 15 ans)) n'étaient plus significativement différents de zéro (voir tableau 2 et figure 6). La déviance était significativement réduite, ce qui suggère un modèle beaucoup mieux ajusté (tableau 2), bien que sur un ensemble de données quelque peu réduit. </p>
DATA_SOURCE	<p>World Health Organization </p>	<p>Organisation mondiale de la Santé </p>
DOC_METHOD	<p>Non applicable. Estimates come from the mathematical model. </p> <p> </p> <p>Gather checklist of information that should be included in new reports of global health estimates. Gather promotes best practices in reporting health estimates. A range of health indicators are used to monitor population health and guide resource allocation throughout the world. But the lack of data for some regions and differing measurement methods present challenges that are often addressed by using statistical modelling techniques to generate coherent estimates based on often disparate sources of data. <a href="http://gather-statement.org/" target="_blank"><u>http://gather-statement.org/</u></a> </p>	<p>Sans objet. Les estimations proviennent du modèle mathématique. </p> <p> </p> <p>« Gather » (Guidelines for Accurate and Transparent Health Estimates Reporting) propose une liste de contrôle d'informations qui devraient être incluses dans les nouveaux rapports sur les estimations de la santé mondiale et promeut de meilleures pratiques en matière de communication des estimations sanitaires. Une série d'indicateurs de santé sont utilisés pour surveiller la santé de la population et orienter l'allocation des ressources dans le monde entier. Cependant le manque de données pour certaines régions et les différentes méthodes de mesure posent des problèmes qui sont souvent résolus en utilisant des techniques de modélisation statistique pour générer des estimations cohérentes basées sur des sources de données souvent disparates. <a href="http://gather-statement.org/" target="_blank"><u>(en anglais) http://gather-statement.org/</u></a> </p>
FREQ_COLL	<p>The systematic review of published serosurveys and model estimates are updated on an annual basis. Planned for the last quarter of 2019. </p>	<p>L'examen systématique des enquêtes sérologiques publiées et des estimations de modèles est mis à jour chaque année. La prochaine révision est prévue pour le dernier trimestre de 2019. </p>
IMPUTATION	<ul> <li><strong>At country level </strong></li> </ul> <p>All values represent the best estimates for the hepatitis B surface antigen indicator and aim to facilitate comparability across countries and over time. The estimates are not always the same as the official national estimates, because of the use of different methodologies and data sources. Estimates are provided for 194 WHO Member States. The analysis was carried out for the age groups 0-5 years and for the general population. Due to scarcity of data from some countries, the estimates are more robust at global and regional level than at country level, therefore, we suggest countries focus on the 95% Credible Intervals and not only on the reported point estimates. </p> <p> </p> <p>A thorough and robust literature review was undertaken to find studies across the 194 WHO Member States and across age groups and vaccination status. We updated the systematic review by Schweitzer et al, 2015 that included a systematic search on articles published between Jan 1, 1965, and Oct 23, 2013. We updated the systematic search to include articles published between Oct 23, 2013, and October 30, 2018 in the databases Embase, PubMed, Global Index Medicus, Popline, and Web of Science. </p> <p> </p> <p>For each country that had prevalence data, a weighted central position was calculated using the size and location of each study. For those countries with no data, we used the population centroid. Please see detailed explanation above. </p> <p> </p> <ul> <li><strong>At regional and global levels </strong></li> </ul> <p>Same as above </p>	<ul> <li><strong>Au niveau national :</strong></li> </ul> <p>Toutes les valeurs représentent les meilleures estimations de l'indicateur de l'antigène de surface de l'hépatite B et visent à faciliter la comparabilité entre les pays et dans le temps. Les estimations ne sont pas toujours les mêmes que les estimations nationales officielles, en raison de l'utilisation de méthodologies et de sources de données différentes. Des estimations sont fournies pour 194 États membres de l'OMS. L'analyse a été effectuée pour les groupes d'âge de 0 à 5 ans et pour la population générale. En raison de la rareté des données de certains pays, les estimations sont plus robustes au niveau mondial et régional qu'au niveau national, c'est pourquoi nous suggérons aux pays de se concentrer sur les intervalles de confiance de 95% et pas seulement sur les estimations ponctuelles rapportées. </p> <p> </p> <p>Une revue de littérature approfondie et solide a été entreprise pour trouver des études sur les 194 États membres de l'OMS, les différents groupes d'âge et le statut de la vaccination. Nous avons mis à jour l'examen systématique de Schweitzer et coll., 2015 qui comprenait une recherche systématique sur les articles publiés entre le 1er janvier 1965 et le 23 octobre 2013. Nous avons mis à jour la recherche systématique pour inclure les articles publiés entre le 23 octobre 2013 et le 30 octobre 2018 dans les bases de données Embase, PubMed, Global Index Medicus, Popline et Web of Science. </p> <p> </p> <p>Pour chaque pays disposant de données de prévalence, une position centrale pondérée a été calculée en fonction de la taille et du lieu de chaque étude. Pour les pays ne disposant pas de données, nous avons utilisé le centroïde de la population. Veuillez consulter l'explication détaillée ci-dessus. </p> <p> </p> <ul> <li><strong>Aux niveaux régional et mondial :</strong></li> </ul> <p>Idem à ci-dessus. </p>

Loading…

deblsyl Translation changed SDG Metadata 3-3-4 French	English <p>The data was modelled using a Bayesian logistic regression looking at the proportion of individuals that tested positive for HBsAg in each study, weighting each study by its size and using a conditional autoregressive (CAR) model accounting for spatial and economic correlations between similar countries. This model uses data from well sampled countries to estimate prevalence in more data poor countries with effects such as sex, age and vaccination status, these are also informed by the geographic and countries GDP proximity to other countries (CAR model). Under the assumption that countries that are close together economically and/or geographically will have more similar prevalence due to similar social structure and health care capabilities. </p> <p>The response variable in the model was the prevalence of Hepatitis surface antigen (HBsAg) with the explanatory variables being age (three categories, under 5, juvenile (5-15) and adult (16+), split using the average age of participants in the study), sex (proportion female in the study), study bias (e.g. a high fraction of study participants from indigenous populations), 3 dose vaccine coverage, birth dose of the vaccine and country of study. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The WHO-UNICEF estimates are annual data for the country as a whole, and did not contain information on vaccine efficacy which was not used in the analysis as no data on this was obtained. The vaccine efficacy would be implicitly estimated in the analysis as we see vaccination having a variable effect across time and space across the studies. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. More explicitly, the model uses the ages and timing of the study to calculate the years across which the participants are born, so if the if there was an age group range of 10-15 in a study that was undertaken in 2015, the birth years would be from 2000-2005, we then average the vaccination coverage from the WHO-UNICEF estimates across those 5 years assuming that each age was evenly represented in that age group in the study. The same process was used for the 3 dose and birth dose vaccination. </p> <p> </p> <p>The general logistic model equation is described below, </p> <p>Yi ~Binomial (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p> <p> </p> <p>Where βj are the fixed effects of the explanatory variables xii. With the spatial random effects described by </p> <p>ui~ N(u−i,σ2u/ni)</p> <p> , </p> <p>where, </p> <p>u−i= ∑j ∈ neigh(i)wiuj/ni</p> <p>Where ni is the number of neighbours for country i and weights wi, are 1. </p> <p> </p> <p>The model was simulated in the Bayesian statistical package WinBUGS, and data manipulation and model initialisation run from R (3.3.1) using R2WinBUGS. The model considers the parameters of age, sex, study bias (e.g. a high fraction of study participants from indigenous populations), vaccine coverage, birth dose of the vaccine and country of study. </p> <p>The model uses the CAR-normal function, in WinBUGS, to model the spatial and economic autocorrelation related to neighbouring countries. For each country that had prevalence data, a weighted central position was calculated using the size and location of each study. For those countries with no data, we used the population centroid. In a novel approach, we considered 3 dimensions in the country adjacency matrix; we used the usual geographic dimensions, latitude and longitude and also combined these with the natural log of the country’s GDP per capita. This was to measure not only geographic but also the developmental proximity of countries. The adjacency matrix for the geo-economic distance gives a score between each country to every other country. Those countries which are close geographically and economically would have a low score and those further apart either geographically or economically would have a high score/distance. Therefore, those countries that are more alike will have a low score and those countries which are alike would have a high score. </p> <p>The way we proportioned the geographic and economic distance to produce the adjacency matrix was then explored, this is because geographic distance may be more or less important than economic similarities. Thus, by creating a number of different adjacency matrices (not definitive) we could select the most suitable matrix that explains reality best. We normalised the geographic and GDP distance and then calculated the distance between these two normalised figures. This creates a smoothed Gaussian surface that is dependent on both spatial proximity and GDP per-capita proximity. We compared ratios of, 1:0, 1:1, 2:1, 1:2 (Geographic:GDP). </p> <p>For each different adjacency matrix, we also had to select a neighbourhood distance, i.e. over what distance can a country be effected by another. Thus, we also varied the radius of distance from which to select neighbours for the neighbourhood network, we used the maximum minimum distance, twice the maximum minimum and three times the maximum minimum, thus varying the number of neighbours each country would have. </p> <p> </p> <p>Finally, to decide the magnitude of the effect one country has on another in the neighbourhood network we varied the weights of pairs of countries in the adjacency matrix, using either a neutral weighting of 1, so that each neighbour has an equal effect on each other (not dependent on the distance in the network), or decaying weights over distance with 1/distance, and 1/distance2, where the closer the country is the greater the effect it has on another country. The outcome of these 36 different combinations led to minimum DIC (Deviance Information Criterion) being found for a ratio of 1:2 (Geographic:GDP), the neighbourhood networks minimum distance being twice the maximum minimum distance and an even weighting of 1/distance for each adjacent country. </p> <p>This model structure produces estimates for all fixed effects and also individual country level risk, this provides information on which are significantly at greater or lower risk to the average risk. </p> <p>All parameters were given un-informative priors. Simulations were run with 3 MCMC chains with 50,000 burn in iterations and each parameter estimated from 1000 samples taken from a thinned 250,000 iterations to produce the posterior distribution. Convergence was attained, with r̂ values all very close to 1.000. Due to the Bayesian framework and WinBUGS software it was possible to gain estimates for countries where we had no data on prevalence, using their GDP and geographic proximity to inform this estimate. Those countries with the largest number of studies provided the estimates with the tightest confidence intervals and those with few or no data were less well defined, often producing a log normal distributed posterior distribution, giving estimates with long tails. </p> <p>Posterior distributions of parameters were inspected for convergence and to check for covariance between parameters. Where necessary parameters were centred and scaled to N (0, 1) to aid parameter convergence and remover covariance. This was done for the sex parameter, which was entered as the proportion of the sample that was female; this was seen to co-vary with the intercept and bias parameters before re-centring and scaling. However, the covariance of routine vaccination and birth dose persisted even after re-centring. This is in part unsurprising as there a few instances where birth dose is administered without the routine vaccination. Here we tried to reduce this interaction of the terms by transforming the birth dose data. We modelled birth dose using only data where the birth dose was greater than 60, 70, 80 & 90% respectively, we also modelled birth dose to the square, thus increasing the effect of high birth doses over smaller doses. Model selection dependent on which one both reduced the covariance between the parameters and returned the lowest DIC score. </p> <p>Model validation was conducted using 90% of randomly selected data against the remaining 10%, and by comparing model estimates of prevalence against observed data (Figure 3). Figure 4 shows the average prevalence in each country from all the studies plotted against the models estimate. Figure 5 shows the marginal and joint posterior distributions for the fitted parameters. Table 1 gives the estimated parameter values with associated credible intervals. </p> <p>During the validation exercise (in which countries were consulted over their estimates) it was pointed out that China had undertaken three very large-scale population-based serological surveys in order to establish baseline prevalence and progress towards HBV elimination. There were a large number of other surveys from China, that are less representative than these three nationwide surveys. We conducted a sensitivity analysis by restricting the data from China to the three nationally representative surveys. The effect of this change in input data was that the effect of vaccination was more distinct, but the estimated age effects (change in prevalence in children under 5, or juveniles (children 5-15 years)) were no longer significantly different from zero (see Table 2 and Figure 6). The deviance was significantly reduced, suggesting a much better fitting model (Table 2), albeit on a somewhat reduced dataset. </p> French 21 characters edited Current translation Translated <p>Les données ont été modélisées à l'aide d'une régression logistique bayésienne examinant la proportion d'individus testés positifs pour l'AgHBs dans chaque étude, en pondérant chaque étude par sa taille et en utilisant un modèle autorégressif conditionnel (CAR) tenant compte des corrélations spatiales et économiques entre pays similaires. Ce modèle utilise les données des pays bien échantillonnés pour estimer la prévalence dans les pays plus pauvres en données avec des effets tels que le sexe, l'âge et le statut vaccinal, ceux-ci sont également informés par la proximité géographique et le PIB des pays avec d'autres pays (modèle CAR). Selon l'hypothèse que les pays proches économiquement et/ou géographiquement auront une prévalence plus similaire en raison d'une structure sociale et de capacités de soins de santé similaires. </p> <p>La variable réponse du modèle était la prévalence de l'antigène de surface de l'hépatite (AgHBs), les variables explicatives étant l'âge (trois catégories, moins de 5 ans, mineur (5-15 ans) et adulte (16 ans ou plus), réparties en utilisant l'âge moyen des participants à l'étude), le sexe (proportion de femmes dans l'étude), le biais de l'étude (p~~ar exemple~~. ex., une fraction élevée de participants à l'étude provenant de populations indigènes), la couverture vaccinale à 3 doses, la dose de vaccin à la naissance et le pays de l'étude. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations de couverture vaccinale correspondantes de l'OMS-UNICEF pour ce pays. Les estimations de l'OMS-UNICEF sont des données annuelles pour l'ensemble du pays et ne contiennent pas d'informations sur l'efficacité du vaccin, celle-ci n'a pas été utilisée dans l'analyse car aucune donnée à ce sujet n'a été obtenue. L'efficacité du vaccin serait implicitement estimée dans l'analyse car nous constatons que la vaccination a un effet variable dans le temps et l'espace dans les études. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations correspondantes de la couverture vaccinale de l'OMS-UNICEF pour ce pays. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations de couverture vaccinale de l'OMS-UNICEF correspondantes pour ce pays. Plus précisément, le modèle utilise les âges et le moment de l'étude pour calculer les années de naissance des participants. Ainsi, si une étude menée en 2015 portait sur une tranche d'âge de 10 à 15 ans, les années de naissance s'étendraient de 2000 à 2005, nous avons ensuite calculé la moyenne de la couverture vaccinale à partir des estimations de l'OMS-UNICEF sur ces 5 années en supposant que chaque âge était représenté de manière égale dans cette tranche d'âge dans l'étude. Le même processus a été utilisé pour la vaccination à 3 doses et la vaccination à la naissance. </p> <p> </p> <p>L'équation du modèle logistique général est décrite ci-dessous, </p> <p>Yi ~Binôme (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p> <p> </p> <p>où βj sont les effets fixes des variables explicatives xii. Avec les effets aléatoires spatiaux décrits par </p> <p>ui~ N(u−i,σ2u/ni)</p> <p>où </p> <p>u−i= ∑j ∈ neigh(i)wiuj/ni</p> <p>où ni est le nombre de voisins pour le pays i et les poids wi, valent 1. </p> <p> </p> <p>Le modèle a été simulé dans le module statistique bayésien WinBUGS, et la manipulation des données et l'initialisation du modèle exécutées à partir de R (3.3.1) en utilisant R2WinBUGS. Le modèle prend en compte les paramètres de l'âge, du sexe, du biais de l'étude (p~~ar exemple~~. ex., une fraction élevée de participants à l'étude provenant de populations indigènes), de la couverture vaccinale, de la dose du vaccin à la naissance et du pays de l'étude. </p> <p>Le modèle utilise la fonction CAR-normale, dans WinBUGS, pour modéliser l'autocorrélation géographique et économique liée aux pays voisins. Pour chaque pays disposant de données de prévalence, une position centrale pondérée a été calculée en utilisant la taille et la localisation de chaque étude. Pour les pays ne disposant pas de données, nous avons utilisé le centroïde de la population. Dans une approche novatrice, nous avons considéré 3 dimensions dans la matrice d'adjacence des pays; nous avons utilisé les dimensions géographiques habituelles, la latitude et la longitude, et nous les avons également combinées avec le log naturel du PIB par habitant du pays, ceci afin de mesurer non seulement la proximité géographique mais aussi la proximité de développement des pays. La matrice d'adjacence pour la distance géo-économique donne un score entre chaque pays et tous les autres pays. Les pays qui sont proches géographiquement et économiquement ont un score faible et ceux qui sont plus éloignés géographiquement ou économiquement ont un score/distance élevé. Par conséquent, les pays qui se ressemblent le plus auront un score faible et les pays qui sont moins semblables auront un score élevé. </p> <p>On a ensuite exploré la façon dont nous avons proportionné la distance géographique et économique pour produire la matrice d'adjacence, ceci parce que la distance géographique peut être plus ou moins importante que les similitudes économiques. Ainsi, en créant un certain nombre de matrices d'adjacence différentes (non définitives), nous avons pu sélectionner la matrice la plus adaptée qui explique le mieux la réalité. Nous avons normalisé la distance géographique et la distance du PIB, puis nous avons calculé la distance entre ces deux chiffres normalisés. Cela crée une surface gaussienne lissée qui dépend à la fois de la proximité spatiale et de la proximité du PIB par habitant. Nous avons comparé des ratios de, 1:0, 1:1, 2:1, 1:2 (Géographie:PIB). </p> <p>Pour chaque matrice d'adjacence différente, nous avons également dû choisir une distance de voisinage, c~~'est~~.-à-d~~ire~~. sur quelle distance un pays peut être affecté par un autre. Ainsi, nous avons également fait varier le rayon de distance à partir duquel sélectionner les voisins pour le réseau de voisinage, nous avons utilisé la distance minimale maximale, deux fois le minimum maximal et trois fois le minimum maximal, faisant ainsi varier le nombre de voisins que chaque pays aurait. </p> <p> </p> <p>Enfin, pour décider de l'ampleur de l'effet d'un pays sur un autre dans le réseau de voisinage, nous avons fait varier les poids des paires de pays dans la matrice d'adjacence, en utilisant soit une pondération neutre de 1, de sorte que chaque voisin a un effet égal sur les autres (ne dépendant pas de la distance dans le réseau), soit des poids décroissants sur la distance avec 1/distance, et 1/distance2, où plus le pays est proche, plus son effet sur un autre pays est important. Le résultat de ces 36 combinaisons différentes a conduit à trouver un DIC (Deviance Information Criterion) minimal pour un rapport de 1:2 (Géographie:PIB), la distance minimale des réseaux de voisinage étant deux fois la distance minimale maximale et une pondération égale de 1/distance pour chaque pays adjacent. </p> <p>Cette structure de modèle produit des estimations pour tous les effets fixes et aussi pour le risque individuel au niveau du pays, cela fournit des informations sur ceux qui sont significativement plus à risque ou moins à risque par rapport au risque moyen. </p> <p>Tous les paramètres étaient a priori non informatifs. Les simulations ont été effectuées avec 3 chaînes MCMC avec 50 000 essais par itération et chaque paramètre estimé à partir de 1 000 échantillons prélevés sur un nombre réduit de 250 000 itérations pour produire la distribution postérieure. La convergence a été atteinte, avec des valeurs r̂ toutes très proches de 1,000. Grâce au cadre bayésien et au logiciel WinBUGS, il a été possible d'obtenir des estimations pour les pays pour lesquels nous n'avions pas de données sur la prévalence, en utilisant leur PIB et leur proximité géographique pour informer cette estimation. Les pays avec le plus grand nombre d'études ont fourni les estimations avec les intervalles de confiance les plus serrés et ceux avec peu ou pas de données étaient moins bien définis, produisant souvent une distribution postérieure log normale, donnant des estimations avec de longues queues. </p> <p>Les distributions postérieures des paramètres ont été inspectées pour vérifier la convergence et pour vérifier la covariance entre les paramètres. Si nécessaire, les paramètres ont été centrés et mis à l'échelle d'une loi N (0, 1) pour faciliter la convergence des paramètres et supprimer la covariance. C'est ce qui a été fait pour le paramètre de sexe, qui a été saisi comme la proportion de l'échantillon qui était féminine; on a constaté qu'il covarie avec les paramètres d'interception et de biais avant le recentrage et la mise à l'échelle. Cependant, la covariance de la vaccination systématique et de la dose à la naissance est restée même après recentrage. Ceci n'est en partie pas surprenant car il existe quelques cas où la dose à la naissance est administrée sans la vaccination systématique. Nous avons essayé de réduire cette interaction des termes en transformant les données sur la dose à la naissance. Nous avons modélisé celle-ci en utilisant uniquement les données où la dose à la naissance était supérieure à 60, 70, 80 et 90% respectivement, nous avons également modélisé la dose à la naissance au carré, augmentant ainsi l'effet des doses à la naissance élevées par rapport aux doses plus petites. La sélection du modèle dépendait de celui qui à la fois réduisait la covariance entre les paramètres et retournait le score DIC le plus bas. </p> <p>La validation du modèle a été effectuée en utilisant 90% des données sélectionnées au hasard contre les 10% restants, et en comparant les estimations de prévalence du modèle aux données observées (figure 3). La figure 4 montre la prévalence moyenne dans chaque pays à partir de toutes les études tracées contre l'estimation du modèle. La figure 5 montre les distributions marginales et conjointes postérieures des paramètres ajustés. Le tableau 1 donne les valeurs estimées des paramètres avec les intervalles de confiance associés. </p> <p>Lors de l'exercice de validation (au cours duquel les pays ont été consultés au sujet de leurs estimations), il a été souligné que la Chine avait entrepris trois enquêtes sérologiques en population de très grande envergure afin d'établir la prévalence de base et les progrès vers l'élimination du VHB. Il y avait un grand nombre d'autres enquêtes en Chine, qui sont moins représentatives que ces trois enquêtes nationales. Nous avons effectué une analyse de sensibilité en limitant les données de la Chine aux trois enquêtes représentatives au niveau national. Cette modification des données d'entrée a eu pour effet de rendre plus net l'effet de la vaccination, mais les effets estimés sur l'âge (changement de la prévalence chez les enfants de moins de 5 ans ou les jeunes (enfants de 5 à 15 ans)) n'étaient plus significativement différents de zéro (voir tableau 2 et figure 6). La déviance était significativement réduite, ce qui suggère un modèle beaucoup mieux ajusté (tableau 2), bien que sur un ensemble de données quelque peu réduit. </p> a year ago
None String updated in the repository SDG Metadata 3-3-4 French	English <p>The data was modelled using a Bayesian logistic regression looking at the proportion of individuals that tested positive for HBsAg in each study, weighting each study by its size and using a conditional autoregressive (CAR) model accounting for spatial and economic correlations between similar countries. This model uses data from well sampled countries to estimate prevalence in more data poor countries with effects such as sex, age and vaccination status, these are also informed by the geographic and countries GDP proximity to other countries (CAR model). Under the assumption that countries that are close together economically and/or geographically will have more similar prevalence due to similar social structure and health care capabilities. </p> <p>The response variable in the model was the prevalence of Hepatitis surface antigen (HBsAg) with the explanatory variables being age (three categories, under 5, juvenile (5-15) and adult (16+), split using the average age of participants in the study), sex (proportion female in the study), study bias (e.g. a high fraction of study participants from indigenous populations), 3 dose vaccine coverage, birth dose of the vaccine and country of study. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The WHO-UNICEF estimates are annual data for the country as a whole, and did not contain information on vaccine efficacy which was not used in the analysis as no data on this was obtained. The vaccine efficacy would be implicitly estimated in the analysis as we see vaccination having a variable effect across time and space across the studies. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. More explicitly, the model uses the ages and timing of the study to calculate the years across which the participants are born, so if the if there was an age group range of 10-15 in a study that was undertaken in 2015, the birth years would be from 2000-2005, we then average the vaccination coverage from the WHO-UNICEF estimates across those 5 years assuming that each age was evenly represented in that age group in the study. The same process was used for the 3 dose and birth dose vaccination. </p> <p> </p> <p>The general logistic model equation is described below, </p> <p>Yi ~Binomial (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p> <p> </p> <p>Where βj are the fixed effects of the explanatory variables xii. With the spatial random effects described by </p> <p>ui~ N(u−i,σ2u/ni)</p> <p> , </p> <p>where, </p> <p>u−i= ∑j ∈ neigh(i)wiuj/ni</p> <p>Where ni is the number of neighbours for country i and weights wi, are 1. </p> <p> </p> <p>The model was simulated in the Bayesian statistical package WinBUGS, and data manipulation and model initialisation run from R (3.3.1) using R2WinBUGS. The model considers the parameters of age, sex, study bias (e.g. a high fraction of study participants from indigenous populations), vaccine coverage, birth dose of the vaccine and country of study. </p> <p>The model uses the CAR-normal function, in WinBUGS, to model the spatial and economic autocorrelation related to neighbouring countries. For each country that had prevalence data, a weighted central position was calculated using the size and location of each study. For those countries with no data, we used the population centroid. In a novel approach, we considered 3 dimensions in the country adjacency matrix; we used the usual geographic dimensions, latitude and longitude and also combined these with the natural log of the country’s GDP per capita. This was to measure not only geographic but also the developmental proximity of countries. The adjacency matrix for the geo-economic distance gives a score between each country to every other country. Those countries which are close geographically and economically would have a low score and those further apart either geographically or economically would have a high score/distance. Therefore, those countries that are more alike will have a low score and those countries which are alike would have a high score. </p> <p>The way we proportioned the geographic and economic distance to produce the adjacency matrix was then explored, this is because geographic distance may be more or less important than economic similarities. Thus, by creating a number of different adjacency matrices (not definitive) we could select the most suitable matrix that explains reality best. We normalised the geographic and GDP distance and then calculated the distance between these two normalised figures. This creates a smoothed Gaussian surface that is dependent on both spatial proximity and GDP per-capita proximity. We compared ratios of, 1:0, 1:1, 2:1, 1:2 (Geographic:GDP). </p> <p>For each different adjacency matrix, we also had to select a neighbourhood distance, i.e. over what distance can a country be effected by another. Thus, we also varied the radius of distance from which to select neighbours for the neighbourhood network, we used the maximum minimum distance, twice the maximum minimum and three times the maximum minimum, thus varying the number of neighbours each country would have. </p> <p> </p> <p>Finally, to decide the magnitude of the effect one country has on another in the neighbourhood network we varied the weights of pairs of countries in the adjacency matrix, using either a neutral weighting of 1, so that each neighbour has an equal effect on each other (not dependent on the distance in the network), or decaying weights over distance with 1/distance, and 1/distance2, where the closer the country is the greater the effect it has on another country. The outcome of these 36 different combinations led to minimum DIC (Deviance Information Criterion) being found for a ratio of 1:2 (Geographic:GDP), the neighbourhood networks minimum distance being twice the maximum minimum distance and an even weighting of 1/distance for each adjacent country. </p> <p>This model structure produces estimates for all fixed effects and also individual country level risk, this provides information on which are significantly at greater or lower risk to the average risk. </p> <p>All parameters were given un-informative priors. Simulations were run with 3 MCMC chains with 50,000 burn in iterations and each parameter estimated from 1000 samples taken from a thinned 250,000 iterations to produce the posterior distribution. Convergence was attained, with r̂ values all very close to 1.000. Due to the Bayesian framework and WinBUGS software it was possible to gain estimates for countries where we had no data on prevalence, using their GDP and geographic proximity to inform this estimate. Those countries with the largest number of studies provided the estimates with the tightest confidence intervals and those with few or no data were less well defined, often producing a log normal distributed posterior distribution, giving estimates with long tails. </p> <p>Posterior distributions of parameters were inspected for convergence and to check for covariance between parameters. Where necessary parameters were centred and scaled to N (0, 1) to aid parameter convergence and remover covariance. This was done for the sex parameter, which was entered as the proportion of the sample that was female; this was seen to co-vary with the intercept and bias parameters before re-centring and scaling. However, the covariance of routine vaccination and birth dose persisted even after re-centring. This is in part unsurprising as there a few instances where birth dose is administered without the routine vaccination. Here we tried to reduce this interaction of the terms by transforming the birth dose data. We modelled birth dose using only data where the birth dose was greater than 60, 70, 80 & 90% respectively, we also modelled birth dose to the square, thus increasing the effect of high birth doses over smaller doses. Model selection dependent on which one both reduced the covariance between the parameters and returned the lowest DIC score. </p> <p>Model validation was conducted using 90% of randomly selected data against the remaining 10%, and by comparing model estimates of prevalence against observed data (Figure 3). Figure 4 shows the average prevalence in each country from all the studies plotted against the models estimate. Figure 5 shows the marginal and joint posterior distributions for the fitted parameters. Table 1 gives the estimated parameter values with associated credible intervals. </p> <p>During the validation exercise (in which countries were consulted over their estimates) it was pointed out that China had undertaken three very large-scale population-based serological surveys in order to establish baseline prevalence and progress towards HBV elimination. There were a large number of other surveys from China, that are less representative than these three nationwide surveys. We conducted a sensitivity analysis by restricting the data from China to the three nationally representative surveys. The effect of this change in input data was that the effect of vaccination was more distinct, but the estimated age effects (change in prevalence in children under 5, or juveniles (children 5-15 years)) were no longer significantly different from zero (see Table 2 and Figure 6). The deviance was significantly reduced, suggesting a much better fitting model (Table 2), albeit on a somewhat reduced dataset. </p> French 0 characters edited Translated <p>Les données ont été modélisées à l'aide d'une régression logistique bayésienne examinant la proportion d'individus testés positifs pour l'AgHBs dans chaque étude, en pondérant chaque étude par sa taille et en utilisant un modèle autorégressif conditionnel (CAR) tenant compte des corrélations spatiales et économiques entre pays similaires. Ce modèle utilise les données des pays bien échantillonnés pour estimer la prévalence dans les pays plus pauvres en données avec des effets tels que le sexe, l'âge et le statut vaccinal, ceux-ci sont également informés par la proximité géographique et le PIB des pays avec d'autres pays (modèle CAR). Selon l'hypothèse que les pays proches économiquement et/ou géographiquement auront une prévalence plus similaire en raison d'une structure sociale et de capacités de soins de santé similaires. </p> <p>La variable réponse du modèle était la prévalence de l'antigène de surface de l'hépatite (AgHBs), les variables explicatives étant l'âge (trois catégories, moins de 5 ans, mineur (5-15 ans) et adulte (16 ans ou plus), réparties en utilisant l'âge moyen des participants à l'étude), le sexe (proportion de femmes dans l'étude), le biais de l'étude (par exemple, une fraction élevée de participants à l'étude provenant de populations indigènes), la couverture vaccinale à 3 doses, la dose de vaccin à la naissance et le pays de l'étude. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations de couverture vaccinale correspondantes de l'OMS-UNICEF pour ce pays. Les estimations de l'OMS-UNICEF sont des données annuelles pour l'ensemble du pays et ne contiennent pas d'informations sur l'efficacité du vaccin, celle-ci n'a pas été utilisée dans l'analyse car aucune donnée à ce sujet n'a été obtenue. L'efficacité du vaccin serait implicitement estimée dans l'analyse car nous constatons que la vaccination a un effet variable dans le temps et l'espace dans les études. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations correspondantes de la couverture vaccinale de l'OMS-UNICEF pour ce pays. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations de couverture vaccinale de l'OMS-UNICEF correspondantes pour ce pays. Plus précisément, le modèle utilise les âges et le moment de l'étude pour calculer les années de naissance des participants. Ainsi, si une étude menée en 2015 portait sur une tranche d'âge de 10 à 15 ans, les années de naissance s'étendraient de 2000 à 2005, nous avons ensuite calculé la moyenne de la couverture vaccinale à partir des estimations de l'OMS-UNICEF sur ces 5 années en supposant que chaque âge était représenté de manière égale dans cette tranche d'âge dans l'étude. Le même processus a été utilisé pour la vaccination à 3 doses et la vaccination à la naissance. </p> <p> </p> <p>L'équation du modèle logistique général est décrite ci-dessous, </p> <p>Yi ~Binôme (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p> <p> </p> <p>où βj sont les effets fixes des variables explicatives xii. Avec les effets aléatoires spatiaux décrits par </p> <p>ui~ N(u−i,σ2u/ni)</p> <p>où </p> <p>u−i= ∑j ∈ neigh(i)wiuj/ni</p> <p>où ni est le nombre de voisins pour le pays i et les poids wi, valent 1. </p> <p> </p> <p>Le modèle a été simulé dans le module statistique bayésien WinBUGS, et la manipulation des données et l'initialisation du modèle exécutées à partir de R (3.3.1) en utilisant R2WinBUGS. Le modèle prend en compte les paramètres de l'âge, du sexe, du biais de l'étude (par exemple, une fraction élevée de participants à l'étude provenant de populations indigènes), de la couverture vaccinale, de la dose du vaccin à la naissance et du pays de l'étude. </p> <p>Le modèle utilise la fonction CAR-normale, dans WinBUGS, pour modéliser l'autocorrélation géographique et économique liée aux pays voisins. Pour chaque pays disposant de données de prévalence, une position centrale pondérée a été calculée en utilisant la taille et la localisation de chaque étude. Pour les pays ne disposant pas de données, nous avons utilisé le centroïde de la population. Dans une approche novatrice, nous avons considéré 3 dimensions dans la matrice d'adjacence des pays; nous avons utilisé les dimensions géographiques habituelles, la latitude et la longitude, et nous les avons également combinées avec le log naturel du PIB par habitant du pays, ceci afin de mesurer non seulement la proximité géographique mais aussi la proximité de développement des pays. La matrice d'adjacence pour la distance géo-économique donne un score entre chaque pays et tous les autres pays. Les pays qui sont proches géographiquement et économiquement ont un score faible et ceux qui sont plus éloignés géographiquement ou économiquement ont un score/distance élevé. Par conséquent, les pays qui se ressemblent le plus auront un score faible et les pays qui sont moins semblables auront un score élevé. </p> <p>On a ensuite exploré la façon dont nous avons proportionné la distance géographique et économique pour produire la matrice d'adjacence, ceci parce que la distance géographique peut être plus ou moins importante que les similitudes économiques. Ainsi, en créant un certain nombre de matrices d'adjacence différentes (non définitives), nous avons pu sélectionner la matrice la plus adaptée qui explique le mieux la réalité. Nous avons normalisé la distance géographique et la distance du PIB, puis nous avons calculé la distance entre ces deux chiffres normalisés. Cela crée une surface gaussienne lissée qui dépend à la fois de la proximité spatiale et de la proximité du PIB par habitant. Nous avons comparé des ratios de, 1:0, 1:1, 2:1, 1:2 (Géographie:PIB). </p> <p>Pour chaque matrice d'adjacence différente, nous avons également dû choisir une distance de voisinage, c'est-à-dire sur quelle distance un pays peut être affecté par un autre. Ainsi, nous avons également fait varier le rayon de distance à partir duquel sélectionner les voisins pour le réseau de voisinage, nous avons utilisé la distance minimale maximale, deux fois le minimum maximal et trois fois le minimum maximal, faisant ainsi varier le nombre de voisins que chaque pays aurait. </p> <p> </p> <p>Enfin, pour décider de l'ampleur de l'effet d'un pays sur un autre dans le réseau de voisinage, nous avons fait varier les poids des paires de pays dans la matrice d'adjacence, en utilisant soit une pondération neutre de 1, de sorte que chaque voisin a un effet égal sur les autres (ne dépendant pas de la distance dans le réseau), soit des poids décroissants sur la distance avec 1/distance, et 1/distance2, où plus le pays est proche, plus son effet sur un autre pays est important. Le résultat de ces 36 combinaisons différentes a conduit à trouver un DIC (Deviance Information Criterion) minimal pour un rapport de 1:2 (Géographie:PIB), la distance minimale des réseaux de voisinage étant deux fois la distance minimale maximale et une pondération égale de 1/distance pour chaque pays adjacent. </p> <p>Cette structure de modèle produit des estimations pour tous les effets fixes et aussi pour le risque individuel au niveau du pays, cela fournit des informations sur ceux qui sont significativement plus à risque ou moins à risque par rapport au risque moyen. </p> <p>Tous les paramètres étaient a priori non informatifs. Les simulations ont été effectuées avec 3 chaînes MCMC avec 50 000 essais par itération et chaque paramètre estimé à partir de 1 000 échantillons prélevés sur un nombre réduit de 250 000 itérations pour produire la distribution postérieure. La convergence a été atteinte, avec des valeurs r̂ toutes très proches de 1,000. Grâce au cadre bayésien et au logiciel WinBUGS, il a été possible d'obtenir des estimations pour les pays pour lesquels nous n'avions pas de données sur la prévalence, en utilisant leur PIB et leur proximité géographique pour informer cette estimation. Les pays avec le plus grand nombre d'études ont fourni les estimations avec les intervalles de confiance les plus serrés et ceux avec peu ou pas de données étaient moins bien définis, produisant souvent une distribution postérieure log normale, donnant des estimations avec de longues queues. </p> <p>Les distributions postérieures des paramètres ont été inspectées pour vérifier la convergence et pour vérifier la covariance entre les paramètres. Si nécessaire, les paramètres ont été centrés et mis à l'échelle d'une loi N (0, 1) pour faciliter la convergence des paramètres et supprimer la covariance. C'est ce qui a été fait pour le paramètre de sexe, qui a été saisi comme la proportion de l'échantillon qui était féminine; on a constaté qu'il covarie avec les paramètres d'interception et de biais avant le recentrage et la mise à l'échelle. Cependant, la covariance de la vaccination systématique et de la dose à la naissance est restée même après recentrage. Ceci n'est en partie pas surprenant car il existe quelques cas où la dose à la naissance est administrée sans la vaccination systématique. Nous avons essayé de réduire cette interaction des termes en transformant les données sur la dose à la naissance. Nous avons modélisé celle-ci en utilisant uniquement les données où la dose à la naissance était supérieure à 60, 70, 80 et 90% respectivement, nous avons également modélisé la dose à la naissance au carré, augmentant ainsi l'effet des doses à la naissance élevées par rapport aux doses plus petites. La sélection du modèle dépendait de celui qui à la fois réduisait la covariance entre les paramètres et retournait le score DIC le plus bas. </p> <p>La validation du modèle a été effectuée en utilisant 90% des données sélectionnées au hasard contre les 10% restants, et en comparant les estimations de prévalence du modèle aux données observées (figure 3). La figure 4 montre la prévalence moyenne dans chaque pays à partir de toutes les études tracées contre l'estimation du modèle. La figure 5 montre les distributions marginales et conjointes postérieures des paramètres ajustés. Le tableau 1 donne les valeurs estimées des paramètres avec les intervalles de confiance associés. </p> <p>Lors de l'exercice de validation (au cours duquel les pays ont été consultés au sujet de leurs estimations), il a été souligné que la Chine avait entrepris trois enquêtes sérologiques en population de très grande envergure afin d'établir la prévalence de base et les progrès vers l'élimination du VHB. Il y avait un grand nombre d'autres enquêtes en Chine, qui sont moins représentatives que ces trois enquêtes nationales. Nous avons effectué une analyse de sensibilité en limitant les données de la Chine aux trois enquêtes représentatives au niveau national. Cette modification des données d'entrée a eu pour effet de rendre plus net l'effet de la vaccination, mais les effets estimés sur l'âge (changement de la prévalence chez les enfants de moins de 5 ans ou les jeunes (enfants de 5 à 15 ans)) n'étaient plus significativement différents de zéro (voir tableau 2 et figure 6). La déviance était significativement réduite, ce qui suggère un modèle beaucoup mieux ajusté (tableau 2), bien que sur un ensemble de données quelque peu réduit. </p> 2 years ago
deblsyl Translation changed SDG Metadata 3-3-4 French	English <p>The data was modelled using a Bayesian logistic regression looking at the proportion of individuals that tested positive for HBsAg in each study, weighting each study by its size and using a conditional autoregressive (CAR) model accounting for spatial and economic correlations between similar countries. This model uses data from well sampled countries to estimate prevalence in more data poor countries with effects such as sex, age and vaccination status, these are also informed by the geographic and countries GDP proximity to other countries (CAR model). Under the assumption that countries that are close together economically and/or geographically will have more similar prevalence due to similar social structure and health care capabilities. </p> <p>The response variable in the model was the prevalence of Hepatitis surface antigen (HBsAg) with the explanatory variables being age (three categories, under 5, juvenile (5-15) and adult (16+), split using the average age of participants in the study), sex (proportion female in the study), study bias (e.g. a high fraction of study participants from indigenous populations), 3 dose vaccine coverage, birth dose of the vaccine and country of study. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The WHO-UNICEF estimates are annual data for the country as a whole, and did not contain information on vaccine efficacy which was not used in the analysis as no data on this was obtained. The vaccine efficacy would be implicitly estimated in the analysis as we see vaccination having a variable effect across time and space across the studies. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. More explicitly, the model uses the ages and timing of the study to calculate the years across which the participants are born, so if the if there was an age group range of 10-15 in a study that was undertaken in 2015, the birth years would be from 2000-2005, we then average the vaccination coverage from the WHO-UNICEF estimates across those 5 years assuming that each age was evenly represented in that age group in the study. The same process was used for the 3 dose and birth dose vaccination. </p> <p> </p> <p>The general logistic model equation is described below, </p> <p>Yi ~Binomial (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p> <p> </p> <p>Where βj are the fixed effects of the explanatory variables xii. With the spatial random effects described by </p> <p>ui~ N(u−i,σ2u/ni)</p> <p> , </p> <p>where, </p> <p>u−i= ∑j ∈ neigh(i)wiuj/ni</p> <p>Where ni is the number of neighbours for country i and weights wi, are 1. </p> <p> </p> <p>The model was simulated in the Bayesian statistical package WinBUGS, and data manipulation and model initialisation run from R (3.3.1) using R2WinBUGS. The model considers the parameters of age, sex, study bias (e.g. a high fraction of study participants from indigenous populations), vaccine coverage, birth dose of the vaccine and country of study. </p> <p>The model uses the CAR-normal function, in WinBUGS, to model the spatial and economic autocorrelation related to neighbouring countries. For each country that had prevalence data, a weighted central position was calculated using the size and location of each study. For those countries with no data, we used the population centroid. In a novel approach, we considered 3 dimensions in the country adjacency matrix; we used the usual geographic dimensions, latitude and longitude and also combined these with the natural log of the country’s GDP per capita. This was to measure not only geographic but also the developmental proximity of countries. The adjacency matrix for the geo-economic distance gives a score between each country to every other country. Those countries which are close geographically and economically would have a low score and those further apart either geographically or economically would have a high score/distance. Therefore, those countries that are more alike will have a low score and those countries which are alike would have a high score. </p> <p>The way we proportioned the geographic and economic distance to produce the adjacency matrix was then explored, this is because geographic distance may be more or less important than economic similarities. Thus, by creating a number of different adjacency matrices (not definitive) we could select the most suitable matrix that explains reality best. We normalised the geographic and GDP distance and then calculated the distance between these two normalised figures. This creates a smoothed Gaussian surface that is dependent on both spatial proximity and GDP per-capita proximity. We compared ratios of, 1:0, 1:1, 2:1, 1:2 (Geographic:GDP). </p> <p>For each different adjacency matrix, we also had to select a neighbourhood distance, i.e. over what distance can a country be effected by another. Thus, we also varied the radius of distance from which to select neighbours for the neighbourhood network, we used the maximum minimum distance, twice the maximum minimum and three times the maximum minimum, thus varying the number of neighbours each country would have. </p> <p> </p> <p>Finally, to decide the magnitude of the effect one country has on another in the neighbourhood network we varied the weights of pairs of countries in the adjacency matrix, using either a neutral weighting of 1, so that each neighbour has an equal effect on each other (not dependent on the distance in the network), or decaying weights over distance with 1/distance, and 1/distance2, where the closer the country is the greater the effect it has on another country. The outcome of these 36 different combinations led to minimum DIC (Deviance Information Criterion) being found for a ratio of 1:2 (Geographic:GDP), the neighbourhood networks minimum distance being twice the maximum minimum distance and an even weighting of 1/distance for each adjacent country. </p> <p>This model structure produces estimates for all fixed effects and also individual country level risk, this provides information on which are significantly at greater or lower risk to the average risk. </p> <p>All parameters were given un-informative priors. Simulations were run with 3 MCMC chains with 50,000 burn in iterations and each parameter estimated from 1000 samples taken from a thinned 250,000 iterations to produce the posterior distribution. Convergence was attained, with r̂ values all very close to 1.000. Due to the Bayesian framework and WinBUGS software it was possible to gain estimates for countries where we had no data on prevalence, using their GDP and geographic proximity to inform this estimate. Those countries with the largest number of studies provided the estimates with the tightest confidence intervals and those with few or no data were less well defined, often producing a log normal distributed posterior distribution, giving estimates with long tails. </p> <p>Posterior distributions of parameters were inspected for convergence and to check for covariance between parameters. Where necessary parameters were centred and scaled to N (0, 1) to aid parameter convergence and remover covariance. This was done for the sex parameter, which was entered as the proportion of the sample that was female; this was seen to co-vary with the intercept and bias parameters before re-centring and scaling. However, the covariance of routine vaccination and birth dose persisted even after re-centring. This is in part unsurprising as there a few instances where birth dose is administered without the routine vaccination. Here we tried to reduce this interaction of the terms by transforming the birth dose data. We modelled birth dose using only data where the birth dose was greater than 60, 70, 80 & 90% respectively, we also modelled birth dose to the square, thus increasing the effect of high birth doses over smaller doses. Model selection dependent on which one both reduced the covariance between the parameters and returned the lowest DIC score. </p> <p>Model validation was conducted using 90% of randomly selected data against the remaining 10%, and by comparing model estimates of prevalence against observed data (Figure 3). Figure 4 shows the average prevalence in each country from all the studies plotted against the models estimate. Figure 5 shows the marginal and joint posterior distributions for the fitted parameters. Table 1 gives the estimated parameter values with associated credible intervals. </p> <p>During the validation exercise (in which countries were consulted over their estimates) it was pointed out that China had undertaken three very large-scale population-based serological surveys in order to establish baseline prevalence and progress towards HBV elimination. There were a large number of other surveys from China, that are less representative than these three nationwide surveys. We conducted a sensitivity analysis by restricting the data from China to the three nationally representative surveys. The effect of this change in input data was that the effect of vaccination was more distinct, but the estimated age effects (change in prevalence in children under 5, or juveniles (children 5-15 years)) were no longer significantly different from zero (see Table 2 and Figure 6). The deviance was significantly reduced, suggesting a much better fitting model (Table 2), albeit on a somewhat reduced dataset. </p> French 8 characters edited <p>Les données ont été modélisées à l'aide d'une régression logistique bayésienne examinant la proportion d'individus testés positifs pour l'AgHBs dans chaque étude, en pondérant chaque étude par sa taille et en utilisant un modèle autorégressif conditionnel (CAR) tenant compte des corrélations spatiales et économiques entre pays similaires. Ce modèle utilise les données des pays bien échantillonnés pour estimer la prévalence dans les pays plus pauvres en données avec des effets tels que le sexe, l'âge et le statut vaccinal, ceux-ci sont également informés par la proximité géographique et le PIB des pays avec d'autres pays (modèle CAR). Selon l'hypothèse que les pays proches économiquement et/ou géographiquement auront une prévalence plus similaire en raison d'une structure sociale et de capacités de soins de santé similaires. </p> <p>La variable réponse du modèle était la prévalence de l'antigène de surface de l'hépatite (AgHBs), les variables explicatives étant l'âge (trois catégories, moins de 5 ans, mineur (5-15 ans) et adulte (16 ans ou plus), réparties en utilisant l'âge moyen des participants à l'étude), le sexe (proportion de femmes dans l'étude), le biais de l'étude (par exemple, une fraction élevée de participants à l'étude provenant de populations indigènes), la couverture vaccinale à 3 doses, la dose de vaccin à la naissance et le pays de l'étude. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations de couverture vaccinale correspondantes de l'OMS-UNICEF pour ce pays. Les estimations de l'OMS-UNICEF sont des données annuelles pour l'ensemble du pays et ne contiennent pas d'informations sur l'efficacité du vaccin, celle-ci n'a pas été utilisée dans l'analyse car aucune donnée à ce sujet n'a été obtenue. L'efficacité du vaccin serait implicitement estimée dans l'analyse car nous constatons que la vaccination a un effet variable dans le temps et l'espace dans les études. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations correspondantes de la couverture vaccinale de l'OMS-UNICEF pour ce pays. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations de couverture vaccinale de l'OMS-UNICEF correspondantes pour ce pays. Plus précisément, le modèle utilise les âges et le moment de l'étude pour calculer les années de naissance des participants. Ainsi, si une étude menée en 2015 portait sur une tranche d'âge de 10 à 15 ans, les années de naissance s'étendraient de 2000 à 2005, nous avons ensuite calculé la moyenne de la couverture vaccinale à partir des estimations de l'OMS-UNICEF sur ces 5 années en supposant que chaque âge était représenté de manière égale dans cette tranche d'âge dans l'étude. Le même processus a été utilisé pour la vaccination à 3 doses et la vaccination à la naissance. </p> <p> </p> <p>L'équation du modèle logistique général est décrite ci-dessous, </p> <p>Yi ~Binôme (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p> <p> </p> <p>où βj sont les effets fixes des variables explicatives xii. Avec les effets aléatoires spatiaux décrits par </p> <p>ui~ N(u−i,σ2u/ni)</p> <p>où </p> <p>u−i= ∑j ∈ neigh(i)wiuj/ni</p> <p>où ni est le nombre de voisins pour le pays i et les poids wi, valent 1. </p> <p> </p> <p>Le modèle a été simulé dans le ~~paquet~~module statistique bayésien WinBUGS, et la manipulation des données et l'initialisation du modèle exécutées à partir de R (3.3.1) en utilisant R2WinBUGS. Le modèle prend en compte les paramètres de l'âge, du sexe, du biais de l'étude (par exemple, une fraction élevée de participants à l'étude provenant de populations indigènes), de la couverture vaccinale, de la dose du vaccin à la naissance et du pays de l'étude. </p> <p>Le modèle utilise la fonction CAR-normale, dans WinBUGS, pour modéliser l'autocorrélation géographique et économique liée aux pays voisins. Pour chaque pays disposant de données de prévalence, une position centrale pondérée a été calculée en utilisant la taille et la localisation de chaque étude. Pour les pays ne disposant pas de données, nous avons utilisé le centroïde de la population. Dans une approche novatrice, nous avons considéré 3 dimensions dans la matrice d'adjacence des pays ; nous avons utilisé les dimensions géographiques habituelles, la latitude et la longitude, et nous les avons également combinées avec le log naturel du PIB par habitant du pays, ceci afin de mesurer non seulement la proximité géographique mais aussi la proximité de développement des pays. La matrice d'adjacence pour la distance géo-économique donne un score entre chaque pays et tous les autres pays. Les pays qui sont proches géographiquement et économiquement ont un score faible et ceux qui sont plus éloignés géographiquement ou économiquement ont un score/distance élevé. Par conséquent, les pays qui se ressemblent le plus auront un score faible et les pays qui sont moins semblables auront un score élevé. </p> <p>On a ensuite exploré la façon dont nous avons proportionné la distance géographique et économique pour produire la matrice d'adjacence, ceci parce que la distance géographique peut être plus ou moins importante que les similitudes économiques. Ainsi, en créant un certain nombre de matrices d'adjacence différentes (non définitives), nous avons pu sélectionner la matrice la plus adaptée qui explique le mieux la réalité. Nous avons normalisé la distance géographique et la distance du PIB, puis nous avons calculé la distance entre ces deux chiffres normalisés. Cela crée une surface gaussienne lissée qui dépend à la fois de la proximité spatiale et de la proximité du PIB par habitant. Nous avons comparé des ratios de, 1:0, 1:1, 2:1, 1:2 (Géographique:PIB). </p> <p>Pour chaque matrice d'adjacence différente, nous avons également dû choisir une distance de voisinage, c'est-à-dire sur quelle distance un pays peut être affecté par un autre. Ainsi, nous avons également fait varier le rayon de distance à partir duquel sélectionner les voisins pour le réseau de voisinage, nous avons utilisé la distance minimale maximale, deux fois le minimum maximal et trois fois le minimum maximal, faisant ainsi varier le nombre de voisins que chaque pays aurait. </p> <p> </p> <p>Enfin, pour décider de l'ampleur de l'effet d'un pays sur un autre dans le réseau de voisinage, nous avons fait varier les poids des paires de pays dans la matrice d'adjacence, en utilisant soit une pondération neutre de 1, de sorte que chaque voisin a un effet égal sur les autres (ne dépendant pas de la distance dans le réseau), soit des poids décroissants sur la distance avec 1/distance, et 1/distance2, où plus le pays est proche, plus son effet sur un autre pays est important. Le résultat de ces 36 combinaisons différentes a conduit à trouver un DIC (Deviance Information Criterion) minimal pour un rapport de 1:2 (Géographie:PIB), la distance minimale des réseaux de voisinage étant deux fois la distance minimale maximale et une pondération égale de 1/distance pour chaque pays adjacent. </p> <p>Cette structure de modèle produit des estimations pour tous les effets fixes et aussi pour le risque individuel au niveau du pays, cela fournit des informations sur ceux qui sont significativement plus à risque ou moins à risque par rapport au risque moyen. </p> <p>Tous les paramètres étaient a priori non informatifs. Les simulations ont été effectuées avec 3 chaînes MCMC avec 50 000 essais par itération et chaque paramètre estimé à partir de 1 000 échantillons prélevés sur un nombre réduit de 250 000 itérations pour produire la distribution postérieure. La convergence a été atteinte, avec des valeurs r̂ toutes très proches de 1,000. Grâce au cadre bayésien et au logiciel WinBUGS, il a été possible d'obtenir des estimations pour les pays pour lesquels nous n'avions pas de données sur la prévalence, en utilisant leur PIB et leur proximité géographique pour informer cette estimation. Les pays avec le plus grand nombre d'études ont fourni les estimations avec les intervalles de confiance les plus serrés et ceux avec peu ou pas de données étaient moins bien définis, produisant souvent une distribution postérieure log normale, donnant des estimations avec de longues queues. </p> <p>Les distributions postérieures des paramètres ont été inspectées pour vérifier la convergence et pour vérifier la covariance entre les paramètres. Si nécessaire, les paramètres ont été centrés et mis à l'échelle d'une loi N (0, 1) pour faciliter la convergence des paramètres et supprimer la covariance. C'est ce qui a été fait pour le paramètre de sexe, qui a été saisi comme la proportion de l'échantillon qui était féminine; on a constaté qu'il covarie avec les paramètres d'interception et de biais avant le recentrage et la mise à l'échelle. Cependant, la covariance de la vaccination systématique et de la dose à la naissance est restée même après recentrage. Ceci n'est en partie pas surprenant car il existe quelques cas où la dose à la naissance est administrée sans la vaccination systématique. Nous avons essayé de réduire cette interaction des termes en transformant les données sur la dose à la naissance. Nous avons modélisé celle-ci en utilisant uniquement les données où la dose à la naissance était supérieure à 60, 70, 80 et 90% respectivement, nous avons également modélisé la dose à la naissance au carré, augmentant ainsi l'effet des doses à la naissance élevées par rapport aux doses plus petites. La sélection du modèle dépendait de celui qui à la fois réduisait la covariance entre les paramètres et retournait le score DIC le plus bas. </p> <p>La validation du modèle a été effectuée en utilisant 90% des données sélectionnées au hasard contre les 10% restants, et en comparant les estimations de prévalence du modèle aux données observées (figure 3). La figure 4 montre la prévalence moyenne dans chaque pays à partir de toutes les études tracées contre l'estimation du modèle. La figure 5 montre les distributions marginales et conjointes postérieures des paramètres ajustés. Le tableau 1 donne les valeurs estimées des paramètres avec les intervalles de confiance associés. </p> <p>Lors de l'exercice de validation (au cours duquel les pays ont été consultés au sujet de leurs estimations), il a été souligné que la Chine avait entrepris trois enquêtes sérologiques en population de très grande envergure afin d'établir la prévalence de base et les progrès vers l'élimination du VHB. Il y avait un grand nombre d'autres enquêtes en Chine, qui sont moins représentatives que ces trois enquêtes nationales. Nous avons effectué une analyse de sensibilité en limitant les données de la Chine aux trois enquêtes représentatives au niveau national. Cette modification des données d'entrée a eu pour effet de rendre plus net l'effet de la vaccination, mais les effets estimés sur l'âge (changement de la prévalence chez les enfants de moins de 5 ans ou les jeunes (enfants de 5 à 15 ans)) n'étaient plus significativement différents de zéro (voir tableau 2 et figure 6). La déviance était significativement réduite, ce qui suggère un modèle beaucoup mieux ajusté (tableau 2), bien que sur un ensemble de données quelque peu réduit. </p> 2 years ago
deblsyl Translation changed SDG Metadata 3-3-4 French	English <p>The data was modelled using a Bayesian logistic regression looking at the proportion of individuals that tested positive for HBsAg in each study, weighting each study by its size and using a conditional autoregressive (CAR) model accounting for spatial and economic correlations between similar countries. This model uses data from well sampled countries to estimate prevalence in more data poor countries with effects such as sex, age and vaccination status, these are also informed by the geographic and countries GDP proximity to other countries (CAR model). Under the assumption that countries that are close together economically and/or geographically will have more similar prevalence due to similar social structure and health care capabilities. </p> <p>The response variable in the model was the prevalence of Hepatitis surface antigen (HBsAg) with the explanatory variables being age (three categories, under 5, juvenile (5-15) and adult (16+), split using the average age of participants in the study), sex (proportion female in the study), study bias (e.g. a high fraction of study participants from indigenous populations), 3 dose vaccine coverage, birth dose of the vaccine and country of study. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The WHO-UNICEF estimates are annual data for the country as a whole, and did not contain information on vaccine efficacy which was not used in the analysis as no data on this was obtained. The vaccine efficacy would be implicitly estimated in the analysis as we see vaccination having a variable effect across time and space across the studies. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. More explicitly, the model uses the ages and timing of the study to calculate the years across which the participants are born, so if the if there was an age group range of 10-15 in a study that was undertaken in 2015, the birth years would be from 2000-2005, we then average the vaccination coverage from the WHO-UNICEF estimates across those 5 years assuming that each age was evenly represented in that age group in the study. The same process was used for the 3 dose and birth dose vaccination. </p> <p> </p> <p>The general logistic model equation is described below, </p> <p>Yi ~Binomial (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p> <p> </p> <p>Where βj are the fixed effects of the explanatory variables xii. With the spatial random effects described by </p> <p>ui~ N(u−i,σ2u/ni)</p> <p> , </p> <p>where, </p> <p>u−i= ∑j ∈ neigh(i)wiuj/ni</p> <p>Where ni is the number of neighbours for country i and weights wi, are 1. </p> <p> </p> <p>The model was simulated in the Bayesian statistical package WinBUGS, and data manipulation and model initialisation run from R (3.3.1) using R2WinBUGS. The model considers the parameters of age, sex, study bias (e.g. a high fraction of study participants from indigenous populations), vaccine coverage, birth dose of the vaccine and country of study. </p> <p>The model uses the CAR-normal function, in WinBUGS, to model the spatial and economic autocorrelation related to neighbouring countries. For each country that had prevalence data, a weighted central position was calculated using the size and location of each study. For those countries with no data, we used the population centroid. In a novel approach, we considered 3 dimensions in the country adjacency matrix; we used the usual geographic dimensions, latitude and longitude and also combined these with the natural log of the country’s GDP per capita. This was to measure not only geographic but also the developmental proximity of countries. The adjacency matrix for the geo-economic distance gives a score between each country to every other country. Those countries which are close geographically and economically would have a low score and those further apart either geographically or economically would have a high score/distance. Therefore, those countries that are more alike will have a low score and those countries which are alike would have a high score. </p> <p>The way we proportioned the geographic and economic distance to produce the adjacency matrix was then explored, this is because geographic distance may be more or less important than economic similarities. Thus, by creating a number of different adjacency matrices (not definitive) we could select the most suitable matrix that explains reality best. We normalised the geographic and GDP distance and then calculated the distance between these two normalised figures. This creates a smoothed Gaussian surface that is dependent on both spatial proximity and GDP per-capita proximity. We compared ratios of, 1:0, 1:1, 2:1, 1:2 (Geographic:GDP). </p> <p>For each different adjacency matrix, we also had to select a neighbourhood distance, i.e. over what distance can a country be effected by another. Thus, we also varied the radius of distance from which to select neighbours for the neighbourhood network, we used the maximum minimum distance, twice the maximum minimum and three times the maximum minimum, thus varying the number of neighbours each country would have. </p> <p> </p> <p>Finally, to decide the magnitude of the effect one country has on another in the neighbourhood network we varied the weights of pairs of countries in the adjacency matrix, using either a neutral weighting of 1, so that each neighbour has an equal effect on each other (not dependent on the distance in the network), or decaying weights over distance with 1/distance, and 1/distance2, where the closer the country is the greater the effect it has on another country. The outcome of these 36 different combinations led to minimum DIC (Deviance Information Criterion) being found for a ratio of 1:2 (Geographic:GDP), the neighbourhood networks minimum distance being twice the maximum minimum distance and an even weighting of 1/distance for each adjacent country. </p> <p>This model structure produces estimates for all fixed effects and also individual country level risk, this provides information on which are significantly at greater or lower risk to the average risk. </p> <p>All parameters were given un-informative priors. Simulations were run with 3 MCMC chains with 50,000 burn in iterations and each parameter estimated from 1000 samples taken from a thinned 250,000 iterations to produce the posterior distribution. Convergence was attained, with r̂ values all very close to 1.000. Due to the Bayesian framework and WinBUGS software it was possible to gain estimates for countries where we had no data on prevalence, using their GDP and geographic proximity to inform this estimate. Those countries with the largest number of studies provided the estimates with the tightest confidence intervals and those with few or no data were less well defined, often producing a log normal distributed posterior distribution, giving estimates with long tails. </p> <p>Posterior distributions of parameters were inspected for convergence and to check for covariance between parameters. Where necessary parameters were centred and scaled to N (0, 1) to aid parameter convergence and remover covariance. This was done for the sex parameter, which was entered as the proportion of the sample that was female; this was seen to co-vary with the intercept and bias parameters before re-centring and scaling. However, the covariance of routine vaccination and birth dose persisted even after re-centring. This is in part unsurprising as there a few instances where birth dose is administered without the routine vaccination. Here we tried to reduce this interaction of the terms by transforming the birth dose data. We modelled birth dose using only data where the birth dose was greater than 60, 70, 80 & 90% respectively, we also modelled birth dose to the square, thus increasing the effect of high birth doses over smaller doses. Model selection dependent on which one both reduced the covariance between the parameters and returned the lowest DIC score. </p> <p>Model validation was conducted using 90% of randomly selected data against the remaining 10%, and by comparing model estimates of prevalence against observed data (Figure 3). Figure 4 shows the average prevalence in each country from all the studies plotted against the models estimate. Figure 5 shows the marginal and joint posterior distributions for the fitted parameters. Table 1 gives the estimated parameter values with associated credible intervals. </p> <p>During the validation exercise (in which countries were consulted over their estimates) it was pointed out that China had undertaken three very large-scale population-based serological surveys in order to establish baseline prevalence and progress towards HBV elimination. There were a large number of other surveys from China, that are less representative than these three nationwide surveys. We conducted a sensitivity analysis by restricting the data from China to the three nationally representative surveys. The effect of this change in input data was that the effect of vaccination was more distinct, but the estimated age effects (change in prevalence in children under 5, or juveniles (children 5-15 years)) were no longer significantly different from zero (see Table 2 and Figure 6). The deviance was significantly reduced, suggesting a much better fitting model (Table 2), albeit on a somewhat reduced dataset. </p> French 4786 characters edited <h1>Méthodologie</h1> <h2>Méthode de calcul :</h2> <p>Les données ont été modélisées à l'aide d'une régression logistique bayésienne examinant la proportion d'individus testés positifs pour l'HBsAg dans chaque étude, en pondérant chaque étude par sa taille et en utilisant un modèle autorégressif conditionnel (CAR) tenant compte des corrélations spatiales et économiques entre des pays similaires. Ce modèle utilise des données provenant de pays bien échantillonnés pour estimer la prévalence dans des pays pauvres en données, avec des effets tels que le sexe, l'âge et le statut vaccinal, qui sont également informés par la proximité géographique et le PIB des pays par rapport aux autres pays (modèle CAR). En partant de l'hypothèse que les pays qui sont proches économiquement et/ou géographiquement, auront une prévalence plus similaire en raison de leur structure sociale et de leurs capacités en matière de soins de santé. </p> <p>La variable de réponse dans le modèle était la prévalence de l'antigène de surface de l'hépatite (HBsAg), les variables explicatives étant l'âge (trois catégories, moins de 5 ans, jeunes (5 à 15 ans) et adultes (16 et +), réparties en fonction de l'âge moyen des participants à l'étude), le sexe (proportion de femmes dans l'étude), le biais de l'étude (par exemple, une forte proportion de participants à l'étude issus de populations indigènes), la couverture vaccinale de 3 doses, la dose de naissance du vaccin et le pays de l'étude. La couverture de la vaccination de routine en 3 doses et de la vaccination à la naissance dans chaque étude, a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale de l'Organisation mondiale de la Santé (OMS) et de le Fonds des Nations Unies pour l'enfance (UNICEF) pour ce pays. Les estimations OMS-UNICEF sont des données annuelles pour l'ensemble du pays et ne contiennent pas de l'informations sur l'efficacité du vaccin qui n'ont pas été utilisées dans l'analyse, car aucune donnée n'a été obtenue à ce sujet. L'efficacité du vaccin serait implicitement estimée dans l'analyse, car nous constatons que la vaccination a un effet variable dans le temps et dans l'espace selon les études. La couverture de la vaccination de routine à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale de l'OMS et de l'UNICEF pour ce pays. La couverture de la vaccination systématique par trois doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale OMS-UNICEF pour ce pays. Plus explicitement, le modèle utilise l'âge et le moment de l'étude pour calculer les années de naissance des participants. Ainsi, s'il y avait une tranche d'âge de 10 à 15 ans dans une étude entreprise en 2015, les années de naissance seraient de 2000 à 2005, nous faisons alors la moyenne de la couverture vaccinale des estimations OMS-UNICEF sur ces 5 années en supposant que chaque âge est représenté de manière égale dans cette tranche d'âge dans l'étude. Le même processus a été utilisé pour la vaccination à 3 doses et la vaccination à la naissance. </p> <p>L'équation générale du modèle logistique est décrite ci-dessous, </p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAeEAAABRCAMAAADSKe79AAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAK1UExURf////T09NTU1Nzc3Pz8/O/v79DQ0Pr6+qampnh4eHR0dMLCwpGRkXp6em1tbc/Pz+Li4snJydfX11NTU4KCgt3d3erq6m9vb6Wlpby8vFZWVr6+vvHx8X19fZ+fn3Fxcf7+/uzs7K+vr+7u7l1dXZSUlP39/WdnZ9PT01VVVaenp4yMjJaWlre3t1RUVIiIiLCwsKKiouTk5J2dnWNjY+Pj4+vr6/j4+PX19YaGhoSEhPf399/f3/Dw8Pv7+4uLi2JiYl9fX6CgoNbW1pKSkpWVla2traysrHd3d66urvb29o+Pj0pKSktLS+jo6NXV1fn5+bGxsYODg2xsbGRkZOfn59jY2GlpaYmJicjIyGZmZmFhYY2NjZmZmXZ2duDg4Lm5uc3NzbKysk9PT25ubp6entHR0cDAwPPz81tbW1dXV6GhoWtra3BwcO3t7enp6YGBgbi4uJOTk7W1tVFRUXl5eX9/f+bm5tvb27+/v7Ozs7S0tM7Ozn5+ft7e3tra2uHh4cXFxfLy8nJycnV1daOjo5CQkJubm46OjsPDw8bGxk5OTqioqJeXl3x8fFJSUlBQUMzMzKqqql5eXlhYWMHBwWpqamBgYMrKyoWFhU1NTbq6utnZ2ampqZqamkxMTFxcXOXl5cvLy3Nzc4qKimVlZVlZWba2toCAgLu7u729vaSkpNLS0qurq5iYmIeHh8fHx1paWmhoaHt7e5ycnMTExLGtrfayso9ubvze3ptUVGhnZ/vc3MllZXFvb/3y8vivr/739//+/vvX17VXV3Vqav3r69pdXWtMTP/8/NiAgJhcXOfk5P79/fi6uvixse3q6v78/LN3d6g+PvGSkoBTU8u+vp5AQOy3t/rIyPWYmOLU1JKRkYBXV/WGhui0tJ6dncXExHRjY+GEhPWQkMGysgAAAH/C7rcA <p>Where βj sont les effets fixes des variables explicatives <em>x<sub>ii</sub></em>. Avec les effets aléatoires spatiaux décrits par </p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAJsAAAAuCAMAAAAIuJt4AAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAIfUExURf////r6+vLy8vHx8e/v7/X19f7+/r+/v319faenp7CwsIiIiIaGhuXl5fz8/ODg4KSkpMDAwLu7u/39/crKylhYWLKysp2dndHR0fv7+7y8vF1dXYuLi+np6dTU1FlZWaqqqoCAgPn5+WBgYJGRkcLCwmdnZ0pKSlZWVuvr62xsbExMTI6OjuHh4bW1tc7OztPT0/b29pubm15eXtXV1VtbW8vLy9LS0mpqaoeHh+rq6pKSkk5OTk1NTaysrPf395WVlV9fX1dXV5+fn6urq3p6eomJib29vWhoaLe3t35+fnNzc+7u7tra2mNjY4KCgnBwcPT09IyMjFVVVcjIyFxcXKOjo/j4+Nvb21RUVKKiomFhYePj4+zs7N3d3aCgoHh4eFNTU3t7e6WlpcnJyVpaWtzc3OTk5N/f3+bm5szMzJiYmOjo6PDw8MXFxY2NjWZmZuLi4tDQ0JeXl2VlZVFRUdfX166uroODg2JiYo+Pj3l5eXFxcWRkZJSUlN7e3r6+vufn57i4uIqKipCQkIWFhcbGxm1tbe3t7dnZ2bq6und3d8TExHZ2doGBgVBQUHx8fK+vr5mZmX9/f7a2tqmpqaGhofPz85OTk2lpaYSEhJaWlk9PT6ioqJ6enrOzs29vb8PDw3JyclJSUpycnMfHx7S0tM/Pz2tra9jY2EtLS7GxsZqams3Nza2trcHBwXR0dKamprm5udbW1gAAAPSlTP8AAAC1dFJOU/////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////// <p>où,</p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAPQAAABNCAMAAACmNLlxAAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAIlUExURf////7+/v39/bW1tZ6enujo6I+Pj0pKSktLS01NTdXV1e/v72xsbE5OTqWlpfT09Pf39/X19dHR0WBgYL+/v1paWl9fX6Ojo3Nzc+Hh4fHx8VxcXIqKin9/f+zs7IuLi+fn52tra1FRUaurq/n5+cDAwFdXV9fX18PDw2JiYmVlZc3Nzevr68XFxfj4+KqqqmZmZubm5oCAgIiIiPDw8HR0dFRUVK6urtPT08nJyVBQUOnp6e3t7UxMTJCQkO7u7sfHx7q6unp6eqKiol5eXuXl5ampqVJSUpeXl/r6+l1dXc/Pz6+vr9nZ2bS0tNLS0vz8/LGxsVZWVn5+foKCgtbW1ry8vPb29uPj43FxcaioqLm5ucrKyvv7+8bGxq2trbCwsLu7u8zMzM7OzuLi4o2NjU9PT2dnZ8jIyGNjY2RkZFlZWdTU1MTExPLy8m1tbZSUlODg4IWFhXV1dWhoaJWVlVhYWFVVVcHBwaGhoVtbW2FhYXd3d8LCwri4uIyMjKysrJGRkYSEhHx8fJaWloODg/Pz825ubnBwcIeHh6SkpH19fXZ2dp2dnXl5eVNTU5ycnN3d3W9vb4aGhtvb23h4eOrq6rOzs5mZmaamptDQ0Gpqat7e3t/f35iYmI6OjomJidjY2Kenp76+vre3t2lpaXt7e3JycuTk5JOTk7Kyspqampubm7a2tpKSktra2svLy6CgoIGBgb29vZ+fn9zc3AAAAEw+Zl4AAAC3dFJOU/////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////// <p>où <em>n<sub>i</sub></em> est le nombre de voisins pour le pays <em>i</em> et les poids <em>w<sub>i</sub></em>, sont 1. </p> <p>Le modèle a été simulé dans le progiciel statistique bayésien WinBUGS, et la manipulation des données et l'initialisation du modèle ont été effectuées à partir de R (3.3.1) en utilisant R2WinBUGS. Le modèle prend en compte les paramètres de l'âge, du sexe, du biais de l'étude (par exemple, une forte proportion de participants à l'étude issus de populations indigènes), de la couverture vaccinale, de la dose de naissance du vaccin et du pays d'étude. </p> <p>Le modèle utilise la fonction CAR-normale, dans WinBUGS, pour modéliser l'autocorrélation spatiale et économique liée aux pays voisins. Pour chaque pays disposant de données de prévalence, une position centrale pondérée a été calculée en utilisant la taille et la localisation de chaque étude. Pour les pays ne disposant pas de données, nous avons utilisé le centroïde de la population. Dans une nouvelle approche, nous avons pris en compte trois dimensions dans la matrice de contiguïté des pays ; nous avons utilisé les dimensions géographiques habituelles, la latitude et la longitude, et les avons également combinées avec le logarithme naturel du PIB par habitant du pays. Il s'agissait de mesurer non seulement la proximité géographique, mais aussi la proximité de développement des pays. La matrice de proximité pour la distance géo-économique donne un score entre chaque pays et chaque autre pays. Les pays qui sont proches géographiquement et économiquement ont un score faible et ceux qui sont plus éloignés géographiquement ou économiquement ont un score/distance élevé. Par conséquent, les pays qui se ressemblent le plus auront un score faible et les pays qui se ressemblent un score élevé. </p> <p>La façon dont nous avons proportionné la distance géographique et économique pour produire la matrice de contiguïté a ensuite été explorée, car la distance géographique peut être plus ou moins importante que les similitudes économiques. Ainsi, en créant un certain nombre de matrices de contiguïté différentes (non définitives), nous avons pu sélectionner la matrice la plus appropriée qui explique le mieux la réalité. Nous avons normalisé la distance géographique et la distance du PIB, puis nous avons calculé la distance entre ces deux chiffres normalisés. Cela crée une surface gaussienne lissée qui dépend à la fois de la proximité spatiale et de la proximité du PIB par habitant. Nous avons comparé les ratios de, 1:0, 1:1, 2:1, 1:2 (Géographique:PIB). </p> <p>Pour chaque matrice de proximité différente, nous avons également dû sélectionner une distance de voisinage, c'est-à-dire sur quelle distance un pays peut être affecté par un autre. Ainsi, nous avons également fait varier le rayon de la distance à partir de laquelle sélectionner les voisins pour le réseau de voisinage, nous avons utilisé la distance minimale maximale, deux fois la distance minimale maximale et trois fois la distance minimale maximale, faisant ainsi varier le nombre de voisins que chaque pays aurait. </p> <p>Enfin, pour décider de l'ampleur de l'effet d'un pays sur un autre dans le réseau de voisinage, nous avons fait varier les poids des paires de pays dans la matrice de contiguïté, en utilisant soit un poids neutre de 1, de sorte que chaque voisin a un effet égal sur l'autre (ne dépendant pas de la distance dans le réseau), soit des poids décroissants sur la distance avec 1/distance, et 1/distance2, où plus le pays est proche, plus l'effet qu'il a sur un autre pays est important. Le résultat de ces 36 combinaisons différentes a permis de trouver un DIC (Deviance Information Criterion) minimum pour un rapport de 1:2 (Géographie:PIB), la distance minimum des réseaux de voisinage étant le double de la distance minimum maximum et une pondération égale de 1/distance pour chaque pays adjacent. </p> <p>Cette structure de modèle produit des estimations pour tous les effets fixes et aussi pour le risque au niveau de chaque pays, ce qui fournit des informations sur ceux qui sont significativement plus ou moins exposés au risque moyen. </p> <p>Tous les paramètres ont été donnés des antécédents non informatifs. Des simulations ont été effectuées avec 3 chaînes MCMC avec 50 000 brûlures en itérations et chaque paramètre a été estimé à partir de 1000 échantillons prélevés sur 250 000 itérations diluées pour produire la distribution postérieure. La convergence a été atteinte, avec r&#x302 ; des valeurs toutes très proches de 1.000. Grâce au cadre bayésien et au logiciel WinBUGS, il a été possible d'obtenir des estimations pour les pays où nous ne disposions pas de données sur la prévalence, en utilisant leur PIB et leur proximité géographique pour étayer cette estimation. Les pays ayant réalisé le plus grand nombre d'études ont fourni les estimations avec les intervalles de confiance les plus étroits et ceux qui n'avaient que peu ou pas de données étaient moins bien définis, produisant souvent une distribution postérieure log-normale, donnant des estimations avec de longues queues. </p> <p>Les distributions postérieures des paramètres ont été inspectées pour vérifier la convergence et la covariance entre les paramètres. Le cas échéant, les paramètres ont été centrés et mis à l'échelle N (0, 1) pour faciliter la convergence des paramètres et la covariance de la suppression. Cela a été fait pour le paramètre du sexe, qui a été saisi comme la proportion de l'échantillon qui était féminine ; on a constaté qu'il variait avec les paramètres d'interception et de biais avant de recentrer et de mettre à l'échelle. Cependant, la covariance de la vaccination de routine et de la dose à la naissance a persisté même après le recadrage. Cela n'est pas surprenant car il y a eu quelques cas où la dose à la naissance a été administrée sans la vaccination de routine. Nous avons essayé ici de réduire cette interaction des termes en transformant les données relatives à la dose de naissance. Nous avons modélisé la dose de naissance en utilisant uniquement les données où la dose de naissance était supérieure à 60, 70, 80 &amp ; 90% respectivement, nous avons également modélisé la dose de naissance au carré, augmentant ainsi l'effet des doses de naissance élevées par rapport aux doses plus faibles. Le choix du modèle dépendait de celui qui réduisait la covariance entre les paramètres et donnait le score CIVD le plus bas. </p> <p>La validation du modèle a été réalisée en utilisant 90 % des données sélectionnées au hasard par rapport aux 10 % restants, et en comparant les estimations de la prévalence du modèle aux données observées (figure 3). La figure 4 montre la prévalence moyenne dans chaque pays à partir de toutes les études tracées par rapport à l'estimation du modèle. La figure 5 montre les distributions marginales et articulaires postérieures pour les paramètres ajustés. Le tableau 1 donne les valeurs estimées des paramètres avec les intervalles crédibles associés. <p>Au cours de l'exercice de validation (dans lequel les pays ont été consultés sur leurs estimations), il a été souligné que la Chine avait entrepris trois enquêtes sérologiques à très grande échelle dans la population afin d'établir la prévalence de base et les progrès vers l'élimination du VHB. Il y avait un grand nombre d'autres enquêtes en Chine, qui sont moins représentatives que ces trois enquêtes nationales. Nous avons effectué une analyse de sensibilité en limitant les données de la Chine aux trois enquêtes représentatives au niveau national. Cette modification des données d'entrée a eu pour effet de rendre l'effet de la vaccination plus distinct, mais les effets estimés sur l'âge (changement de la prévalence chez les enfants de moins de 5 ans, ou les jeunes (enfants de 5 à 15 ans)) n'étaient plus significativement différents de zéro (voir tableau 2 et figure 6). L'écart a été réduit de manière significative, ce qui suggère un modèle beaucoup plus adapté (tableau 2), bien que sur un ensemble de données quelque peu réduit.p>Les données ont été modélisées à l'aide d'une régression logistique bayésienne examinant la proportion d'individus testés positifs pour l'AgHBs dans chaque étude, en pondérant chaque étude par sa taille et en utilisant un modèle autorégressif conditionnel (CAR) tenant compte des corrélations spatiales et économiques entre pays similaires. Ce modèle utilise les données des pays bien échantillonnés pour estimer la prévalence dans les pays plus pauvres en données avec des effets tels que le sexe, l'âge et le statut vaccinal, ceux-ci sont également informés par la proximité géographique et le PIB des pays avec d'autres pays (modèle CAR). Selon l'hypothèse que les pays proches économiquement et/ou géographiquement auront une prévalence plus similaire en raison d'une structure sociale et de capacités de soins de santé similaires. </p> <p>La variable réponse du modèle était la prévalence de l'antigène de surface de l'hépatite (AgHBs), les variables explicatives étant l'âge (trois catégories, moins de 5 ans, mineur (5-15 ans) et adulte (16 ans ou plus), réparties en utilisant l'âge moyen des participants à l'étude), le sexe (proportion de femmes dans l'étude), le biais de l'étude (par exemple, une fraction élevée de participants à l'étude provenant de populations indigènes), la couverture vaccinale à 3 doses, la dose de vaccin à la naissance et le pays de l'étude. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations de couverture vaccinale correspondantes de l'OMS-UNICEF pour ce pays. Les estimations de l'OMS-UNICEF sont des données annuelles pour l'ensemble du pays et ne contiennent pas d'informations sur l'efficacité du vaccin, celle-ci n'a pas été utilisée dans l'analyse car aucune donnée à ce sujet n'a été obtenue. L'efficacité du vaccin serait implicitement estimée dans l'analyse car nous constatons que la vaccination a un effet variable dans le temps et l'espace dans les études. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations correspondantes de la couverture vaccinale de l'OMS-UNICEF pour ce pays. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations de couverture vaccinale de l'OMS-UNICEF correspondantes pour ce pays. Plus précisément, le modèle utilise les âges et le moment de l'étude pour calculer les années de naissance des participants. Ainsi, si une étude menée en 2015 portait sur une tranche d'âge de 10 à 15 ans, les années de naissance s'étendraient de 2000 à 2005, nous avons ensuite calculé la moyenne de la couverture vaccinale à partir des estimations de l'OMS-UNICEF sur ces 5 années en supposant que chaque âge était représenté de manière égale dans cette tranche d'âge dans l'étude. Le même processus a été utilisé pour la vaccination à 3 doses et la vaccination à la naissance. </p> <p> </p> <p>L'équation du modèle logistique général est décrite ci-dessous, </p> <p>Yi ~Binôme (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p> <p> </p> <p>où βj sont les effets fixes des variables explicatives xii. Avec les effets aléatoires spatiaux décrits par </p> <p>ui~ N(u−i,σ2u/ni)</p> <p>où </p> <p>u−i= ∑j ∈ neigh(i)wiuj/ni</p> <p>où ni est le nombre de voisins pour le pays i et les poids wi, valent 1. </p> <p> </p> <p>Le modèle a été simulé dans le paquet statistique bayésien WinBUGS, et la manipulation des données et l'initialisation du modèle exécutées à partir de R (3.3.1) en utilisant R2WinBUGS. Le modèle prend en compte les paramètres de l'âge, du sexe, du biais de l'étude (par exemple, une fraction élevée de participants à l'étude provenant de populations indigènes), de la couverture vaccinale, de la dose du vaccin à la naissance et du pays de l'étude. </p> <p>Le modèle utilise la fonction CAR-normale, dans WinBUGS, pour modéliser l'autocorrélation géographique et économique liée aux pays voisins. Pour chaque pays disposant de données de prévalence, une position centrale pondérée a été calculée en utilisant la taille et la localisation de chaque étude. Pour les pays ne disposant pas de données, nous avons utilisé le centroïde de la population. Dans une approche novatrice, nous avons considéré 3 dimensions dans la matrice d'adjacence des pays ; nous avons utilisé les dimensions géographiques habituelles, la latitude et la longitude, et nous les avons également combinées avec le log naturel du PIB par habitant du pays, ceci afin de mesurer non seulement la proximité géographique mais aussi la proximité de développement des pays. La matrice d'adjacence pour la distance géo-économique donne un score entre chaque pays et tous les autres pays. Les pays qui sont proches géographiquement et économiquement ont un score faible et ceux qui sont plus éloignés géographiquement ou économiquement ont un score/distance élevé. Par conséquent, les pays qui se ressemblent le plus auront un score faible et les pays qui sont moins semblables auront un score élevé. </p> <p>On a ensuite exploré la façon dont nous avons proportionné la distance géographique et économique pour produire la matrice d'adjacence, ceci parce que la distance géographique peut être plus ou moins importante que les similitudes économiques. Ainsi, en créant un certain nombre de matrices d'adjacence différentes (non définitives), nous avons pu sélectionner la matrice la plus adaptée qui explique le mieux la réalité. Nous avons normalisé la distance géographique et la distance du PIB, puis nous avons calculé la distance entre ces deux chiffres normalisés. Cela crée une surface gaussienne lissée qui dépend à la fois de la proximité spatiale et de la proximité du PIB par habitant. Nous avons comparé des ratios de, 1:0, 1:1, 2:1, 1:2 (Géographique:PIB). </p> <p>Pour chaque matrice d'adjacence différente, nous avons également dû choisir une distance de voisinage, c'est-à-dire sur quelle distance un pays peut être affecté par un autre. Ainsi, nous avons également fait varier le rayon de distance à partir duquel sélectionner les voisins pour le réseau de voisinage, nous avons utilisé la distance minimale maximale, deux fois le minimum maximal et trois fois le minimum maximal, faisant ainsi varier le nombre de voisins que chaque pays aurait. </p> <p> </p> <p>Enfin, pour décider de l'ampleur de l'effet d'un pays sur un autre dans le réseau de voisinage, nous avons fait varier les poids des paires de pays dans la matrice d'adjacence, en utilisant soit une pondération neutre de 1, de sorte que chaque voisin a un effet égal sur les autres (ne dépendant pas de la distance dans le réseau), soit des poids décroissants sur la distance avec 1/distance, et 1/distance2, où plus le pays est proche, plus son effet sur un autre pays est important. Le résultat de ces 36 combinaisons différentes a conduit à trouver un DIC (Deviance Information Criterion) minimal pour un rapport de 1:2 (Géographie:PIB), la distance minimale des réseaux de voisinage étant deux fois la distance minimale maximale et une pondération égale de 1/distance pour chaque pays adjacent. </p> <p>Cette structure de modèle produit des estimations pour tous les effets fixes et aussi pour le risque individuel au niveau du pays, cela fournit des informations sur ceux qui sont significativement plus à risque ou moins à risque par rapport au risque moyen. </p> <p>Tous les paramètres étaient a priori non informatifs. Les simulations ont été effectuées avec 3 chaînes MCMC avec 50 000 essais par itération et chaque paramètre estimé à partir de 1 000 échantillons prélevés sur un nombre réduit de 250 000 itérations pour produire la distribution postérieure. La convergence a été atteinte, avec des valeurs r̂ toutes très proches de 1,000. Grâce au cadre bayésien et au logiciel WinBUGS, il a été possible d'obtenir des estimations pour les pays pour lesquels nous n'avions pas de données sur la prévalence, en utilisant leur PIB et leur proximité géographique pour informer cette estimation. Les pays avec le plus grand nombre d'études ont fourni les estimations avec les intervalles de confiance les plus serrés et ceux avec peu ou pas de données étaient moins bien définis, produisant souvent une distribution postérieure log normale, donnant des estimations avec de longues queues. </p> <p>Les distributions postérieures des paramètres ont été inspectées pour vérifier la convergence et pour vérifier la covariance entre les paramètres. Si nécessaire, les paramètres ont été centrés et mis à l'échelle d'une loi N (0, 1) pour faciliter la convergence des paramètres et supprimer la covariance. C'est ce qui a été fait pour le paramètre de sexe, qui a été saisi comme la proportion de l'échantillon qui était féminine; on a constaté qu'il covarie avec les paramètres d'interception et de biais avant le recentrage et la mise à l'échelle. Cependant, la covariance de la vaccination systématique et de la dose à la naissance est restée même après recentrage. Ceci n'est en partie pas surprenant car il existe quelques cas où la dose à la naissance est administrée sans la vaccination systématique. Nous avons essayé de réduire cette interaction des termes en transformant les données sur la dose à la naissance. Nous avons modélisé celle-ci en utilisant uniquement les données où la dose à la naissance était supérieure à 60, 70, 80 et 90% respectivement, nous avons également modélisé la dose à la naissance au carré, augmentant ainsi l'effet des doses à la naissance élevées par rapport aux doses plus petites. La sélection du modèle dépendait de celui qui à la fois réduisait la covariance entre les paramètres et retournait le score DIC le plus bas. </p> <p>La validation du modèle a été effectuée en utilisant 90% des données sélectionnées au hasard contre les 10% restants, et en comparant les estimations de prévalence du modèle aux données observées (figure 3). La figure 4 montre la prévalence moyenne dans chaque pays à partir de toutes les études tracées contre l'estimation du modèle. La figure 5 montre les distributions marginales et conjointes postérieures des paramètres ajustés. Le tableau 1 donne les valeurs estimées des paramètres avec les intervalles de confiance associés. </p> <p>Lors de l'exercice de validation (au cours duquel les pays ont été consultés au sujet de leurs estimations), il a été souligné que la Chine avait entrepris trois enquêtes sérologiques en population de très grande envergure afin d'établir la prévalence de base et les progrès vers l'élimination du VHB. Il y avait un grand nombre d'autres enquêtes en Chine, qui sont moins représentatives que ces trois enquêtes nationales. Nous avons effectué une analyse de sensibilité en limitant les données de la Chine aux trois enquêtes représentatives au niveau national. Cette modification des données d'entrée a eu pour effet de rendre plus net l'effet de la vaccination, mais les effets estimés sur l'âge (changement de la prévalence chez les enfants de moins de 5 ans ou les jeunes (enfants de 5 à 15 ans)) n'étaient plus significativement différents de zéro (voir tableau 2 et figure 6). La déviance était significativement réduite, ce qui suggère un modèle beaucoup mieux ajusté (tableau 2), bien que sur un ensemble de données quelque peu réduit. </p> 2 years ago
None Source string changed SDG Metadata 3-3-4 French	English 11050 characters edited <h1>Methodology</h1> <h2>Computation method:</h2> <p>The data was modelled using a Bayesian logistic regression looking at the proportion of individuals that tested positive for HBsAg in each study, weighting each study by its size and using a conditional autoregressive (CAR) model accounting for spatial and economic correlations between similar countries. This model uses data from well sampled countries to estimate prevalence in more data poor countries with effects such as sex, age and vaccination status, these are also informed by the geographic and countries GDP proximity to other countries (CAR model). Under the assumption that countries that are close together economically and/or geographically will have more similar prevalence due to similar social structure and health care capabilities. </p> <p>The response variable in the model was the prevalence of Hepatitis surface antigen (HBsAg) with the explanatory variables being age (three categories, under 5, juvenile (5-15) and adult (16+), split using the average age of participants in the study), sex (proportion female in the study), study bias (e.g. a high fraction of study participants from indigenous populations), 3 dose vaccine coverage, birth dose of the vaccine and country of study. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The WHO-UNICEF estimates are annual data for the country as a whole, and did not contain information on vaccine efficacy which was not used in the analysis as no data on this was obtained. The vaccine efficacy would be implicitly estimated in the analysis as we see vaccination having a variable effect across time and space across the studies. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. More explicitly, the model uses the ages and timing of the study to calculate the years across which the participants are born, so if the if there was an age group range of 10-15 in a study that was undertaken in 2015, the birth years would be from 2000-2005, we then average the vaccination coverage from the WHO-UNICEF estimates across those 5 years assuming that each age was evenly represented in that age group in the study. The same process was used for the 3 dose and birth dose vaccination. </p> <p> </p> <p>The general logistic model equation is described below, </p> <p><img src="data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAeEAAABRCAMAAADSKe79AAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAK1UExURf////T09NTU1Nzc3Pz8/O/v79DQ0Pr6+qampnh4eHR0dMLCwpGRkXp6em1tbc/Pz+Li4snJydfX11NTU4KCgt3d3erq6m9vb6Wlpby8vFZWVr6+vvHx8X19fZ+fn3Fxcf7+/uzs7K+vr+7u7l1dXZSUlP39/WdnZ9PT01VVVaenp4yMjJaWlre3t1RUVIiIiLCwsKKiouTk5J2dnWNjY+Pj4+vr6/j4+PX19YaGhoSEhPf399/f3/Dw8Pv7+4uLi2JiYl9fX6CgoNbW1pKSkpWVla2traysrHd3d66urvb29o+Pj0pKSktLS+jo6NXV1fn5+bGxsYODg2xsbGRkZOfn59jY2GlpaYmJicjIyGZmZmFhYY2NjZmZmXZ2duDg4Lm5uc3NzbKysk9PT25ubp6entHR0cDAwPPz81tbW1dXV6GhoWtra3BwcO3t7enp6YGBgbi4uJOTk7W1tVFRUXl5eX9/f+bm5tvb27+/v7Ozs7S0tM7Ozn5+ft7e3tra2uHh4cXFxfLy8nJycnV1daOjo5CQkJubm46OjsPDw8bGxk5OTqioqJeXl3x8fFJSUlBQUMzMzKqqql5eXlhYWMHBwWpqamBgYMrKyoWFhU1NTbq6utnZ2ampqZqamkxMTFxcXOXl5cvLy3Nzc4qKimVlZVlZWba2toCAgLu7u729vaSkpNLS0qurq5iYmIeHh8fHx1paWmhoaHt7e5ycnMTExLGtrfayso9ubvze3ptUVGhnZ/vc3MllZXFvb/3y8vivr/739//+/vvX17VXV3Vqav3r69pdXWtMTP/8/NiAgJhcXOfk5P79/fi6uvixse3q6v78/LN3d6g+PvGSkoBTU8u+vp5AQOy3t/rIyPWYmOLU1JKRkYBXV/WGhui0tJ6dncXExHRjY+GEhPWQkMGysgAAAH/C7rcAAADndFJOU///////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////ALLDDRIAAAAJcEhZcwAAIdUAACHVAQSctJ0AAAsnSURBVHhe7Zw7suO4FYa1CcQOEDHCNhCwvABUIfJunAG7wA7cE3Xg6nE5tGvK7Qk6sMv78P+fA4pvSrp69IwaX7d4KYokQBycBw4gnRqNRqPRaDR+AKwxJ5tMfdd4O2z2ITkfmojfFZNM54z1sb5vvB+lLyfrc33XeD+8t03C74ztYKBNSPVt4+0wHdTXufqu8X7kzuWYbX3XeD9iMNY2Ab8vthnoN8cG35Idb401ppnoRqPRaDQa74txXeV1EzzW1yKXtDmmx5N8jL5k35X8unGLdX3fu5Ln/0LfNwk/HptOmalhX9+/CEizW46TTOhb/uMpuITGrdrzquGp6breLcuKTYefgvUGDV5kP71sHq90PaeVZqSmw0/BBGhPp5I15VUpJrribuH5ZbK48XAiJBx0Ldwrp3ksXHF4XXE/MDYEKI87sbHz4I5fgekQTzcRP5+C8MZ2vnCSxwR1x69hyxU3Ho71dMFRZ/HSSxcu2wg7/coCvy/mpoRDek5EVF7rGK3/jiI2oP658NDm+uhkfis7eWtzuGWxkk3uYOb842Pae1Zc2Ox9vFFcBtHWXpG2OO/Shx/lIjAgbHK4iq1gwMKqBS8ysdf3Qjt/mtiPY89cRyt7RHWQNp5r4/av4BLkj4FudlyPfUzoSum222K/OuKKNz+GCY/J97fGBdc/uQ2SVDNdHK8ZFySYrvM+yPNYPznjmMXC74mE04UIx3adnMy4d8DvxqHhw5pIram7N2I9DTy/wLDG7stp3xXLCB3NX99eh+lviNyiSDhO1aGEzqPYEtlhUbt8X5JtIuGLWheC2pIwOspU01BrPq7D5sPfAixSm7Qt4YOIma54q7pWuumtKZCbekRhdyjT/oVBY0IL2+hVwtgyXU83jJc9Zwu4J7vno/XA+bD+HSWctOvxA64tXXt2FC0h71SHoTV1b4nqMO+m99FbflR21+Gk67lllko40GEKZdMVq9ta2AR9ouGxNpD19SN6/t4FpgsL48mcLYTq0FvPEsalVCvokxs8ivHYk7ipdNljN0H3e4dHt8wnGId3gZZ9lHBUdeSUGp4XrPp8iKajEk90eKc5gWfHM6hQr+FbRIm480EzX4dJE8Z6CB2kZFWRVxxKeMcVS5Ithbknyp5OM3erWamBuQ6bGKQl87bthvlIbt4j+FQpOgxUjOiSCoZiTl2QOVapVcgy3cq6d67EPoRYHA26Dbhf9DklOXOUcFBZmcxopfR+NRRizok9a6rDuH6n4ajDKXS5FM8+DWfCTnZ/WJql9ymTnkbgAG2OcXigOccSxnOss5d4YFtinF9ninXeFs/Zzm3mOlySoXmwe6qQVdM2QZTPSEtdo0oYNxHDHqXD4ICVbBGEwi0sAky25AR5jfjQs4QhN62CFe3rN4qFP2Cv0nimstM11Q/XasDW4O64Ju8p/A3Q6FUvAupBhZ29+LW1hdrjf5+53asAdGlVuYRGMH49IsxdgSVdtw9KYgkFtpIl1mOUAL/ZuKPzaQjyNoaXkHAA0mM6kTBvShtRY3CxMkUqLl9wtyJh7WEIyecSFvETca06ppqXaTvPyZisOlw/K7SMW0CH61PREIllt1HqYh2rfSsHQ+8KKo5z0irOgfrABsNHcDsxP3PyekSaqfbo8PIQkplQTF8dJ7rZ5A+IsgoIJWEjl8lB3gb+jfvjqQOigcBsDDzVShsZrqkOs1xGfvDQUh8OV1XuTiTMw+qHI3pGxwsnOlw7meiwTpLmeWMxpkNHQLkorOr4UMEVuAskLLsOZWT4iqIOnJY0uo3XMWPTyE3qawJ7ILby7Lbk0SGYVBL8TsQ2rZtRgaEZRVhhvdlC2pZVAYAWJDviyvBH38OEowz0Ff45lyT9XEwrFWJR6WrnwKp4HJJIC22H8lTCvCkXSgzSYqde6TAl7BCRGwlJRgkPoYOhBzVipecSph/GBR16B1qkxiW7gzXVYdmlDrsOXeqsh7x2/cKWO/p3+W8gV50mjBxHUGduO3ZjV4wfml059sNiZxagFblVOU89Qj5bgqqRc+EsYmkd7LheH21+KqgFa/ZyQZUwzP5gpfkM1GFN5KtEZzqMLSMtbXpZUjFGWnoNzRwrOLFZ52eTqsLedvLk3B+u3xgJMBdSGwf9jUHL9nDhVgoTefXfXMIaEiTWLktzzNvsUMJbS3fUsEL2rLcZTULCSEbeVMu9/FLMQsLiNhDvyl1WRhquVm6ydi6A1tJahMSo+lyH8bDe2ASfyXvzDirhwQ9DwsYaaf9RwnW0hB7DIzDG5pTFVOPWQjVOGFhQh9Vqwsfx7/mcEVoCROQJ5UiJCO4RVtYPn4KjDFEhbCmbhWM70mELLVk9AFQVLWnhXrBfn5OnYrxaMCbAoyT1tYmNP2EhYUQqNjuHKJUGdfYRQGtKNSGWdQ0YSwevy3vnfpgxTQddY7VRGxyVWF1clFjp0uPCMPPDqBhvRF1mURFDL1l4MdgXoDqMTk3TwC7DN3y6aslm8INJNSKjD9R1uNfjQbcNMWKwil1uDIeFI0cS1lHIEgx5XXS0jkCaAiAOKdw4FlMVX4OoM4ucFtwGRtQuOFgcO+91KNl7TTirei6w0XtXE9IMRIwYLbggHkjR68AwSe/MPM3yLCvju+QwouYJMueu1KBRr7fZ589/wWN9+mkIMfRKVBkj9E8//8Gevnz+8uc/8djgcKdEaV8TNclspKGGCJCso8o7SSEmNAcLEI+8lHA1URugz258BqGYPKTIzz/FlJgyPhVppKT9eqGzVMe6J3DsTOFQAvtT33n3kwdyXsw68Omv/zl9+flv8/pX/v6TOX39bHX0qdbjiBpyn+eiaLvr7qOYaIHEhMulIvstiOCx7s2gnxmwW7MyWS23WsmRg4BjNsMwQ5IQz8aWea8/nf7xz0/fftmuVPnX13//OqQD9meYBmAHY85e0zNobQfv8mAJ1/YmMmNgFpHWLnSUdXfKrNtuGVEb1bpNxlGXWOrQSPDlkpY8AsQMs1Zxv3z7ujOfnsJ/v/0vuD9y314x546AcMhQA9j5Yensw5g2NG1eudjtFPjJzZpoxFmZzf4MOC/rfqcpvmMQH+zJ0V3Wkodgy+xBJJbehu59N32wCWzX9BnGEG8bUwauLGX2o4Uxp/lQapdtJwxmFtVtWDKbZbi2cm4HuP1zHx2WXIcVFd3muvbb54IOi85rAnC/m81YDEqvbTE44e0zp8kJCc5XaLC4M5e1yYNyAr8PajJwB+sLYmHLVPNz2wRj2rp3QE2ob6ITNY01Uytt8si5KZmxOGeAnwVGtitTIhneKQgod1eV5vY7PntMrXSqeWZyNnkZAYymmqEoT/paMQbyq7GgXaSowIFt/ZHM7o1MJQz3NFKPQcJ41Shoa2rtEeSNafDzNGrjPi7F0pJFcofO+l6sLJHgjrywxca6azxz4zKXxsOc+arzOqe0szLnTmzoXeRktb506yZz94172JismMHwlbNnNNM3rU+9GvSfba4cnjUOMJmrQrmccA+ZqoAMZGZl+HGAx5Iw2t6kSfh+6vDoQMJJVuGYLIq+nMx/DNMx2oynuITGETXF33hbdOlB430JPj/DEZO4mjRqKarvQDmKye5jucTRyIq2xtuwnILKfveLWI3fI1bXozOfpTktY58Ttze+F5lp0eyc83iJr28Sfi+cLO7n76QMXzrQ9eWNN8HWJeAyu0Uz3XT4zdAVt7TSRHJZ6++ONX7H6FJnaxJ/0ErD6qbDbwXXkcywxXfP/P2sxotZ/Sg9A66rl2k2fuvYsvVdlcbbYMJTFhY0fju0dZKNRqPRaDQab8np9H9W79A5h1K8JwAAAABJRU5ErkJggg=="></p> <p>Where βj are the fixed effects of the explanatory variables <em>x<sub>ii</sub></em>. With the spatial random effects described by</p> <p><img src="data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAJsAAAAuCAMAAAAIuJt4AAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAIfUExURf////r6+vLy8vHx8e/v7/X19f7+/r+/v319faenp7CwsIiIiIaGhuXl5fz8/ODg4KSkpMDAwLu7u/39/crKylhYWLKysp2dndHR0fv7+7y8vF1dXYuLi+np6dTU1FlZWaqqqoCAgPn5+WBgYJGRkcLCwmdnZ0pKSlZWVuvr62xsbExMTI6OjuHh4bW1tc7OztPT0/b29pubm15eXtXV1VtbW8vLy9LS0mpqaoeHh+rq6pKSkk5OTk1NTaysrPf395WVlV9fX1dXV5+fn6urq3p6eomJib29vWhoaLe3t35+fnNzc+7u7tra2mNjY4KCgnBwcPT09IyMjFVVVcjIyFxcXKOjo/j4+Nvb21RUVKKiomFhYePj4+zs7N3d3aCgoHh4eFNTU3t7e6WlpcnJyVpaWtzc3OTk5N/f3+bm5szMzJiYmOjo6PDw8MXFxY2NjWZmZuLi4tDQ0JeXl2VlZVFRUdfX166uroODg2JiYo+Pj3l5eXFxcWRkZJSUlN7e3r6+vufn57i4uIqKipCQkIWFhcbGxm1tbe3t7dnZ2bq6und3d8TExHZ2doGBgVBQUHx8fK+vr5mZmX9/f7a2tqmpqaGhofPz85OTk2lpaYSEhJaWlk9PT6ioqJ6enrOzs29vb8PDw3JyclJSUpycnMfHx7S0tM/Pz2tra9jY2EtLS7GxsZqams3Nza2trcHBwXR0dKamprm5udbW1gAAAPSlTP8AAAC1dFJOU////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////wChHAOwAAAACXBIWXMAACHVAAAh1QEEnLSdAAADnElEQVRYR+1XO5LtKgx0TsYKlLEZZeRaABH7IGPFt/XB9vH4zOfOq1c3cE/VGJufpG4JzvbgwYMHDx48ePBfgTfmaP5ryIMojf/POqEcra+Radtaxb/PMVs0folc08/iICfbeNzaST1F6yfIvRQ1pfWSRD9Qt6hJc9i3T8GzHoNyvY9Q6z902DBLMVdntcmtTn1sNAL29hmyO+MY77Qn3df9Ecaouj8nj/pwE7+PF7Wd6b1g9j26LLZHPD5BpVEwi4f51WoIQ3yi3HPKYkALcT7tMI1S2xRD/Fvg8CGnrnZCC19kSCttFpgl3QaGdpiGGcmj6+sFbY6q0GnqkixSpYMCpoRsklF9xQXusRQnSQUz+EuKqHIrEIn4wOSPTFhbfTO+L6BaRq7T8oQKJLknYVbpCsGj3CmV17lGjyJvYduL3zclPHXmghBnG8jJxwvDKzybhvQC9IzGwdDsFX9rUFKWWLbR55B8sS2VPY5mppz95gwPs5rH9t+giZhq3qblOHyJHqeA1MELpikshbTZYE0QHLt1FUQrK5yOua8lFrHm781GUSe4OfBl7hZLh/8NVOhTLVo9+g2WmwWcTsoJd43yCxp8VBgRTrAqPyw/2WZanh5H0mjw0IDPWupJpc1YqF182SNuZHKzhPJBC5Fvd7ZFidSI4QowXV/rI2yxiUBWq6R6hwfdxwglOpbNqipIgZyiQ5/QoVLqTPtMR5QJuOPvBzjKtkdopeE++dDbxEnEqWqZ5vn+qHV2G0LpW0WeQjKY2ZJKhmke8ly2ZQtNnpiFvPQeWuEd2rB6onuHD5xWnvIojRMhg2D30sFHRMUVHKb+HkRo8WBJmgooL9aJSJkNWReTrtvPrjTNkAG0uhrqoKY4zKdlEaZ4Q+lAamM4QWWyHLqCIR5bL61asZ8LA/Mp14GQiwkFHNkuWrxoWOo0URZTiH2vN83YQs4QelA/19clNxhMYCJTxoKWCncAKa69tg4eyMD9bETNFlE3tRNxsw6cApNCsThUwL6bdHDm9z+2vXkvCafz9IwRsfgOXs9Hg5N2Jwy1OjI89HVFiEZdi8YrGJy8CdwN4v52gM011rp4hWa1l0DV4Z1wQk4My29NwMVFmf0u8jiXWqzbqbXbnyyM2xqk10yzVnQ+QKpkrEbjAxsO0ayI9ndw+b2AJPAb8QdojdJ80eEv17gDvjdDu2+wH3h/h09ma5d3vxv0u60fPHjw4MGvsW1/AGGYQZ8WYoN2AAAAAElFTkSuQmCC"></p> <p>where,</p> <p><img src="data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAPQAAABNCAMAAACmNLlxAAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAIlUExURf////7+/v39/bW1tZ6enujo6I+Pj0pKSktLS01NTdXV1e/v72xsbE5OTqWlpfT09Pf39/X19dHR0WBgYL+/v1paWl9fX6Ojo3Nzc+Hh4fHx8VxcXIqKin9/f+zs7IuLi+fn52tra1FRUaurq/n5+cDAwFdXV9fX18PDw2JiYmVlZc3Nzevr68XFxfj4+KqqqmZmZubm5oCAgIiIiPDw8HR0dFRUVK6urtPT08nJyVBQUOnp6e3t7UxMTJCQkO7u7sfHx7q6unp6eqKiol5eXuXl5ampqVJSUpeXl/r6+l1dXc/Pz6+vr9nZ2bS0tNLS0vz8/LGxsVZWVn5+foKCgtbW1ry8vPb29uPj43FxcaioqLm5ucrKyvv7+8bGxq2trbCwsLu7u8zMzM7OzuLi4o2NjU9PT2dnZ8jIyGNjY2RkZFlZWdTU1MTExPLy8m1tbZSUlODg4IWFhXV1dWhoaJWVlVhYWFVVVcHBwaGhoVtbW2FhYXd3d8LCwri4uIyMjKysrJGRkYSEhHx8fJaWloODg/Pz825ubnBwcIeHh6SkpH19fXZ2dp2dnXl5eVNTU5ycnN3d3W9vb4aGhtvb23h4eOrq6rOzs5mZmaamptDQ0Gpqat7e3t/f35iYmI6OjomJidjY2Kenp76+vre3t2lpaXt7e3JycuTk5JOTk7Kyspqampubm7a2tpKSktra2svLy6CgoIGBgb29vZ+fn9zc3AAAAEw+Zl4AAAC3dFJOU///////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////ABGphX4AAAAJcEhZcwAAIdUAACHVAQSctJ0AAAZkSURBVHhe7VpLluMqDM3My4FzWIDWIjbBhE0wY7nvSgI7iXFVknKq/Vy53ZX4Q2xd9EEgLh988MEHH3zwgYLrNqi1OR3CpEirf0BpbU4H8mDs5MBO+2fE9agnZ0SEUtOAXj2xpi8EdpNf86N0YtLm1nkdtMKJzRs67W59C05n1rQGLc/tZAbF0w5ZAnLi1qemOEIeu/W5UcA6ub/GWtx6NFqfG3/SrUlG6/CbrJn/fR+TBLNfnFhRyt/lAWJ9htCu7I6ykYS/Ce57JoU73ieWA+tfG7coHyRuytTjt1gX/33YjKxpIkV+Y0JMHrpeJ+HfgZj1R8SSuEZ2s4gQ19TJK7Gdvkga0NLsBiXkNAnr4gdTn3iDn2gKj4dbP/0ETioVJ1EentEHgUXsdG/LlKUtoQHeV6WvV2/lihGl4iCm9cy3WIDrWE0cngHEn3I7fhwI/PJWN3k9mQk6B7FFoegOuzKDk9Bhh9YuBJfHbjX/enWTIqxj+fuZ+Ytbj17/JUAawuEz4adFddgRWnfcZwCh90xOGeNkHJJGcgw2VFucp6cFexAYt+6V8gCqmGEJSforGh2TELYuYhv1K7FjaiQxl5cjHvIqXqf0/dfhTbkT8eTvvO8R6JgbnK61BBW/ZH0MyOETAdLsr4Zmh06tG4C3C6Pa4qe74cX6a+s4aXp9k27Rrr4EKNre/hyEdPRFVMKmaGexx6mSEIlUKsqzfvuqTNSEv5+jgV5tsAjvpmSn17gLZK8I3QE7fMmEhFUOIiSlm0w2NPu8C46cejbmmjLXoQpQl2avIVyGwqs2VENd/tfWha8AIWMYRL8FSDN+yVOtKj2xM8f2EtqcN00U10ZrmsNYi+5uxEtIw3Iy47OQWHn70b7g1XD6IOCZGXYMWzVXphauKaVCLlf4LdwOwdgeX3zvW8Qx9AM62wkv9NHN+8OUcIUnF/F0DG7t8q6ITSPPg5KShKO1+MS2ugpOCZYLTozegNjG1c1rrzAR+YK+pcEl32YhMXtlK5/3/r4TXnVoQdCYT74/wGlMBvnsQ1ThcX9WsHm6IHqzazSTH8yu3kBQf/+M7ZH74lWHBvqY0YcOSzL1yMTWG7GNU3GZVNpt9Ic1+MrSuJnJrog7FuzIj0yRm67Cls7cVxIE36qLOyKmQZHjVcTkutKv0Kx6zsZWQINtXjkXGxL2w08ceg2QttnmNQi6EmB8Gr9JpirbI67DsLifhArMkDZf9zyQNK+7EGFOv/Icxu4BIbZ5/TDXHODlEXoDIwlLC1O02bv78/oK0e/o0BtARN/Rln4OOPQgtpDNl/YBHPr9/foMkDSOlGDTwp2ACcLOofeHwGg1EmhX0kcDZgtDw8Mg1o7Oh7FDi6L77OF8kF0I1Q3w0hL4/wRSmN7CWUlL1W4T75jLHQEy1fV+/lsgZ4dKJvZEwZSW5r8FODst5/PiqW1w9GVhSB8lTcrR7aAtwD+GaDPADiohLH1WtEZRfL3EMFonOBDiMzvEylJeViB5mbusZB3FtAmFQ+/8v5ItYrKT5nKvqIqW26a561M5JlnlaYfZlgasCVkPHBPkdHlVwLkya/EfIK61wF7NDIpjV8GOg1HBOS7gVsE8uDWKtubBwfJTN6zFHATc60vkry0S9KaauWoOQrmSLluTrT0THDlqUaakkNnrAmawJL2vX8f1zuHjoK+8Q1MIPgI9K6T7GnRhloSPxCeQ1saiRZDDEUsjKcxIn8ktdIN99/NDovaVOJDUtKvvWmNZl3RyV7ojBrlukR78CReFlNRgrOJWWufNtYZeeT0gaK6DglpR2KktRAepi+WUQ9WaohFhmWw45S8Lt3gEjjrZ2gPhW6pL+wBe2kh3VXUoFRmWl0U7spV4rTPaWq3YMPwaR6X58FxzPLCmVWsKmsVVqPnSxMizhR9FtMM1gn6l8uJ0/4D6OKMRfNxWWGgKlpa/p464D+qSXESfdcHAqFsISwEjmkvByfclTrBz3e0TqsYx3TfDaCSlVg3sZcJD5AnF9948HOaqsEB2AKW29klVbrRdATW1cS2YOmHfxilIY/i0WLZtM8A9a/pUdvu7WMr+D4OkCG46vsFtTKB6WOuGJq8lfQhKdzQKtz1DhvjK5qvfAGYLLxQWkKpwbHn2LdyyMZ2Pm4+V2PKvp0BlY7slzbXUaH79N/CHqH7wwQe74HL5D0umWDbJ9MB4AAAAAElFTkSuQmCC"></p> <p>Where <em>n<sub>i</sub></em> is the number of neighbours for country <em>i</em> and weights <em>w<sub>i</sub></em>, are 1.Yi ~Binomial (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p> <p> </p> <p>Where βj are the fixed effects of the explanatory variables xii. With the spatial random effects described by </p> <p>ui~ N(u−i,σ2u/ni)</p> <p> , </p> <p>where, </p> <p>u−i= ∑j ∈ neigh(i)wiuj/ni</p> <p>Where ni is the number of neighbours for country i and weights wi, are 1. </p> <p> </p> <p>The model was simulated in the Bayesian statistical package WinBUGS, and data manipulation and model initialisation run from R (3.3.1) using R2WinBUGS. The model considers the parameters of age, sex, study bias (e.g. a high fraction of study participants from indigenous populations), vaccine coverage, birth dose of the vaccine and country of study. </p> <p>The model uses the CAR-normal function, in WinBUGS, to model the spatial and economic autocorrelation related to neighbouring countries. For each country that had prevalence data, a weighted central position was calculated using the size and location of each study. For those countries with no data, we used the population centroid. In a novel approach, we considered 3 dimensions in the country adjacency matrix; we used the usual geographic dimensions, latitude and longitude and also combined these with the natural log of the country’s GDP per capita. This was to measure not only geographic but also the developmental proximity of countries. The adjacency matrix for the geo-economic distance gives a score between each country to every other country. Those countries which are close geographically and economically would have a low score and those further apart either geographically or economically would have a high score/distance. Therefore, those countries that are more alike will have a low score and those countries which are alike would have a high score. </p> <p>The way we proportioned the geographic and economic distance to produce the adjacency matrix was then explored, this is because geographic distance may be more or less important than economic similarities. Thus, by creating a number of different adjacency matrices (not definitive) we could select the most suitable matrix that explains reality best. We normalised the geographic and GDP distance and then calculated the distance between these two normalised figures. This creates a smoothed Gaussian surface that is dependent on both spatial proximity and GDP per-capita proximity. We compared ratios of, 1:0, 1:1, 2:1, 1:2 (Geographic:GDP). </p> <p>For each different adjacency matrix, we also had to select a neighbourhood distance, i.e. over what distance can a country be effected by another. Thus, we also varied the radius of distance from which to select neighbours for the neighbourhood network, we used the maximum minimum distance, twice the maximum minimum and three times the maximum minimum, thus varying the number of neighbours each country would have. </p> <p> </p> <p>Finally, to decide the magnitude of the effect one country has on another in the neighbourhood network we varied the weights of pairs of countries in the adjacency matrix, using either a neutral weighting of 1, so that each neighbour has an equal effect on each other (not dependent on the distance in the network), or decaying weights over distance with 1/distance, and 1/distance2, where the closer the country is the greater the effect it has on another country. The outcome of these 36 different combinations led to minimum DIC (Deviance Information Criterion) being found for a ratio of 1:2 (Geographic:GDP), the neighbourhood networks minimum distance being twice the maximum minimum distance and an even weighting of 1/distance for each adjacent country. </p> <p>This model structure produces estimates for all fixed effects and also individual country level risk, this provides information on which are significantly at greater or lower risk to the average risk. </p> <p>All parameters were given un-informative priors. Simulations were run with 3 MCMC chains with 50,000 burn in iterations and each parameter estimated from 1000 samples taken from a thinned 250,000 iterations to produce the posterior distribution. Convergence was attained, with r̂ values all very close to 1.000. Due to the Bayesian framework and WinBUGS software it was possible to gain estimates for countries where we had no data on prevalence, using their GDP and geographic proximity to inform this estimate. Those countries with the largest number of studies provided the estimates with the tightest confidence intervals and those with few or no data were less well defined, often producing a log normal distributed posterior distribution, giving estimates with long tails. </p> <p>Posterior distributions of parameters were inspected for convergence and to check for covariance between parameters. Where necessary parameters were centred and scaled to N (0, 1) to aid parameter convergence and remover covariance. This was done for the sex parameter, which was entered as the proportion of the sample that was female; this was seen to co-vary with the intercept and bias parameters before re-centring and scaling. However, the covariance of routine vaccination and birth dose persisted even after re-centring. This is in part unsurprising as there a few instances where birth dose is administered without the routine vaccination. Here we tried to reduce this interaction of the terms by transforming the birth dose data. We modelled birth dose using only data where the birth dose was greater than 60, 70, 80 & 90% respectively, we also modelled birth dose to the square, thus increasing the effect of high birth doses over smaller doses. Model selection dependent on which one both reduced the covariance between the parameters and returned the lowest DIC score. </p> <p>Model validation was conducted using 90% of randomly selected data against the remaining 10%, and by comparing model estimates of prevalence against observed data (Figure 3). Figure 4 shows the average prevalence in each country from all the studies plotted against the models estimate. Figure 5 shows the marginal and joint posterior distributions for the fitted parameters. Table 1 gives the estimated parameter values with associated credible intervals. </p> <p>During the validation exercise (in which countries were consulted over their estimates) it was pointed out that China had undertaken three very large-scale population-based serological surveys in order to establish baseline prevalence and progress towards HBV elimination. There were a large number of other surveys from China, that are less representative than these three nationwide surveys. We conducted a sensitivity analysis by restricting the data from China to the three nationally representative surveys. The effect of this change in input data was that the effect of vaccination was more distinct, but the estimated age effects (change in prevalence in children under 5, or juveniles (children 5-15 years)) were no longer significantly different from zero (see Table 2 and Figure 6). The deviance was significantly reduced, suggesting a much better fitting model (Table 2), albeit on a somewhat reduced dataset. </p> 2 years ago
brockfanning Bulk status changed SDG Metadata 3-3-4 French	English <p>The data was modelled using a Bayesian logistic regression looking at the proportion of individuals that tested positive for HBsAg in each study, weighting each study by its size and using a conditional autoregressive (CAR) model accounting for spatial and economic correlations between similar countries. This model uses data from well sampled countries to estimate prevalence in more data poor countries with effects such as sex, age and vaccination status, these are also informed by the geographic and countries GDP proximity to other countries (CAR model). Under the assumption that countries that are close together economically and/or geographically will have more similar prevalence due to similar social structure and health care capabilities. </p> <p>The response variable in the model was the prevalence of Hepatitis surface antigen (HBsAg) with the explanatory variables being age (three categories, under 5, juvenile (5-15) and adult (16+), split using the average age of participants in the study), sex (proportion female in the study), study bias (e.g. a high fraction of study participants from indigenous populations), 3 dose vaccine coverage, birth dose of the vaccine and country of study. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The WHO-UNICEF estimates are annual data for the country as a whole, and did not contain information on vaccine efficacy which was not used in the analysis as no data on this was obtained. The vaccine efficacy would be implicitly estimated in the analysis as we see vaccination having a variable effect across time and space across the studies. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. More explicitly, the model uses the ages and timing of the study to calculate the years across which the participants are born, so if the if there was an age group range of 10-15 in a study that was undertaken in 2015, the birth years would be from 2000-2005, we then average the vaccination coverage from the WHO-UNICEF estimates across those 5 years assuming that each age was evenly represented in that age group in the study. The same process was used for the 3 dose and birth dose vaccination. </p> <p> </p> <p>The general logistic model equation is described below, </p> <p>Yi ~Binomial (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p> <p> </p> <p>Where βj are the fixed effects of the explanatory variables xii. With the spatial random effects described by </p> <p>ui~ N(u−i,σ2u/ni)</p> <p> , </p> <p>where, </p> <p>u−i= ∑j ∈ neigh(i)wiuj/ni</p> <p>Where ni is the number of neighbours for country i and weights wi, are 1. </p> <p> </p> <p>The model was simulated in the Bayesian statistical package WinBUGS, and data manipulation and model initialisation run from R (3.3.1) using R2WinBUGS. The model considers the parameters of age, sex, study bias (e.g. a high fraction of study participants from indigenous populations), vaccine coverage, birth dose of the vaccine and country of study. </p> <p>The model uses the CAR-normal function, in WinBUGS, to model the spatial and economic autocorrelation related to neighbouring countries. For each country that had prevalence data, a weighted central position was calculated using the size and location of each study. For those countries with no data, we used the population centroid. In a novel approach, we considered 3 dimensions in the country adjacency matrix; we used the usual geographic dimensions, latitude and longitude and also combined these with the natural log of the country’s GDP per capita. This was to measure not only geographic but also the developmental proximity of countries. The adjacency matrix for the geo-economic distance gives a score between each country to every other country. Those countries which are close geographically and economically would have a low score and those further apart either geographically or economically would have a high score/distance. Therefore, those countries that are more alike will have a low score and those countries which are alike would have a high score. </p> <p>The way we proportioned the geographic and economic distance to produce the adjacency matrix was then explored, this is because geographic distance may be more or less important than economic similarities. Thus, by creating a number of different adjacency matrices (not definitive) we could select the most suitable matrix that explains reality best. We normalised the geographic and GDP distance and then calculated the distance between these two normalised figures. This creates a smoothed Gaussian surface that is dependent on both spatial proximity and GDP per-capita proximity. We compared ratios of, 1:0, 1:1, 2:1, 1:2 (Geographic:GDP). </p> <p>For each different adjacency matrix, we also had to select a neighbourhood distance, i.e. over what distance can a country be effected by another. Thus, we also varied the radius of distance from which to select neighbours for the neighbourhood network, we used the maximum minimum distance, twice the maximum minimum and three times the maximum minimum, thus varying the number of neighbours each country would have. </p> <p> </p> <p>Finally, to decide the magnitude of the effect one country has on another in the neighbourhood network we varied the weights of pairs of countries in the adjacency matrix, using either a neutral weighting of 1, so that each neighbour has an equal effect on each other (not dependent on the distance in the network), or decaying weights over distance with 1/distance, and 1/distance2, where the closer the country is the greater the effect it has on another country. The outcome of these 36 different combinations led to minimum DIC (Deviance Information Criterion) being found for a ratio of 1:2 (Geographic:GDP), the neighbourhood networks minimum distance being twice the maximum minimum distance and an even weighting of 1/distance for each adjacent country. </p> <p>This model structure produces estimates for all fixed effects and also individual country level risk, this provides information on which are significantly at greater or lower risk to the average risk. </p> <p>All parameters were given un-informative priors. Simulations were run with 3 MCMC chains with 50,000 burn in iterations and each parameter estimated from 1000 samples taken from a thinned 250,000 iterations to produce the posterior distribution. Convergence was attained, with r̂ values all very close to 1.000. Due to the Bayesian framework and WinBUGS software it was possible to gain estimates for countries where we had no data on prevalence, using their GDP and geographic proximity to inform this estimate. Those countries with the largest number of studies provided the estimates with the tightest confidence intervals and those with few or no data were less well defined, often producing a log normal distributed posterior distribution, giving estimates with long tails. </p> <p>Posterior distributions of parameters were inspected for convergence and to check for covariance between parameters. Where necessary parameters were centred and scaled to N (0, 1) to aid parameter convergence and remover covariance. This was done for the sex parameter, which was entered as the proportion of the sample that was female; this was seen to co-vary with the intercept and bias parameters before re-centring and scaling. However, the covariance of routine vaccination and birth dose persisted even after re-centring. This is in part unsurprising as there a few instances where birth dose is administered without the routine vaccination. Here we tried to reduce this interaction of the terms by transforming the birth dose data. We modelled birth dose using only data where the birth dose was greater than 60, 70, 80 & 90% respectively, we also modelled birth dose to the square, thus increasing the effect of high birth doses over smaller doses. Model selection dependent on which one both reduced the covariance between the parameters and returned the lowest DIC score. </p> <p>Model validation was conducted using 90% of randomly selected data against the remaining 10%, and by comparing model estimates of prevalence against observed data (Figure 3). Figure 4 shows the average prevalence in each country from all the studies plotted against the models estimate. Figure 5 shows the marginal and joint posterior distributions for the fitted parameters. Table 1 gives the estimated parameter values with associated credible intervals. </p> <p>During the validation exercise (in which countries were consulted over their estimates) it was pointed out that China had undertaken three very large-scale population-based serological surveys in order to establish baseline prevalence and progress towards HBV elimination. There were a large number of other surveys from China, that are less representative than these three nationwide surveys. We conducted a sensitivity analysis by restricting the data from China to the three nationally representative surveys. The effect of this change in input data was that the effect of vaccination was more distinct, but the estimated age effects (change in prevalence in children under 5, or juveniles (children 5-15 years)) were no longer significantly different from zero (see Table 2 and Figure 6). The deviance was significantly reduced, suggesting a much better fitting model (Table 2), albeit on a somewhat reduced dataset. </p> French 0 characters edited <h1>Méthodologie</h1> <h2>Méthode de calcul :</h2> <p>Les données ont été modélisées à l'aide d'une régression logistique bayésienne examinant la proportion d'individus testés positifs pour l'HBsAg dans chaque étude, en pondérant chaque étude par sa taille et en utilisant un modèle autorégressif conditionnel (CAR) tenant compte des corrélations spatiales et économiques entre des pays similaires. Ce modèle utilise des données provenant de pays bien échantillonnés pour estimer la prévalence dans des pays pauvres en données, avec des effets tels que le sexe, l'âge et le statut vaccinal, qui sont également informés par la proximité géographique et le PIB des pays par rapport aux autres pays (modèle CAR). En partant de l'hypothèse que les pays qui sont proches économiquement et/ou géographiquement, auront une prévalence plus similaire en raison de leur structure sociale et de leurs capacités en matière de soins de santé. </p> <p>La variable de réponse dans le modèle était la prévalence de l'antigène de surface de l'hépatite (HBsAg), les variables explicatives étant l'âge (trois catégories, moins de 5 ans, jeunes (5 à 15 ans) et adultes (16 et +), réparties en fonction de l'âge moyen des participants à l'étude), le sexe (proportion de femmes dans l'étude), le biais de l'étude (par exemple, une forte proportion de participants à l'étude issus de populations indigènes), la couverture vaccinale de 3 doses, la dose de naissance du vaccin et le pays de l'étude. La couverture de la vaccination de routine en 3 doses et de la vaccination à la naissance dans chaque étude, a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale de l'Organisation mondiale de la Santé (OMS) et de le Fonds des Nations Unies pour l'enfance (UNICEF) pour ce pays. Les estimations OMS-UNICEF sont des données annuelles pour l'ensemble du pays et ne contiennent pas de l'informations sur l'efficacité du vaccin qui n'ont pas été utilisées dans l'analyse, car aucune donnée n'a été obtenue à ce sujet. L'efficacité du vaccin serait implicitement estimée dans l'analyse, car nous constatons que la vaccination a un effet variable dans le temps et dans l'espace selon les études. La couverture de la vaccination de routine à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale de l'OMS et de l'UNICEF pour ce pays. La couverture de la vaccination systématique par trois doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale OMS-UNICEF pour ce pays. Plus explicitement, le modèle utilise l'âge et le moment de l'étude pour calculer les années de naissance des participants. Ainsi, s'il y avait une tranche d'âge de 10 à 15 ans dans une étude entreprise en 2015, les années de naissance seraient de 2000 à 2005, nous faisons alors la moyenne de la couverture vaccinale des estimations OMS-UNICEF sur ces 5 années en supposant que chaque âge est représenté de manière égale dans cette tranche d'âge dans l'étude. Le même processus a été utilisé pour la vaccination à 3 doses et la vaccination à la naissance. </p> <p>L'équation générale du modèle logistique est décrite ci-dessous, </p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAeEAAABRCAMAAADSKe79AAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAK1UExURf////T09NTU1Nzc3Pz8/O/v79DQ0Pr6+qampnh4eHR0dMLCwpGRkXp6em1tbc/Pz+Li4snJydfX11NTU4KCgt3d3erq6m9vb6Wlpby8vFZWVr6+vvHx8X19fZ+fn3Fxcf7+/uzs7K+vr+7u7l1dXZSUlP39/WdnZ9PT01VVVaenp4yMjJaWlre3t1RUVIiIiLCwsKKiouTk5J2dnWNjY+Pj4+vr6/j4+PX19YaGhoSEhPf399/f3/Dw8Pv7+4uLi2JiYl9fX6CgoNbW1pKSkpWVla2traysrHd3d66urvb29o+Pj0pKSktLS+jo6NXV1fn5+bGxsYODg2xsbGRkZOfn59jY2GlpaYmJicjIyGZmZmFhYY2NjZmZmXZ2duDg4Lm5uc3NzbKysk9PT25ubp6entHR0cDAwPPz81tbW1dXV6GhoWtra3BwcO3t7enp6YGBgbi4uJOTk7W1tVFRUXl5eX9/f+bm5tvb27+/v7Ozs7S0tM7Ozn5+ft7e3tra2uHh4cXFxfLy8nJycnV1daOjo5CQkJubm46OjsPDw8bGxk5OTqioqJeXl3x8fFJSUlBQUMzMzKqqql5eXlhYWMHBwWpqamBgYMrKyoWFhU1NTbq6utnZ2ampqZqamkxMTFxcXOXl5cvLy3Nzc4qKimVlZVlZWba2toCAgLu7u729vaSkpNLS0qurq5iYmIeHh8fHx1paWmhoaHt7e5ycnMTExLGtrfayso9ubvze3ptUVGhnZ/vc3MllZXFvb/3y8vivr/739//+/vvX17VXV3Vqav3r69pdXWtMTP/8/NiAgJhcXOfk5P79/fi6uvixse3q6v78/LN3d6g+PvGSkoBTU8u+vp5AQOy3t/rIyPWYmOLU1JKRkYBXV/WGhui0tJ6dncXExHRjY+GEhPWQkMGysgAAAH/C7rcA <p>Where βj sont les effets fixes des variables explicatives <em>x<sub>ii</sub></em>. Avec les effets aléatoires spatiaux décrits par </p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAJsAAAAuCAMAAAAIuJt4AAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAIfUExURf////r6+vLy8vHx8e/v7/X19f7+/r+/v319faenp7CwsIiIiIaGhuXl5fz8/ODg4KSkpMDAwLu7u/39/crKylhYWLKysp2dndHR0fv7+7y8vF1dXYuLi+np6dTU1FlZWaqqqoCAgPn5+WBgYJGRkcLCwmdnZ0pKSlZWVuvr62xsbExMTI6OjuHh4bW1tc7OztPT0/b29pubm15eXtXV1VtbW8vLy9LS0mpqaoeHh+rq6pKSkk5OTk1NTaysrPf395WVlV9fX1dXV5+fn6urq3p6eomJib29vWhoaLe3t35+fnNzc+7u7tra2mNjY4KCgnBwcPT09IyMjFVVVcjIyFxcXKOjo/j4+Nvb21RUVKKiomFhYePj4+zs7N3d3aCgoHh4eFNTU3t7e6WlpcnJyVpaWtzc3OTk5N/f3+bm5szMzJiYmOjo6PDw8MXFxY2NjWZmZuLi4tDQ0JeXl2VlZVFRUdfX166uroODg2JiYo+Pj3l5eXFxcWRkZJSUlN7e3r6+vufn57i4uIqKipCQkIWFhcbGxm1tbe3t7dnZ2bq6und3d8TExHZ2doGBgVBQUHx8fK+vr5mZmX9/f7a2tqmpqaGhofPz85OTk2lpaYSEhJaWlk9PT6ioqJ6enrOzs29vb8PDw3JyclJSUpycnMfHx7S0tM/Pz2tra9jY2EtLS7GxsZqams3Nza2trcHBwXR0dKamprm5udbW1gAAAPSlTP8AAAC1dFJOU/////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////// <p>où,</p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAPQAAABNCAMAAACmNLlxAAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAIlUExURf////7+/v39/bW1tZ6enujo6I+Pj0pKSktLS01NTdXV1e/v72xsbE5OTqWlpfT09Pf39/X19dHR0WBgYL+/v1paWl9fX6Ojo3Nzc+Hh4fHx8VxcXIqKin9/f+zs7IuLi+fn52tra1FRUaurq/n5+cDAwFdXV9fX18PDw2JiYmVlZc3Nzevr68XFxfj4+KqqqmZmZubm5oCAgIiIiPDw8HR0dFRUVK6urtPT08nJyVBQUOnp6e3t7UxMTJCQkO7u7sfHx7q6unp6eqKiol5eXuXl5ampqVJSUpeXl/r6+l1dXc/Pz6+vr9nZ2bS0tNLS0vz8/LGxsVZWVn5+foKCgtbW1ry8vPb29uPj43FxcaioqLm5ucrKyvv7+8bGxq2trbCwsLu7u8zMzM7OzuLi4o2NjU9PT2dnZ8jIyGNjY2RkZFlZWdTU1MTExPLy8m1tbZSUlODg4IWFhXV1dWhoaJWVlVhYWFVVVcHBwaGhoVtbW2FhYXd3d8LCwri4uIyMjKysrJGRkYSEhHx8fJaWloODg/Pz825ubnBwcIeHh6SkpH19fXZ2dp2dnXl5eVNTU5ycnN3d3W9vb4aGhtvb23h4eOrq6rOzs5mZmaamptDQ0Gpqat7e3t/f35iYmI6OjomJidjY2Kenp76+vre3t2lpaXt7e3JycuTk5JOTk7Kyspqampubm7a2tpKSktra2svLy6CgoIGBgb29vZ+fn9zc3AAAAEw+Zl4AAAC3dFJOU/////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////// <p>où <em>n<sub>i</sub></em> est le nombre de voisins pour le pays <em>i</em> et les poids <em>w<sub>i</sub></em>, sont 1. </p> <p>Le modèle a été simulé dans le progiciel statistique bayésien WinBUGS, et la manipulation des données et l'initialisation du modèle ont été effectuées à partir de R (3.3.1) en utilisant R2WinBUGS. Le modèle prend en compte les paramètres de l'âge, du sexe, du biais de l'étude (par exemple, une forte proportion de participants à l'étude issus de populations indigènes), de la couverture vaccinale, de la dose de naissance du vaccin et du pays d'étude. </p> <p>Le modèle utilise la fonction CAR-normale, dans WinBUGS, pour modéliser l'autocorrélation spatiale et économique liée aux pays voisins. Pour chaque pays disposant de données de prévalence, une position centrale pondérée a été calculée en utilisant la taille et la localisation de chaque étude. Pour les pays ne disposant pas de données, nous avons utilisé le centroïde de la population. Dans une nouvelle approche, nous avons pris en compte trois dimensions dans la matrice de contiguïté des pays ; nous avons utilisé les dimensions géographiques habituelles, la latitude et la longitude, et les avons également combinées avec le logarithme naturel du PIB par habitant du pays. Il s'agissait de mesurer non seulement la proximité géographique, mais aussi la proximité de développement des pays. La matrice de proximité pour la distance géo-économique donne un score entre chaque pays et chaque autre pays. Les pays qui sont proches géographiquement et économiquement ont un score faible et ceux qui sont plus éloignés géographiquement ou économiquement ont un score/distance élevé. Par conséquent, les pays qui se ressemblent le plus auront un score faible et les pays qui se ressemblent un score élevé. </p> <p>La façon dont nous avons proportionné la distance géographique et économique pour produire la matrice de contiguïté a ensuite été explorée, car la distance géographique peut être plus ou moins importante que les similitudes économiques. Ainsi, en créant un certain nombre de matrices de contiguïté différentes (non définitives), nous avons pu sélectionner la matrice la plus appropriée qui explique le mieux la réalité. Nous avons normalisé la distance géographique et la distance du PIB, puis nous avons calculé la distance entre ces deux chiffres normalisés. Cela crée une surface gaussienne lissée qui dépend à la fois de la proximité spatiale et de la proximité du PIB par habitant. Nous avons comparé les ratios de, 1:0, 1:1, 2:1, 1:2 (Géographique:PIB). </p> <p>Pour chaque matrice de proximité différente, nous avons également dû sélectionner une distance de voisinage, c'est-à-dire sur quelle distance un pays peut être affecté par un autre. Ainsi, nous avons également fait varier le rayon de la distance à partir de laquelle sélectionner les voisins pour le réseau de voisinage, nous avons utilisé la distance minimale maximale, deux fois la distance minimale maximale et trois fois la distance minimale maximale, faisant ainsi varier le nombre de voisins que chaque pays aurait. </p> <p>Enfin, pour décider de l'ampleur de l'effet d'un pays sur un autre dans le réseau de voisinage, nous avons fait varier les poids des paires de pays dans la matrice de contiguïté, en utilisant soit un poids neutre de 1, de sorte que chaque voisin a un effet égal sur l'autre (ne dépendant pas de la distance dans le réseau), soit des poids décroissants sur la distance avec 1/distance, et 1/distance2, où plus le pays est proche, plus l'effet qu'il a sur un autre pays est important. Le résultat de ces 36 combinaisons différentes a permis de trouver un DIC (Deviance Information Criterion) minimum pour un rapport de 1:2 (Géographie:PIB), la distance minimum des réseaux de voisinage étant le double de la distance minimum maximum et une pondération égale de 1/distance pour chaque pays adjacent. </p> <p>Cette structure de modèle produit des estimations pour tous les effets fixes et aussi pour le risque au niveau de chaque pays, ce qui fournit des informations sur ceux qui sont significativement plus ou moins exposés au risque moyen. </p> <p>Tous les paramètres ont été donnés des antécédents non informatifs. Des simulations ont été effectuées avec 3 chaînes MCMC avec 50 000 brûlures en itérations et chaque paramètre a été estimé à partir de 1000 échantillons prélevés sur 250 000 itérations diluées pour produire la distribution postérieure. La convergence a été atteinte, avec r&#x302 ; des valeurs toutes très proches de 1.000. Grâce au cadre bayésien et au logiciel WinBUGS, il a été possible d'obtenir des estimations pour les pays où nous ne disposions pas de données sur la prévalence, en utilisant leur PIB et leur proximité géographique pour étayer cette estimation. Les pays ayant réalisé le plus grand nombre d'études ont fourni les estimations avec les intervalles de confiance les plus étroits et ceux qui n'avaient que peu ou pas de données étaient moins bien définis, produisant souvent une distribution postérieure log-normale, donnant des estimations avec de longues queues. </p> <p>Les distributions postérieures des paramètres ont été inspectées pour vérifier la convergence et la covariance entre les paramètres. Le cas échéant, les paramètres ont été centrés et mis à l'échelle N (0, 1) pour faciliter la convergence des paramètres et la covariance de la suppression. Cela a été fait pour le paramètre du sexe, qui a été saisi comme la proportion de l'échantillon qui était féminine ; on a constaté qu'il variait avec les paramètres d'interception et de biais avant de recentrer et de mettre à l'échelle. Cependant, la covariance de la vaccination de routine et de la dose à la naissance a persisté même après le recadrage. Cela n'est pas surprenant car il y a eu quelques cas où la dose à la naissance a été administrée sans la vaccination de routine. Nous avons essayé ici de réduire cette interaction des termes en transformant les données relatives à la dose de naissance. Nous avons modélisé la dose de naissance en utilisant uniquement les données où la dose de naissance était supérieure à 60, 70, 80 &amp ; 90% respectivement, nous avons également modélisé la dose de naissance au carré, augmentant ainsi l'effet des doses de naissance élevées par rapport aux doses plus faibles. Le choix du modèle dépendait de celui qui réduisait la covariance entre les paramètres et donnait le score CIVD le plus bas. </p> <p>La validation du modèle a été réalisée en utilisant 90 % des données sélectionnées au hasard par rapport aux 10 % restants, et en comparant les estimations de la prévalence du modèle aux données observées (figure 3). La figure 4 montre la prévalence moyenne dans chaque pays à partir de toutes les études tracées par rapport à l'estimation du modèle. La figure 5 montre les distributions marginales et articulaires postérieures pour les paramètres ajustés. Le tableau 1 donne les valeurs estimées des paramètres avec les intervalles crédibles associés. <p>Au cours de l'exercice de validation (dans lequel les pays ont été consultés sur leurs estimations), il a été souligné que la Chine avait entrepris trois enquêtes sérologiques à très grande échelle dans la population afin d'établir la prévalence de base et les progrès vers l'élimination du VHB. Il y avait un grand nombre d'autres enquêtes en Chine, qui sont moins représentatives que ces trois enquêtes nationales. Nous avons effectué une analyse de sensibilité en limitant les données de la Chine aux trois enquêtes représentatives au niveau national. Cette modification des données d'entrée a eu pour effet de rendre l'effet de la vaccination plus distinct, mais les effets estimés sur l'âge (changement de la prévalence chez les enfants de moins de 5 ans, ou les jeunes (enfants de 5 à 15 ans)) n'étaient plus significativement différents de zéro (voir tableau 2 et figure 6). L'écart a été réduit de manière significative, ce qui suggère un modèle beaucoup plus adapté (tableau 2), bien que sur un ensemble de données quelque peu réduit.</p> 2 years ago
brockfanning Bulk status changed SDG Metadata 3-3-4 French	English <p>The data was modelled using a Bayesian logistic regression looking at the proportion of individuals that tested positive for HBsAg in each study, weighting each study by its size and using a conditional autoregressive (CAR) model accounting for spatial and economic correlations between similar countries. This model uses data from well sampled countries to estimate prevalence in more data poor countries with effects such as sex, age and vaccination status, these are also informed by the geographic and countries GDP proximity to other countries (CAR model). Under the assumption that countries that are close together economically and/or geographically will have more similar prevalence due to similar social structure and health care capabilities. </p> <p>The response variable in the model was the prevalence of Hepatitis surface antigen (HBsAg) with the explanatory variables being age (three categories, under 5, juvenile (5-15) and adult (16+), split using the average age of participants in the study), sex (proportion female in the study), study bias (e.g. a high fraction of study participants from indigenous populations), 3 dose vaccine coverage, birth dose of the vaccine and country of study. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The WHO-UNICEF estimates are annual data for the country as a whole, and did not contain information on vaccine efficacy which was not used in the analysis as no data on this was obtained. The vaccine efficacy would be implicitly estimated in the analysis as we see vaccination having a variable effect across time and space across the studies. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. More explicitly, the model uses the ages and timing of the study to calculate the years across which the participants are born, so if the if there was an age group range of 10-15 in a study that was undertaken in 2015, the birth years would be from 2000-2005, we then average the vaccination coverage from the WHO-UNICEF estimates across those 5 years assuming that each age was evenly represented in that age group in the study. The same process was used for the 3 dose and birth dose vaccination. </p> <p> </p> <p>The general logistic model equation is described below, </p> <p>Yi ~Binomial (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p> <p> </p> <p>Where βj are the fixed effects of the explanatory variables xii. With the spatial random effects described by </p> <p>ui~ N(u−i,σ2u/ni)</p> <p> , </p> <p>where, </p> <p>u−i= ∑j ∈ neigh(i)wiuj/ni</p> <p>Where ni is the number of neighbours for country i and weights wi, are 1. </p> <p> </p> <p>The model was simulated in the Bayesian statistical package WinBUGS, and data manipulation and model initialisation run from R (3.3.1) using R2WinBUGS. The model considers the parameters of age, sex, study bias (e.g. a high fraction of study participants from indigenous populations), vaccine coverage, birth dose of the vaccine and country of study. </p> <p>The model uses the CAR-normal function, in WinBUGS, to model the spatial and economic autocorrelation related to neighbouring countries. For each country that had prevalence data, a weighted central position was calculated using the size and location of each study. For those countries with no data, we used the population centroid. In a novel approach, we considered 3 dimensions in the country adjacency matrix; we used the usual geographic dimensions, latitude and longitude and also combined these with the natural log of the country’s GDP per capita. This was to measure not only geographic but also the developmental proximity of countries. The adjacency matrix for the geo-economic distance gives a score between each country to every other country. Those countries which are close geographically and economically would have a low score and those further apart either geographically or economically would have a high score/distance. Therefore, those countries that are more alike will have a low score and those countries which are alike would have a high score. </p> <p>The way we proportioned the geographic and economic distance to produce the adjacency matrix was then explored, this is because geographic distance may be more or less important than economic similarities. Thus, by creating a number of different adjacency matrices (not definitive) we could select the most suitable matrix that explains reality best. We normalised the geographic and GDP distance and then calculated the distance between these two normalised figures. This creates a smoothed Gaussian surface that is dependent on both spatial proximity and GDP per-capita proximity. We compared ratios of, 1:0, 1:1, 2:1, 1:2 (Geographic:GDP). </p> <p>For each different adjacency matrix, we also had to select a neighbourhood distance, i.e. over what distance can a country be effected by another. Thus, we also varied the radius of distance from which to select neighbours for the neighbourhood network, we used the maximum minimum distance, twice the maximum minimum and three times the maximum minimum, thus varying the number of neighbours each country would have. </p> <p> </p> <p>Finally, to decide the magnitude of the effect one country has on another in the neighbourhood network we varied the weights of pairs of countries in the adjacency matrix, using either a neutral weighting of 1, so that each neighbour has an equal effect on each other (not dependent on the distance in the network), or decaying weights over distance with 1/distance, and 1/distance2, where the closer the country is the greater the effect it has on another country. The outcome of these 36 different combinations led to minimum DIC (Deviance Information Criterion) being found for a ratio of 1:2 (Geographic:GDP), the neighbourhood networks minimum distance being twice the maximum minimum distance and an even weighting of 1/distance for each adjacent country. </p> <p>This model structure produces estimates for all fixed effects and also individual country level risk, this provides information on which are significantly at greater or lower risk to the average risk. </p> <p>All parameters were given un-informative priors. Simulations were run with 3 MCMC chains with 50,000 burn in iterations and each parameter estimated from 1000 samples taken from a thinned 250,000 iterations to produce the posterior distribution. Convergence was attained, with r̂ values all very close to 1.000. Due to the Bayesian framework and WinBUGS software it was possible to gain estimates for countries where we had no data on prevalence, using their GDP and geographic proximity to inform this estimate. Those countries with the largest number of studies provided the estimates with the tightest confidence intervals and those with few or no data were less well defined, often producing a log normal distributed posterior distribution, giving estimates with long tails. </p> <p>Posterior distributions of parameters were inspected for convergence and to check for covariance between parameters. Where necessary parameters were centred and scaled to N (0, 1) to aid parameter convergence and remover covariance. This was done for the sex parameter, which was entered as the proportion of the sample that was female; this was seen to co-vary with the intercept and bias parameters before re-centring and scaling. However, the covariance of routine vaccination and birth dose persisted even after re-centring. This is in part unsurprising as there a few instances where birth dose is administered without the routine vaccination. Here we tried to reduce this interaction of the terms by transforming the birth dose data. We modelled birth dose using only data where the birth dose was greater than 60, 70, 80 & 90% respectively, we also modelled birth dose to the square, thus increasing the effect of high birth doses over smaller doses. Model selection dependent on which one both reduced the covariance between the parameters and returned the lowest DIC score. </p> <p>Model validation was conducted using 90% of randomly selected data against the remaining 10%, and by comparing model estimates of prevalence against observed data (Figure 3). Figure 4 shows the average prevalence in each country from all the studies plotted against the models estimate. Figure 5 shows the marginal and joint posterior distributions for the fitted parameters. Table 1 gives the estimated parameter values with associated credible intervals. </p> <p>During the validation exercise (in which countries were consulted over their estimates) it was pointed out that China had undertaken three very large-scale population-based serological surveys in order to establish baseline prevalence and progress towards HBV elimination. There were a large number of other surveys from China, that are less representative than these three nationwide surveys. We conducted a sensitivity analysis by restricting the data from China to the three nationally representative surveys. The effect of this change in input data was that the effect of vaccination was more distinct, but the estimated age effects (change in prevalence in children under 5, or juveniles (children 5-15 years)) were no longer significantly different from zero (see Table 2 and Figure 6). The deviance was significantly reduced, suggesting a much better fitting model (Table 2), albeit on a somewhat reduced dataset. </p> French 0 characters edited <h1>Méthodologie</h1> <h2>Méthode de calcul :</h2> <p>Les données ont été modélisées à l'aide d'une régression logistique bayésienne examinant la proportion d'individus testés positifs pour l'HBsAg dans chaque étude, en pondérant chaque étude par sa taille et en utilisant un modèle autorégressif conditionnel (CAR) tenant compte des corrélations spatiales et économiques entre des pays similaires. Ce modèle utilise des données provenant de pays bien échantillonnés pour estimer la prévalence dans des pays pauvres en données, avec des effets tels que le sexe, l'âge et le statut vaccinal, qui sont également informés par la proximité géographique et le PIB des pays par rapport aux autres pays (modèle CAR). En partant de l'hypothèse que les pays qui sont proches économiquement et/ou géographiquement, auront une prévalence plus similaire en raison de leur structure sociale et de leurs capacités en matière de soins de santé. </p> <p>La variable de réponse dans le modèle était la prévalence de l'antigène de surface de l'hépatite (HBsAg), les variables explicatives étant l'âge (trois catégories, moins de 5 ans, jeunes (5 à 15 ans) et adultes (16 et +), réparties en fonction de l'âge moyen des participants à l'étude), le sexe (proportion de femmes dans l'étude), le biais de l'étude (par exemple, une forte proportion de participants à l'étude issus de populations indigènes), la couverture vaccinale de 3 doses, la dose de naissance du vaccin et le pays de l'étude. La couverture de la vaccination de routine en 3 doses et de la vaccination à la naissance dans chaque étude, a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale de l'Organisation mondiale de la Santé (OMS) et de le Fonds des Nations Unies pour l'enfance (UNICEF) pour ce pays. Les estimations OMS-UNICEF sont des données annuelles pour l'ensemble du pays et ne contiennent pas de l'informations sur l'efficacité du vaccin qui n'ont pas été utilisées dans l'analyse, car aucune donnée n'a été obtenue à ce sujet. L'efficacité du vaccin serait implicitement estimée dans l'analyse, car nous constatons que la vaccination a un effet variable dans le temps et dans l'espace selon les études. La couverture de la vaccination de routine à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale de l'OMS et de l'UNICEF pour ce pays. La couverture de la vaccination systématique par trois doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale OMS-UNICEF pour ce pays. Plus explicitement, le modèle utilise l'âge et le moment de l'étude pour calculer les années de naissance des participants. Ainsi, s'il y avait une tranche d'âge de 10 à 15 ans dans une étude entreprise en 2015, les années de naissance seraient de 2000 à 2005, nous faisons alors la moyenne de la couverture vaccinale des estimations OMS-UNICEF sur ces 5 années en supposant que chaque âge est représenté de manière égale dans cette tranche d'âge dans l'étude. Le même processus a été utilisé pour la vaccination à 3 doses et la vaccination à la naissance. </p> <p>L'équation générale du modèle logistique est décrite ci-dessous, </p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAeEAAABRCAMAAADSKe79AAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAK1UExURf////T09NTU1Nzc3Pz8/O/v79DQ0Pr6+qampnh4eHR0dMLCwpGRkXp6em1tbc/Pz+Li4snJydfX11NTU4KCgt3d3erq6m9vb6Wlpby8vFZWVr6+vvHx8X19fZ+fn3Fxcf7+/uzs7K+vr+7u7l1dXZSUlP39/WdnZ9PT01VVVaenp4yMjJaWlre3t1RUVIiIiLCwsKKiouTk5J2dnWNjY+Pj4+vr6/j4+PX19YaGhoSEhPf399/f3/Dw8Pv7+4uLi2JiYl9fX6CgoNbW1pKSkpWVla2traysrHd3d66urvb29o+Pj0pKSktLS+jo6NXV1fn5+bGxsYODg2xsbGRkZOfn59jY2GlpaYmJicjIyGZmZmFhYY2NjZmZmXZ2duDg4Lm5uc3NzbKysk9PT25ubp6entHR0cDAwPPz81tbW1dXV6GhoWtra3BwcO3t7enp6YGBgbi4uJOTk7W1tVFRUXl5eX9/f+bm5tvb27+/v7Ozs7S0tM7Ozn5+ft7e3tra2uHh4cXFxfLy8nJycnV1daOjo5CQkJubm46OjsPDw8bGxk5OTqioqJeXl3x8fFJSUlBQUMzMzKqqql5eXlhYWMHBwWpqamBgYMrKyoWFhU1NTbq6utnZ2ampqZqamkxMTFxcXOXl5cvLy3Nzc4qKimVlZVlZWba2toCAgLu7u729vaSkpNLS0qurq5iYmIeHh8fHx1paWmhoaHt7e5ycnMTExLGtrfayso9ubvze3ptUVGhnZ/vc3MllZXFvb/3y8vivr/739//+/vvX17VXV3Vqav3r69pdXWtMTP/8/NiAgJhcXOfk5P79/fi6uvixse3q6v78/LN3d6g+PvGSkoBTU8u+vp5AQOy3t/rIyPWYmOLU1JKRkYBXV/WGhui0tJ6dncXExHRjY+GEhPWQkMGysgAAAH/C7rcA <p>Where βj sont les effets fixes des variables explicatives <em>x<sub>ii</sub></em>. Avec les effets aléatoires spatiaux décrits par </p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAJsAAAAuCAMAAAAIuJt4AAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAIfUExURf////r6+vLy8vHx8e/v7/X19f7+/r+/v319faenp7CwsIiIiIaGhuXl5fz8/ODg4KSkpMDAwLu7u/39/crKylhYWLKysp2dndHR0fv7+7y8vF1dXYuLi+np6dTU1FlZWaqqqoCAgPn5+WBgYJGRkcLCwmdnZ0pKSlZWVuvr62xsbExMTI6OjuHh4bW1tc7OztPT0/b29pubm15eXtXV1VtbW8vLy9LS0mpqaoeHh+rq6pKSkk5OTk1NTaysrPf395WVlV9fX1dXV5+fn6urq3p6eomJib29vWhoaLe3t35+fnNzc+7u7tra2mNjY4KCgnBwcPT09IyMjFVVVcjIyFxcXKOjo/j4+Nvb21RUVKKiomFhYePj4+zs7N3d3aCgoHh4eFNTU3t7e6WlpcnJyVpaWtzc3OTk5N/f3+bm5szMzJiYmOjo6PDw8MXFxY2NjWZmZuLi4tDQ0JeXl2VlZVFRUdfX166uroODg2JiYo+Pj3l5eXFxcWRkZJSUlN7e3r6+vufn57i4uIqKipCQkIWFhcbGxm1tbe3t7dnZ2bq6und3d8TExHZ2doGBgVBQUHx8fK+vr5mZmX9/f7a2tqmpqaGhofPz85OTk2lpaYSEhJaWlk9PT6ioqJ6enrOzs29vb8PDw3JyclJSUpycnMfHx7S0tM/Pz2tra9jY2EtLS7GxsZqams3Nza2trcHBwXR0dKamprm5udbW1gAAAPSlTP8AAAC1dFJOU/////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////// <p>où,</p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAPQAAABNCAMAAACmNLlxAAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAIlUExURf////7+/v39/bW1tZ6enujo6I+Pj0pKSktLS01NTdXV1e/v72xsbE5OTqWlpfT09Pf39/X19dHR0WBgYL+/v1paWl9fX6Ojo3Nzc+Hh4fHx8VxcXIqKin9/f+zs7IuLi+fn52tra1FRUaurq/n5+cDAwFdXV9fX18PDw2JiYmVlZc3Nzevr68XFxfj4+KqqqmZmZubm5oCAgIiIiPDw8HR0dFRUVK6urtPT08nJyVBQUOnp6e3t7UxMTJCQkO7u7sfHx7q6unp6eqKiol5eXuXl5ampqVJSUpeXl/r6+l1dXc/Pz6+vr9nZ2bS0tNLS0vz8/LGxsVZWVn5+foKCgtbW1ry8vPb29uPj43FxcaioqLm5ucrKyvv7+8bGxq2trbCwsLu7u8zMzM7OzuLi4o2NjU9PT2dnZ8jIyGNjY2RkZFlZWdTU1MTExPLy8m1tbZSUlODg4IWFhXV1dWhoaJWVlVhYWFVVVcHBwaGhoVtbW2FhYXd3d8LCwri4uIyMjKysrJGRkYSEhHx8fJaWloODg/Pz825ubnBwcIeHh6SkpH19fXZ2dp2dnXl5eVNTU5ycnN3d3W9vb4aGhtvb23h4eOrq6rOzs5mZmaamptDQ0Gpqat7e3t/f35iYmI6OjomJidjY2Kenp76+vre3t2lpaXt7e3JycuTk5JOTk7Kyspqampubm7a2tpKSktra2svLy6CgoIGBgb29vZ+fn9zc3AAAAEw+Zl4AAAC3dFJOU/////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////// <p>où <em>n<sub>i</sub></em> est le nombre de voisins pour le pays <em>i</em> et les poids <em>w<sub>i</sub></em>, sont 1. </p> <p>Le modèle a été simulé dans le progiciel statistique bayésien WinBUGS, et la manipulation des données et l'initialisation du modèle ont été effectuées à partir de R (3.3.1) en utilisant R2WinBUGS. Le modèle prend en compte les paramètres de l'âge, du sexe, du biais de l'étude (par exemple, une forte proportion de participants à l'étude issus de populations indigènes), de la couverture vaccinale, de la dose de naissance du vaccin et du pays d'étude. </p> <p>Le modèle utilise la fonction CAR-normale, dans WinBUGS, pour modéliser l'autocorrélation spatiale et économique liée aux pays voisins. Pour chaque pays disposant de données de prévalence, une position centrale pondérée a été calculée en utilisant la taille et la localisation de chaque étude. Pour les pays ne disposant pas de données, nous avons utilisé le centroïde de la population. Dans une nouvelle approche, nous avons pris en compte trois dimensions dans la matrice de contiguïté des pays ; nous avons utilisé les dimensions géographiques habituelles, la latitude et la longitude, et les avons également combinées avec le logarithme naturel du PIB par habitant du pays. Il s'agissait de mesurer non seulement la proximité géographique, mais aussi la proximité de développement des pays. La matrice de proximité pour la distance géo-économique donne un score entre chaque pays et chaque autre pays. Les pays qui sont proches géographiquement et économiquement ont un score faible et ceux qui sont plus éloignés géographiquement ou économiquement ont un score/distance élevé. Par conséquent, les pays qui se ressemblent le plus auront un score faible et les pays qui se ressemblent un score élevé. </p> <p>La façon dont nous avons proportionné la distance géographique et économique pour produire la matrice de contiguïté a ensuite été explorée, car la distance géographique peut être plus ou moins importante que les similitudes économiques. Ainsi, en créant un certain nombre de matrices de contiguïté différentes (non définitives), nous avons pu sélectionner la matrice la plus appropriée qui explique le mieux la réalité. Nous avons normalisé la distance géographique et la distance du PIB, puis nous avons calculé la distance entre ces deux chiffres normalisés. Cela crée une surface gaussienne lissée qui dépend à la fois de la proximité spatiale et de la proximité du PIB par habitant. Nous avons comparé les ratios de, 1:0, 1:1, 2:1, 1:2 (Géographique:PIB). </p> <p>Pour chaque matrice de proximité différente, nous avons également dû sélectionner une distance de voisinage, c'est-à-dire sur quelle distance un pays peut être affecté par un autre. Ainsi, nous avons également fait varier le rayon de la distance à partir de laquelle sélectionner les voisins pour le réseau de voisinage, nous avons utilisé la distance minimale maximale, deux fois la distance minimale maximale et trois fois la distance minimale maximale, faisant ainsi varier le nombre de voisins que chaque pays aurait. </p> <p>Enfin, pour décider de l'ampleur de l'effet d'un pays sur un autre dans le réseau de voisinage, nous avons fait varier les poids des paires de pays dans la matrice de contiguïté, en utilisant soit un poids neutre de 1, de sorte que chaque voisin a un effet égal sur l'autre (ne dépendant pas de la distance dans le réseau), soit des poids décroissants sur la distance avec 1/distance, et 1/distance2, où plus le pays est proche, plus l'effet qu'il a sur un autre pays est important. Le résultat de ces 36 combinaisons différentes a permis de trouver un DIC (Deviance Information Criterion) minimum pour un rapport de 1:2 (Géographie:PIB), la distance minimum des réseaux de voisinage étant le double de la distance minimum maximum et une pondération égale de 1/distance pour chaque pays adjacent. </p> <p>Cette structure de modèle produit des estimations pour tous les effets fixes et aussi pour le risque au niveau de chaque pays, ce qui fournit des informations sur ceux qui sont significativement plus ou moins exposés au risque moyen. </p> <p>Tous les paramètres ont été donnés des antécédents non informatifs. Des simulations ont été effectuées avec 3 chaînes MCMC avec 50 000 brûlures en itérations et chaque paramètre a été estimé à partir de 1000 échantillons prélevés sur 250 000 itérations diluées pour produire la distribution postérieure. La convergence a été atteinte, avec r&#x302 ; des valeurs toutes très proches de 1.000. Grâce au cadre bayésien et au logiciel WinBUGS, il a été possible d'obtenir des estimations pour les pays où nous ne disposions pas de données sur la prévalence, en utilisant leur PIB et leur proximité géographique pour étayer cette estimation. Les pays ayant réalisé le plus grand nombre d'études ont fourni les estimations avec les intervalles de confiance les plus étroits et ceux qui n'avaient que peu ou pas de données étaient moins bien définis, produisant souvent une distribution postérieure log-normale, donnant des estimations avec de longues queues. </p> <p>Les distributions postérieures des paramètres ont été inspectées pour vérifier la convergence et la covariance entre les paramètres. Le cas échéant, les paramètres ont été centrés et mis à l'échelle N (0, 1) pour faciliter la convergence des paramètres et la covariance de la suppression. Cela a été fait pour le paramètre du sexe, qui a été saisi comme la proportion de l'échantillon qui était féminine ; on a constaté qu'il variait avec les paramètres d'interception et de biais avant de recentrer et de mettre à l'échelle. Cependant, la covariance de la vaccination de routine et de la dose à la naissance a persisté même après le recadrage. Cela n'est pas surprenant car il y a eu quelques cas où la dose à la naissance a été administrée sans la vaccination de routine. Nous avons essayé ici de réduire cette interaction des termes en transformant les données relatives à la dose de naissance. Nous avons modélisé la dose de naissance en utilisant uniquement les données où la dose de naissance était supérieure à 60, 70, 80 &amp ; 90% respectivement, nous avons également modélisé la dose de naissance au carré, augmentant ainsi l'effet des doses de naissance élevées par rapport aux doses plus faibles. Le choix du modèle dépendait de celui qui réduisait la covariance entre les paramètres et donnait le score CIVD le plus bas. </p> <p>La validation du modèle a été réalisée en utilisant 90 % des données sélectionnées au hasard par rapport aux 10 % restants, et en comparant les estimations de la prévalence du modèle aux données observées (figure 3). La figure 4 montre la prévalence moyenne dans chaque pays à partir de toutes les études tracées par rapport à l'estimation du modèle. La figure 5 montre les distributions marginales et articulaires postérieures pour les paramètres ajustés. Le tableau 1 donne les valeurs estimées des paramètres avec les intervalles crédibles associés. <p>Au cours de l'exercice de validation (dans lequel les pays ont été consultés sur leurs estimations), il a été souligné que la Chine avait entrepris trois enquêtes sérologiques à très grande échelle dans la population afin d'établir la prévalence de base et les progrès vers l'élimination du VHB. Il y avait un grand nombre d'autres enquêtes en Chine, qui sont moins représentatives que ces trois enquêtes nationales. Nous avons effectué une analyse de sensibilité en limitant les données de la Chine aux trois enquêtes représentatives au niveau national. Cette modification des données d'entrée a eu pour effet de rendre l'effet de la vaccination plus distinct, mais les effets estimés sur l'âge (changement de la prévalence chez les enfants de moins de 5 ans, ou les jeunes (enfants de 5 à 15 ans)) n'étaient plus significativement différents de zéro (voir tableau 2 et figure 6). L'écart a été réduit de manière significative, ce qui suggère un modèle beaucoup plus adapté (tableau 2), bien que sur un ensemble de données quelque peu réduit.</p> 2 years ago
NelMed Translation changed SDG Metadata 3-3-4 French	English <p>The data was modelled using a Bayesian logistic regression looking at the proportion of individuals that tested positive for HBsAg in each study, weighting each study by its size and using a conditional autoregressive (CAR) model accounting for spatial and economic correlations between similar countries. This model uses data from well sampled countries to estimate prevalence in more data poor countries with effects such as sex, age and vaccination status, these are also informed by the geographic and countries GDP proximity to other countries (CAR model). Under the assumption that countries that are close together economically and/or geographically will have more similar prevalence due to similar social structure and health care capabilities. </p> <p>The response variable in the model was the prevalence of Hepatitis surface antigen (HBsAg) with the explanatory variables being age (three categories, under 5, juvenile (5-15) and adult (16+), split using the average age of participants in the study), sex (proportion female in the study), study bias (e.g. a high fraction of study participants from indigenous populations), 3 dose vaccine coverage, birth dose of the vaccine and country of study. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The WHO-UNICEF estimates are annual data for the country as a whole, and did not contain information on vaccine efficacy which was not used in the analysis as no data on this was obtained. The vaccine efficacy would be implicitly estimated in the analysis as we see vaccination having a variable effect across time and space across the studies. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. More explicitly, the model uses the ages and timing of the study to calculate the years across which the participants are born, so if the if there was an age group range of 10-15 in a study that was undertaken in 2015, the birth years would be from 2000-2005, we then average the vaccination coverage from the WHO-UNICEF estimates across those 5 years assuming that each age was evenly represented in that age group in the study. The same process was used for the 3 dose and birth dose vaccination. </p> <p> </p> <p>The general logistic model equation is described below, </p> <p>Yi ~Binomial (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p> <p> </p> <p>Where βj are the fixed effects of the explanatory variables xii. With the spatial random effects described by </p> <p>ui~ N(u−i,σ2u/ni)</p> <p> , </p> <p>where, </p> <p>u−i= ∑j ∈ neigh(i)wiuj/ni</p> <p>Where ni is the number of neighbours for country i and weights wi, are 1. </p> <p> </p> <p>The model was simulated in the Bayesian statistical package WinBUGS, and data manipulation and model initialisation run from R (3.3.1) using R2WinBUGS. The model considers the parameters of age, sex, study bias (e.g. a high fraction of study participants from indigenous populations), vaccine coverage, birth dose of the vaccine and country of study. </p> <p>The model uses the CAR-normal function, in WinBUGS, to model the spatial and economic autocorrelation related to neighbouring countries. For each country that had prevalence data, a weighted central position was calculated using the size and location of each study. For those countries with no data, we used the population centroid. In a novel approach, we considered 3 dimensions in the country adjacency matrix; we used the usual geographic dimensions, latitude and longitude and also combined these with the natural log of the country’s GDP per capita. This was to measure not only geographic but also the developmental proximity of countries. The adjacency matrix for the geo-economic distance gives a score between each country to every other country. Those countries which are close geographically and economically would have a low score and those further apart either geographically or economically would have a high score/distance. Therefore, those countries that are more alike will have a low score and those countries which are alike would have a high score. </p> <p>The way we proportioned the geographic and economic distance to produce the adjacency matrix was then explored, this is because geographic distance may be more or less important than economic similarities. Thus, by creating a number of different adjacency matrices (not definitive) we could select the most suitable matrix that explains reality best. We normalised the geographic and GDP distance and then calculated the distance between these two normalised figures. This creates a smoothed Gaussian surface that is dependent on both spatial proximity and GDP per-capita proximity. We compared ratios of, 1:0, 1:1, 2:1, 1:2 (Geographic:GDP). </p> <p>For each different adjacency matrix, we also had to select a neighbourhood distance, i.e. over what distance can a country be effected by another. Thus, we also varied the radius of distance from which to select neighbours for the neighbourhood network, we used the maximum minimum distance, twice the maximum minimum and three times the maximum minimum, thus varying the number of neighbours each country would have. </p> <p> </p> <p>Finally, to decide the magnitude of the effect one country has on another in the neighbourhood network we varied the weights of pairs of countries in the adjacency matrix, using either a neutral weighting of 1, so that each neighbour has an equal effect on each other (not dependent on the distance in the network), or decaying weights over distance with 1/distance, and 1/distance2, where the closer the country is the greater the effect it has on another country. The outcome of these 36 different combinations led to minimum DIC (Deviance Information Criterion) being found for a ratio of 1:2 (Geographic:GDP), the neighbourhood networks minimum distance being twice the maximum minimum distance and an even weighting of 1/distance for each adjacent country. </p> <p>This model structure produces estimates for all fixed effects and also individual country level risk, this provides information on which are significantly at greater or lower risk to the average risk. </p> <p>All parameters were given un-informative priors. Simulations were run with 3 MCMC chains with 50,000 burn in iterations and each parameter estimated from 1000 samples taken from a thinned 250,000 iterations to produce the posterior distribution. Convergence was attained, with r̂ values all very close to 1.000. Due to the Bayesian framework and WinBUGS software it was possible to gain estimates for countries where we had no data on prevalence, using their GDP and geographic proximity to inform this estimate. Those countries with the largest number of studies provided the estimates with the tightest confidence intervals and those with few or no data were less well defined, often producing a log normal distributed posterior distribution, giving estimates with long tails. </p> <p>Posterior distributions of parameters were inspected for convergence and to check for covariance between parameters. Where necessary parameters were centred and scaled to N (0, 1) to aid parameter convergence and remover covariance. This was done for the sex parameter, which was entered as the proportion of the sample that was female; this was seen to co-vary with the intercept and bias parameters before re-centring and scaling. However, the covariance of routine vaccination and birth dose persisted even after re-centring. This is in part unsurprising as there a few instances where birth dose is administered without the routine vaccination. Here we tried to reduce this interaction of the terms by transforming the birth dose data. We modelled birth dose using only data where the birth dose was greater than 60, 70, 80 & 90% respectively, we also modelled birth dose to the square, thus increasing the effect of high birth doses over smaller doses. Model selection dependent on which one both reduced the covariance between the parameters and returned the lowest DIC score. </p> <p>Model validation was conducted using 90% of randomly selected data against the remaining 10%, and by comparing model estimates of prevalence against observed data (Figure 3). Figure 4 shows the average prevalence in each country from all the studies plotted against the models estimate. Figure 5 shows the marginal and joint posterior distributions for the fitted parameters. Table 1 gives the estimated parameter values with associated credible intervals. </p> <p>During the validation exercise (in which countries were consulted over their estimates) it was pointed out that China had undertaken three very large-scale population-based serological surveys in order to establish baseline prevalence and progress towards HBV elimination. There were a large number of other surveys from China, that are less representative than these three nationwide surveys. We conducted a sensitivity analysis by restricting the data from China to the three nationally representative surveys. The effect of this change in input data was that the effect of vaccination was more distinct, but the estimated age effects (change in prevalence in children under 5, or juveniles (children 5-15 years)) were no longer significantly different from zero (see Table 2 and Figure 6). The deviance was significantly reduced, suggesting a much better fitting model (Table 2), albeit on a somewhat reduced dataset. </p> French 6 characters edited <h1>Méthodologie</h1> <h2>Méthode de calcul :</h2> <p>Les données ont été modélisées à l'aide d'une régression logistique bayésienne examinant la proportion d'individus testés positifs pour l'HBsAg dans chaque étude, en pondérant chaque étude par sa taille et en utilisant un modèle autorégressif conditionnel (CAR) tenant compte des corrélations spatiales et économiques entre des pays similaires. Ce modèle utilise des données provenant de pays bien échantillonnés pour estimer la prévalence dans des pays pauvres en données, avec des effets tels que le sexe, l'âge et le statut vaccinal, qui sont également informés par la proximité géographique et le PIB des pays par rapport aux autres pays (modèle CAR). En partant de l'hypothèse que les pays qui sont proches économiquement et/ou géographiquement, auront une prévalence plus similaire en raison de leur structure sociale et de leurs capacités en matière de soins de santé. </p> <p>La variable de réponse dans le modèle était la prévalence de l'antigène de surface de l'hépatite (HBsAg), les variables explicatives étant l'âge (trois catégories, moins de 5 ans, jeunes (5 à 15 ans) et adultes (16 et +), réparties en fonction de l'âge moyen des participants à l'étude), le sexe (proportion de femmes dans l'étude), le biais de l'étude (par exemple, une forte proportion de participants à l'étude issus de populations indigènes), la couverture vaccinale de 3 doses, la dose de naissance du vaccin et le pays de l'étude. La couverture de la vaccination de routine en 3 doses et de la vaccination à la naissance dans chaque étude, a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale de l'Organisation mondiale de la Santé (OMS) et de le Fonds des Nations Unies pour l'enfance (UNICEF) pour ce pays. Les estimations OMS-UNICEF sont des données annuelles pour l'ensemble du pays et ne contiennent pas de l'informations sur l'efficacité du vaccin qui n'ont pas été utilisées dans l'analyse, car aucune donnée n'a été obtenue à ce sujet. L'efficacité du vaccin serait implicitement estimée dans l'analyse, car nous constatons que la vaccination a un effet variable dans le temps et dans l'espace selon les études. La couverture de la vaccination de routine à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale de l'OMS et de l'UNICEF pour ce pays. La couverture de la vaccination systématique par trois doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale OMS-UNICEF pour ce pays. Plus explicitement, le modèle utilise l'âge et le moment de l'étude pour calculer les années de naissance des participants. Ainsi, s'il y avait une tranche d'âge de 10- à 15 ans dans une étude entreprise en 2015, les années de naissance seraient de 2000- à 2005, nous faisons alors la moyenne de la couverture vaccinale des estimations OMS-UNICEF sur ces 5 années en supposant que chaque âge est représenté de manière égale dans cette tranche d'âge dans l'étude. Le même processus a été utilisé pour la vaccination à 3 doses et la vaccination à la naissance. </p> <p>L'équation générale du modèle logistique est décrite ci-dessous, </p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAeEAAABRCAMAAADSKe79AAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAK1UExURf////T09NTU1Nzc3Pz8/O/v79DQ0Pr6+qampnh4eHR0dMLCwpGRkXp6em1tbc/Pz+Li4snJydfX11NTU4KCgt3d3erq6m9vb6Wlpby8vFZWVr6+vvHx8X19fZ+fn3Fxcf7+/uzs7K+vr+7u7l1dXZSUlP39/WdnZ9PT01VVVaenp4yMjJaWlre3t1RUVIiIiLCwsKKiouTk5J2dnWNjY+Pj4+vr6/j4+PX19YaGhoSEhPf399/f3/Dw8Pv7+4uLi2JiYl9fX6CgoNbW1pKSkpWVla2traysrHd3d66urvb29o+Pj0pKSktLS+jo6NXV1fn5+bGxsYODg2xsbGRkZOfn59jY2GlpaYmJicjIyGZmZmFhYY2NjZmZmXZ2duDg4Lm5uc3NzbKysk9PT25ubp6entHR0cDAwPPz81tbW1dXV6GhoWtra3BwcO3t7enp6YGBgbi4uJOTk7W1tVFRUXl5eX9/f+bm5tvb27+/v7Ozs7S0tM7Ozn5+ft7e3tra2uHh4cXFxfLy8nJycnV1daOjo5CQkJubm46OjsPDw8bGxk5OTqioqJeXl3x8fFJSUlBQUMzMzKqqql5eXlhYWMHBwWpqamBgYMrKyoWFhU1NTbq6utnZ2ampqZqamkxMTFxcXOXl5cvLy3Nzc4qKimVlZVlZWba2toCAgLu7u729vaSkpNLS0qurq5iYmIeHh8fHx1paWmhoaHt7e5ycnMTExLGtrfayso9ubvze3ptUVGhnZ/vc3MllZXFvb/3y8vivr/739//+/vvX17VXV3Vqav3r69pdXWtMTP/8/NiAgJhcXOfk5P79/fi6uvixse3q6v78/LN3d6g+PvGSkoBTU8u+vp5AQOy3t/rIyPWYmOLU1JKRkYBXV/WGhui0tJ6dncXExHRjY+GEhPWQkMGysgAAAH/C7rcA <p>Where βj sont les effets fixes des variables explicatives <em>x<sub>ii</sub></em>. Avec les effets aléatoires spatiaux décrits par </p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAJsAAAAuCAMAAAAIuJt4AAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAIfUExURf////r6+vLy8vHx8e/v7/X19f7+/r+/v319faenp7CwsIiIiIaGhuXl5fz8/ODg4KSkpMDAwLu7u/39/crKylhYWLKysp2dndHR0fv7+7y8vF1dXYuLi+np6dTU1FlZWaqqqoCAgPn5+WBgYJGRkcLCwmdnZ0pKSlZWVuvr62xsbExMTI6OjuHh4bW1tc7OztPT0/b29pubm15eXtXV1VtbW8vLy9LS0mpqaoeHh+rq6pKSkk5OTk1NTaysrPf395WVlV9fX1dXV5+fn6urq3p6eomJib29vWhoaLe3t35+fnNzc+7u7tra2mNjY4KCgnBwcPT09IyMjFVVVcjIyFxcXKOjo/j4+Nvb21RUVKKiomFhYePj4+zs7N3d3aCgoHh4eFNTU3t7e6WlpcnJyVpaWtzc3OTk5N/f3+bm5szMzJiYmOjo6PDw8MXFxY2NjWZmZuLi4tDQ0JeXl2VlZVFRUdfX166uroODg2JiYo+Pj3l5eXFxcWRkZJSUlN7e3r6+vufn57i4uIqKipCQkIWFhcbGxm1tbe3t7dnZ2bq6und3d8TExHZ2doGBgVBQUHx8fK+vr5mZmX9/f7a2tqmpqaGhofPz85OTk2lpaYSEhJaWlk9PT6ioqJ6enrOzs29vb8PDw3JyclJSUpycnMfHx7S0tM/Pz2tra9jY2EtLS7GxsZqams3Nza2trcHBwXR0dKamprm5udbW1gAAAPSlTP8AAAC1dFJOU/////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////// <p>où,</p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAPQAAABNCAMAAACmNLlxAAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAIlUExURf////7+/v39/bW1tZ6enujo6I+Pj0pKSktLS01NTdXV1e/v72xsbE5OTqWlpfT09Pf39/X19dHR0WBgYL+/v1paWl9fX6Ojo3Nzc+Hh4fHx8VxcXIqKin9/f+zs7IuLi+fn52tra1FRUaurq/n5+cDAwFdXV9fX18PDw2JiYmVlZc3Nzevr68XFxfj4+KqqqmZmZubm5oCAgIiIiPDw8HR0dFRUVK6urtPT08nJyVBQUOnp6e3t7UxMTJCQkO7u7sfHx7q6unp6eqKiol5eXuXl5ampqVJSUpeXl/r6+l1dXc/Pz6+vr9nZ2bS0tNLS0vz8/LGxsVZWVn5+foKCgtbW1ry8vPb29uPj43FxcaioqLm5ucrKyvv7+8bGxq2trbCwsLu7u8zMzM7OzuLi4o2NjU9PT2dnZ8jIyGNjY2RkZFlZWdTU1MTExPLy8m1tbZSUlODg4IWFhXV1dWhoaJWVlVhYWFVVVcHBwaGhoVtbW2FhYXd3d8LCwri4uIyMjKysrJGRkYSEhHx8fJaWloODg/Pz825ubnBwcIeHh6SkpH19fXZ2dp2dnXl5eVNTU5ycnN3d3W9vb4aGhtvb23h4eOrq6rOzs5mZmaamptDQ0Gpqat7e3t/f35iYmI6OjomJidjY2Kenp76+vre3t2lpaXt7e3JycuTk5JOTk7Kyspqampubm7a2tpKSktra2svLy6CgoIGBgb29vZ+fn9zc3AAAAEw+Zl4AAAC3dFJOU/////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////// <p>où <em>n<sub>i</sub></em> est le nombre de voisins pour le pays <em>i</em> et les poids <em>w<sub>i</sub></em>, sont 1. </p> <p>Le modèle a été simulé dans le progiciel statistique bayésien WinBUGS, et la manipulation des données et l'initialisation du modèle ont été effectuées à partir de R (3.3.1) en utilisant R2WinBUGS. Le modèle prend en compte les paramètres de l'âge, du sexe, du biais de l'étude (par exemple, une forte proportion de participants à l'étude issus de populations indigènes), de la couverture vaccinale, de la dose de naissance du vaccin et du pays d'étude. </p> <p>Le modèle utilise la fonction CAR-normale, dans WinBUGS, pour modéliser l'autocorrélation spatiale et économique liée aux pays voisins. Pour chaque pays disposant de données de prévalence, une position centrale pondérée a été calculée en utilisant la taille et la localisation de chaque étude. Pour les pays ne disposant pas de données, nous avons utilisé le centroïde de la population. Dans une nouvelle approche, nous avons pris en compte trois dimensions dans la matrice de contiguïté des pays ; nous avons utilisé les dimensions géographiques habituelles, la latitude et la longitude, et les avons également combinées avec le logarithme naturel du PIB par habitant du pays. Il s'agissait de mesurer non seulement la proximité géographique, mais aussi la proximité de développement des pays. La matrice de proximité pour la distance géo-économique donne un score entre chaque pays et chaque autre pays. Les pays qui sont proches géographiquement et économiquement ont un score faible et ceux qui sont plus éloignés géographiquement ou économiquement ont un score/distance élevé. Par conséquent, les pays qui se ressemblent le plus auront un score faible et les pays qui se ressemblent un score élevé. </p> <p>La façon dont nous avons proportionné la distance géographique et économique pour produire la matrice de contiguïté a ensuite été explorée, car la distance géographique peut être plus ou moins importante que les similitudes économiques. Ainsi, en créant un certain nombre de matrices de contiguïté différentes (non définitives), nous avons pu sélectionner la matrice la plus appropriée qui explique le mieux la réalité. Nous avons normalisé la distance géographique et la distance du PIB, puis nous avons calculé la distance entre ces deux chiffres normalisés. Cela crée une surface gaussienne lissée qui dépend à la fois de la proximité spatiale et de la proximité du PIB par habitant. Nous avons comparé les ratios de, 1:0, 1:1, 2:1, 1:2 (Géographique:PIB). </p> <p>Pour chaque matrice de proximité différente, nous avons également dû sélectionner une distance de voisinage, c'est-à-dire sur quelle distance un pays peut être affecté par un autre. Ainsi, nous avons également fait varier le rayon de la distance à partir de laquelle sélectionner les voisins pour le réseau de voisinage, nous avons utilisé la distance minimale maximale, deux fois la distance minimale maximale et trois fois la distance minimale maximale, faisant ainsi varier le nombre de voisins que chaque pays aurait. </p> <p>Enfin, pour décider de l'ampleur de l'effet d'un pays sur un autre dans le réseau de voisinage, nous avons fait varier les poids des paires de pays dans la matrice de contiguïté, en utilisant soit un poids neutre de 1, de sorte que chaque voisin a un effet égal sur l'autre (ne dépendant pas de la distance dans le réseau), soit des poids décroissants sur la distance avec 1/distance, et 1/distance2, où plus le pays est proche, plus l'effet qu'il a sur un autre pays est important. Le résultat de ces 36 combinaisons différentes a permis de trouver un DIC (Deviance Information Criterion) minimum pour un rapport de 1:2 (Géographie:PIB), la distance minimum des réseaux de voisinage étant le double de la distance minimum maximum et une pondération égale de 1/distance pour chaque pays adjacent. </p> <p>Cette structure de modèle produit des estimations pour tous les effets fixes et aussi pour le risque au niveau de chaque pays, ce qui fournit des informations sur ceux qui sont significativement plus ou moins exposés au risque moyen. </p> <p>Tous les paramètres ont été donnés des antécédents non informatifs. Des simulations ont été effectuées avec 3 chaînes MCMC avec 50 000 brûlures en itérations et chaque paramètre a été estimé à partir de 1000 échantillons prélevés sur 250 000 itérations diluées pour produire la distribution postérieure. La convergence a été atteinte, avec r&#x302 ; des valeurs toutes très proches de 1.000. Grâce au cadre bayésien et au logiciel WinBUGS, il a été possible d'obtenir des estimations pour les pays où nous ne disposions pas de données sur la prévalence, en utilisant leur PIB et leur proximité géographique pour étayer cette estimation. Les pays ayant réalisé le plus grand nombre d'études ont fourni les estimations avec les intervalles de confiance les plus étroits et ceux qui n'avaient que peu ou pas de données étaient moins bien définis, produisant souvent une distribution postérieure log-normale, donnant des estimations avec de longues queues. </p> <p>Les distributions postérieures des paramètres ont été inspectées pour vérifier la convergence et la covariance entre les paramètres. Le cas échéant, les paramètres ont été centrés et mis à l'échelle N (0, 1) pour faciliter la convergence des paramètres et la covariance de la suppression. Cela a été fait pour le paramètre du sexe, qui a été saisi comme la proportion de l'échantillon qui était féminine ; on a constaté qu'il variait avec les paramètres d'interception et de biais avant de recentrer et de mettre à l'échelle. Cependant, la covariance de la vaccination de routine et de la dose à la naissance a persisté même après le recadrage. Cela n'est pas surprenant car il y a eu quelques cas où la dose à la naissance a été administrée sans la vaccination de routine. Nous avons essayé ici de réduire cette interaction des termes en transformant les données relatives à la dose de naissance. Nous avons modélisé la dose de naissance en utilisant uniquement les données où la dose de naissance était supérieure à 60, 70, 80 &amp ; 90% respectivement, nous avons également modélisé la dose de naissance au carré, augmentant ainsi l'effet des doses de naissance élevées par rapport aux doses plus faibles. Le choix du modèle dépendait de celui qui réduisait la covariance entre les paramètres et donnait le score CIVD le plus bas. </p> <p>La validation du modèle a été réalisée en utilisant 90 % des données sélectionnées au hasard par rapport aux 10 % restants, et en comparant les estimations de la prévalence du modèle aux données observées (figure 3). La figure 4 montre la prévalence moyenne dans chaque pays à partir de toutes les études tracées par rapport à l'estimation du modèle. La figure 5 montre les distributions marginales et articulaires postérieures pour les paramètres ajustés. Le tableau 1 donne les valeurs estimées des paramètres avec les intervalles crédibles associés. <p>Au cours de l'exercice de validation (dans lequel les pays ont été consultés sur leurs estimations), il a été souligné que la Chine avait entrepris trois enquêtes sérologiques à très grande échelle dans la population afin d'établir la prévalence de base et les progrès vers l'élimination du VHB. Il y avait un grand nombre d'autres enquêtes en Chine, qui sont moins représentatives que ces trois enquêtes nationales. Nous avons effectué une analyse de sensibilité en limitant les données de la Chine aux trois enquêtes représentatives au niveau national. Cette modification des données d'entrée a eu pour effet de rendre l'effet de la vaccination plus distinct, mais les effets estimés sur l'âge (changement de la prévalence chez les enfants de moins de 5 ans, ou les jeunes (enfants de 5 à 15 ans)) n'étaient plus significativement différents de zéro (voir tableau 2 et figure 6). L'écart a été réduit de manière significative, ce qui suggère un modèle beaucoup plus adapté (tableau 2), bien que sur un ensemble de données quelque peu réduit.</p> 3 years ago
NelMed Translation changed SDG Metadata 3-3-4 French	English <p>The data was modelled using a Bayesian logistic regression looking at the proportion of individuals that tested positive for HBsAg in each study, weighting each study by its size and using a conditional autoregressive (CAR) model accounting for spatial and economic correlations between similar countries. This model uses data from well sampled countries to estimate prevalence in more data poor countries with effects such as sex, age and vaccination status, these are also informed by the geographic and countries GDP proximity to other countries (CAR model). Under the assumption that countries that are close together economically and/or geographically will have more similar prevalence due to similar social structure and health care capabilities. </p> <p>The response variable in the model was the prevalence of Hepatitis surface antigen (HBsAg) with the explanatory variables being age (three categories, under 5, juvenile (5-15) and adult (16+), split using the average age of participants in the study), sex (proportion female in the study), study bias (e.g. a high fraction of study participants from indigenous populations), 3 dose vaccine coverage, birth dose of the vaccine and country of study. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The WHO-UNICEF estimates are annual data for the country as a whole, and did not contain information on vaccine efficacy which was not used in the analysis as no data on this was obtained. The vaccine efficacy would be implicitly estimated in the analysis as we see vaccination having a variable effect across time and space across the studies. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. More explicitly, the model uses the ages and timing of the study to calculate the years across which the participants are born, so if the if there was an age group range of 10-15 in a study that was undertaken in 2015, the birth years would be from 2000-2005, we then average the vaccination coverage from the WHO-UNICEF estimates across those 5 years assuming that each age was evenly represented in that age group in the study. The same process was used for the 3 dose and birth dose vaccination. </p> <p> </p> <p>The general logistic model equation is described below, </p> <p>Yi ~Binomial (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p> <p> </p> <p>Where βj are the fixed effects of the explanatory variables xii. With the spatial random effects described by </p> <p>ui~ N(u−i,σ2u/ni)</p> <p> , </p> <p>where, </p> <p>u−i= ∑j ∈ neigh(i)wiuj/ni</p> <p>Where ni is the number of neighbours for country i and weights wi, are 1. </p> <p> </p> <p>The model was simulated in the Bayesian statistical package WinBUGS, and data manipulation and model initialisation run from R (3.3.1) using R2WinBUGS. The model considers the parameters of age, sex, study bias (e.g. a high fraction of study participants from indigenous populations), vaccine coverage, birth dose of the vaccine and country of study. </p> <p>The model uses the CAR-normal function, in WinBUGS, to model the spatial and economic autocorrelation related to neighbouring countries. For each country that had prevalence data, a weighted central position was calculated using the size and location of each study. For those countries with no data, we used the population centroid. In a novel approach, we considered 3 dimensions in the country adjacency matrix; we used the usual geographic dimensions, latitude and longitude and also combined these with the natural log of the country’s GDP per capita. This was to measure not only geographic but also the developmental proximity of countries. The adjacency matrix for the geo-economic distance gives a score between each country to every other country. Those countries which are close geographically and economically would have a low score and those further apart either geographically or economically would have a high score/distance. Therefore, those countries that are more alike will have a low score and those countries which are alike would have a high score. </p> <p>The way we proportioned the geographic and economic distance to produce the adjacency matrix was then explored, this is because geographic distance may be more or less important than economic similarities. Thus, by creating a number of different adjacency matrices (not definitive) we could select the most suitable matrix that explains reality best. We normalised the geographic and GDP distance and then calculated the distance between these two normalised figures. This creates a smoothed Gaussian surface that is dependent on both spatial proximity and GDP per-capita proximity. We compared ratios of, 1:0, 1:1, 2:1, 1:2 (Geographic:GDP). </p> <p>For each different adjacency matrix, we also had to select a neighbourhood distance, i.e. over what distance can a country be effected by another. Thus, we also varied the radius of distance from which to select neighbours for the neighbourhood network, we used the maximum minimum distance, twice the maximum minimum and three times the maximum minimum, thus varying the number of neighbours each country would have. </p> <p> </p> <p>Finally, to decide the magnitude of the effect one country has on another in the neighbourhood network we varied the weights of pairs of countries in the adjacency matrix, using either a neutral weighting of 1, so that each neighbour has an equal effect on each other (not dependent on the distance in the network), or decaying weights over distance with 1/distance, and 1/distance2, where the closer the country is the greater the effect it has on another country. The outcome of these 36 different combinations led to minimum DIC (Deviance Information Criterion) being found for a ratio of 1:2 (Geographic:GDP), the neighbourhood networks minimum distance being twice the maximum minimum distance and an even weighting of 1/distance for each adjacent country. </p> <p>This model structure produces estimates for all fixed effects and also individual country level risk, this provides information on which are significantly at greater or lower risk to the average risk. </p> <p>All parameters were given un-informative priors. Simulations were run with 3 MCMC chains with 50,000 burn in iterations and each parameter estimated from 1000 samples taken from a thinned 250,000 iterations to produce the posterior distribution. Convergence was attained, with r̂ values all very close to 1.000. Due to the Bayesian framework and WinBUGS software it was possible to gain estimates for countries where we had no data on prevalence, using their GDP and geographic proximity to inform this estimate. Those countries with the largest number of studies provided the estimates with the tightest confidence intervals and those with few or no data were less well defined, often producing a log normal distributed posterior distribution, giving estimates with long tails. </p> <p>Posterior distributions of parameters were inspected for convergence and to check for covariance between parameters. Where necessary parameters were centred and scaled to N (0, 1) to aid parameter convergence and remover covariance. This was done for the sex parameter, which was entered as the proportion of the sample that was female; this was seen to co-vary with the intercept and bias parameters before re-centring and scaling. However, the covariance of routine vaccination and birth dose persisted even after re-centring. This is in part unsurprising as there a few instances where birth dose is administered without the routine vaccination. Here we tried to reduce this interaction of the terms by transforming the birth dose data. We modelled birth dose using only data where the birth dose was greater than 60, 70, 80 & 90% respectively, we also modelled birth dose to the square, thus increasing the effect of high birth doses over smaller doses. Model selection dependent on which one both reduced the covariance between the parameters and returned the lowest DIC score. </p> <p>Model validation was conducted using 90% of randomly selected data against the remaining 10%, and by comparing model estimates of prevalence against observed data (Figure 3). Figure 4 shows the average prevalence in each country from all the studies plotted against the models estimate. Figure 5 shows the marginal and joint posterior distributions for the fitted parameters. Table 1 gives the estimated parameter values with associated credible intervals. </p> <p>During the validation exercise (in which countries were consulted over their estimates) it was pointed out that China had undertaken three very large-scale population-based serological surveys in order to establish baseline prevalence and progress towards HBV elimination. There were a large number of other surveys from China, that are less representative than these three nationwide surveys. We conducted a sensitivity analysis by restricting the data from China to the three nationally representative surveys. The effect of this change in input data was that the effect of vaccination was more distinct, but the estimated age effects (change in prevalence in children under 5, or juveniles (children 5-15 years)) were no longer significantly different from zero (see Table 2 and Figure 6). The deviance was significantly reduced, suggesting a much better fitting model (Table 2), albeit on a somewhat reduced dataset. </p> French 47 characters edited <h1>Méthodologie</h1> <h2>Méthode de calcul :</h2> <p>Les données ont été modélisées à l'aide d'une régression logistique bayésienne examinant la proportion d'individus testés positifs pour l'HBsAg dans chaque étude, en pondérant chaque étude par sa taille et en utilisant un modèle autorégressif conditionnel (CAR) tenant compte des corrélations spatiales et économiques entre des pays similaires. Ce modèle utilise des données provenant de pays bien échantillonnés pour estimer la prévalence dans des pays pauvres en données, avec des effets tels que le sexe, l'âge et le statut vaccinal, qui sont également informés par la proximité géographique et le PIB des pays par rapport aux autres pays (modèle CAR). En partant de l'hypothèse que les pays qui sont proches économiquement et/ou géographiquement, auront une prévalence plus similaire en raison de leur structure sociale et de leurs capacités en matière de soins de santé. </p> <p>La variable de réponse dans le modèle était la prévalence de l'antigène de surface de l'hépatite (HBsAg), les variables explicatives étant l'âge (trois catégories, moins de 5 ans, jeunes (5 à 15 ans) et adultes (16 et +), réparties en fonction de l'âge moyen des participants à l'étude), le sexe (proportion de femmes dans l'étude), le biais de l'étude (par exemple, une forte proportion de participants à l'étude issus de populations indigènes), la couverture vaccinale de 3 doses, la dose de naissance du vaccin et le pays de l'étude. La couverture de la vaccination de routine en 3 doses et de la vaccination à la naissance dans chaque étude, a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale de l'Organisation mondiale de la Santé (OMS) et de l'e Fonds des Nations Unies pour l'enfance (UNICEF) pour ce pays. Les estimations OMS-UNICEF sont des données annuelles pour l'ensemble du pays et ne contiennent pas de l'informations sur l'efficacité du vaccin qui n'ont pas été utilisées dans l'analyse, car aucune donnée n'a été obtenue à ce sujet. L'efficacité du vaccin serait implicitement estimée dans l'analyse, car nous constatons que la vaccination a un effet variable dans le temps et dans l'espace selon les études. La couverture de la vaccination de routine à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale de l'OMS et de l'UNICEF pour ce pays. La couverture de la vaccination systématique par trois doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale OMS-UNICEF pour ce pays. Plus explicitement, le modèle utilise l'âge et le moment de l'étude pour calculer les années de naissance des participants. Ainsi, s'il y avait une tranche d'âge de 10-15 ans dans une étude entreprise en 2015, les années de naissance seraient de 2000-2005, nous faisons alors la moyenne de la couverture vaccinale des estimations OMS-UNICEF sur ces 5 années en supposant que chaque âge est représenté de manière égale dans cette tranche d'âge dans l'étude. Le même processus a été utilisé pour la vaccination à 3 doses et la vaccination à la naissance. </p> <p>L'équation générale du modèle logistique est décrite ci-dessous, </p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAeEAAABRCAMAAADSKe79AAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAK1UExURf////T09NTU1Nzc3Pz8/O/v79DQ0Pr6+qampnh4eHR0dMLCwpGRkXp6em1tbc/Pz+Li4snJydfX11NTU4KCgt3d3erq6m9vb6Wlpby8vFZWVr6+vvHx8X19fZ+fn3Fxcf7+/uzs7K+vr+7u7l1dXZSUlP39/WdnZ9PT01VVVaenp4yMjJaWlre3t1RUVIiIiLCwsKKiouTk5J2dnWNjY+Pj4+vr6/j4+PX19YaGhoSEhPf399/f3/Dw8Pv7+4uLi2JiYl9fX6CgoNbW1pKSkpWVla2traysrHd3d66urvb29o+Pj0pKSktLS+jo6NXV1fn5+bGxsYODg2xsbGRkZOfn59jY2GlpaYmJicjIyGZmZmFhYY2NjZmZmXZ2duDg4Lm5uc3NzbKysk9PT25ubp6entHR0cDAwPPz81tbW1dXV6GhoWtra3BwcO3t7enp6YGBgbi4uJOTk7W1tVFRUXl5eX9/f+bm5tvb27+/v7Ozs7S0tM7Ozn5+ft7e3tra2uHh4cXFxfLy8nJycnV1daOjo5CQkJubm46OjsPDw8bGxk5OTqioqJeXl3x8fFJSUlBQUMzMzKqqql5eXlhYWMHBwWpqamBgYMrKyoWFhU1NTbq6utnZ2ampqZqamkxMTFxcXOXl5cvLy3Nzc4qKimVlZVlZWba2toCAgLu7u729vaSkpNLS0qurq5iYmIeHh8fHx1paWmhoaHt7e5ycnMTExLGtrfayso9ubvze3ptUVGhnZ/vc3MllZXFvb/3y8vivr/739//+/vvX17VXV3Vqav3r69pdXWtMTP/8/NiAgJhcXOfk5P79/fi6uvixse3q6v78/LN3d6g+PvGSkoBTU8u+vp5AQOy3t/rIyPWYmOLU1JKRkYBXV/WGhui0tJ6dncXExHRjY+GEhPWQkMGysgAAAH/C7rcA <p>Where βj sont les effets fixes des variables explicatives <em>x<sub>ii</sub></em>. Avec les effets aléatoires spatiaux décrits par </p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAJsAAAAuCAMAAAAIuJt4AAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAIfUExURf////r6+vLy8vHx8e/v7/X19f7+/r+/v319faenp7CwsIiIiIaGhuXl5fz8/ODg4KSkpMDAwLu7u/39/crKylhYWLKysp2dndHR0fv7+7y8vF1dXYuLi+np6dTU1FlZWaqqqoCAgPn5+WBgYJGRkcLCwmdnZ0pKSlZWVuvr62xsbExMTI6OjuHh4bW1tc7OztPT0/b29pubm15eXtXV1VtbW8vLy9LS0mpqaoeHh+rq6pKSkk5OTk1NTaysrPf395WVlV9fX1dXV5+fn6urq3p6eomJib29vWhoaLe3t35+fnNzc+7u7tra2mNjY4KCgnBwcPT09IyMjFVVVcjIyFxcXKOjo/j4+Nvb21RUVKKiomFhYePj4+zs7N3d3aCgoHh4eFNTU3t7e6WlpcnJyVpaWtzc3OTk5N/f3+bm5szMzJiYmOjo6PDw8MXFxY2NjWZmZuLi4tDQ0JeXl2VlZVFRUdfX166uroODg2JiYo+Pj3l5eXFxcWRkZJSUlN7e3r6+vufn57i4uIqKipCQkIWFhcbGxm1tbe3t7dnZ2bq6und3d8TExHZ2doGBgVBQUHx8fK+vr5mZmX9/f7a2tqmpqaGhofPz85OTk2lpaYSEhJaWlk9PT6ioqJ6enrOzs29vb8PDw3JyclJSUpycnMfHx7S0tM/Pz2tra9jY2EtLS7GxsZqams3Nza2trcHBwXR0dKamprm5udbW1gAAAPSlTP8AAAC1dFJOU/////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////// <p>où,</p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAPQAAABNCAMAAACmNLlxAAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAIlUExURf////7+/v39/bW1tZ6enujo6I+Pj0pKSktLS01NTdXV1e/v72xsbE5OTqWlpfT09Pf39/X19dHR0WBgYL+/v1paWl9fX6Ojo3Nzc+Hh4fHx8VxcXIqKin9/f+zs7IuLi+fn52tra1FRUaurq/n5+cDAwFdXV9fX18PDw2JiYmVlZc3Nzevr68XFxfj4+KqqqmZmZubm5oCAgIiIiPDw8HR0dFRUVK6urtPT08nJyVBQUOnp6e3t7UxMTJCQkO7u7sfHx7q6unp6eqKiol5eXuXl5ampqVJSUpeXl/r6+l1dXc/Pz6+vr9nZ2bS0tNLS0vz8/LGxsVZWVn5+foKCgtbW1ry8vPb29uPj43FxcaioqLm5ucrKyvv7+8bGxq2trbCwsLu7u8zMzM7OzuLi4o2NjU9PT2dnZ8jIyGNjY2RkZFlZWdTU1MTExPLy8m1tbZSUlODg4IWFhXV1dWhoaJWVlVhYWFVVVcHBwaGhoVtbW2FhYXd3d8LCwri4uIyMjKysrJGRkYSEhHx8fJaWloODg/Pz825ubnBwcIeHh6SkpH19fXZ2dp2dnXl5eVNTU5ycnN3d3W9vb4aGhtvb23h4eOrq6rOzs5mZmaamptDQ0Gpqat7e3t/f35iYmI6OjomJidjY2Kenp76+vre3t2lpaXt7e3JycuTk5JOTk7Kyspqampubm7a2tpKSktra2svLy6CgoIGBgb29vZ+fn9zc3AAAAEw+Zl4AAAC3dFJOU/////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////// <p>où <em>n<sub>i</sub></em> est le nombre de voisins pour le pays <em>i</em> et les poids <em>w<sub>i</sub></em>, sont 1. </p> <p>Le modèle a été simulé dans le progiciel statistique bayésien WinBUGS, et la manipulation des données et l'initialisation du modèle ont été effectuées à partir de R (3.3.1) en utilisant R2WinBUGS. Le modèle prend en compte les paramètres de l'âge, du sexe, du biais de l'étude (par exemple, une forte proportion de participants à l'étude issus de populations indigènes), de la couverture vaccinale, de la dose de naissance du vaccin et du pays d'étude. </p> <p>Le modèle utilise la fonction CAR-normale, dans WinBUGS, pour modéliser l'autocorrélation spatiale et économique liée aux pays voisins. Pour chaque pays disposant de données de prévalence, une position centrale pondérée a été calculée en utilisant la taille et la localisation de chaque étude. Pour les pays ne disposant pas de données, nous avons utilisé le centroïde de la population. Dans une nouvelle approche, nous avons pris en compte trois dimensions dans la matrice de contiguïté des pays ; nous avons utilisé les dimensions géographiques habituelles, la latitude et la longitude, et les avons également combinées avec le logarithme naturel du PIB par habitant du pays. Il s'agissait de mesurer non seulement la proximité géographique, mais aussi la proximité de développement des pays. La matrice de proximité pour la distance géo-économique donne un score entre chaque pays et chaque autre pays. Les pays qui sont proches géographiquement et économiquement ont un score faible et ceux qui sont plus éloignés géographiquement ou économiquement ont un score/distance élevé. Par conséquent, les pays qui se ressemblent le plus auront un score faible et les pays qui se ressemblent un score élevé. </p> <p>La façon dont nous avons proportionné la distance géographique et économique pour produire la matrice de contiguïté a ensuite été explorée, car la distance géographique peut être plus ou moins importante que les similitudes économiques. Ainsi, en créant un certain nombre de matrices de contiguïté différentes (non définitives), nous avons pu sélectionner la matrice la plus appropriée qui explique le mieux la réalité. Nous avons normalisé la distance géographique et la distance du PIB, puis nous avons calculé la distance entre ces deux chiffres normalisés. Cela crée une surface gaussienne lissée qui dépend à la fois de la proximité spatiale et de la proximité du PIB par habitant. Nous avons comparé les ratios de, 1:0, 1:1, 2:1, 1:2 (Géographique:PIB). </p> <p>Pour chaque matrice de proximité différente, nous avons également dû sélectionner une distance de voisinage, c'est-à-dire sur quelle distance un pays peut être affecté par un autre. Ainsi, nous avons également fait varier le rayon de la distance à partir de laquelle sélectionner les voisins pour le réseau de voisinage, nous avons utilisé la distance minimale maximale, deux fois la distance minimale maximale et trois fois la distance minimale maximale, faisant ainsi varier le nombre de voisins que chaque pays aurait. </p> <p>Enfin, pour décider de l'ampleur de l'effet d'un pays sur un autre dans le réseau de voisinage, nous avons fait varier les poids des paires de pays dans la matrice de contiguïté, en utilisant soit un poids neutre de 1, de sorte que chaque voisin a un effet égal sur l'autre (ne dépendant pas de la distance dans le réseau), soit des poids décroissants sur la distance avec 1/distance, et 1/distance2, où plus le pays est proche, plus l'effet qu'il a sur un autre pays est important. Le résultat de ces 36 combinaisons différentes a permis de trouver un DIC (Deviance Information Criterion) minimum pour un rapport de 1:2 (Géographie:PIB), la distance minimum des réseaux de voisinage étant le double de la distance minimum maximum et une pondération égale de 1/distance pour chaque pays adjacent. </p> <p>Cette structure de modèle produit des estimations pour tous les effets fixes et aussi pour le risque au niveau de chaque pays, ce qui fournit des informations sur ceux qui sont significativement plus ou moins exposés au risque moyen. </p> <p>Tous les paramètres ont été donnés des antécédents non informatifs. Des simulations ont été effectuées avec 3 chaînes MCMC avec 50 000 brûlures en itérations et chaque paramètre a été estimé à partir de 1000 échantillons prélevés sur 250 000 itérations diluées pour produire la distribution postérieure. La convergence a été atteinte, avec r&#x302 ; des valeurs toutes très proches de 1.000. Grâce au cadre bayésien et au logiciel WinBUGS, il a été possible d'obtenir des estimations pour les pays où nous ne disposions pas de données sur la prévalence, en utilisant leur PIB et leur proximité géographique pour étayer cette estimation. Les pays ayant réalisé le plus grand nombre d'études ont fourni les estimations avec les intervalles de confiance les plus étroits et ceux qui n'avaient que peu ou pas de données étaient moins bien définis, produisant souvent une distribution postérieure log-normale, donnant des estimations avec de longues queues. </p> <p>Les distributions postérieures des paramètres ont été inspectées pour vérifier la convergence et la covariance entre les paramètres. Le cas échéant, les paramètres ont été centrés et mis à l'échelle N (0, 1) pour faciliter la convergence des paramètres et la covariance de la suppression. Cela a été fait pour le paramètre du sexe, qui a été saisi comme la proportion de l'échantillon qui était féminine ; on a constaté qu'il variait avec les paramètres d'interception et de biais avant de recentrer et de mettre à l'échelle. Cependant, la covariance de la vaccination de routine et de la dose à la naissance a persisté même après le recadrage. Cela n'est pas surprenant car il y a eu quelques cas où la dose à la naissance a été administrée sans la vaccination de routine. Nous avons essayé ici de réduire cette interaction des termes en transformant les données relatives à la dose de naissance. Nous avons modélisé la dose de naissance en utilisant uniquement les données où la dose de naissance était supérieure à 60, 70, 80 &amp ; 90% respectivement, nous avons également modélisé la dose de naissance au carré, augmentant ainsi l'effet des doses de naissance élevées par rapport aux doses plus faibles. Le choix du modèle dépendait de celui qui réduisait la covariance entre les paramètres et donnait le score CIVD le plus bas. </p> <p>La validation du modèle a été réalisée en utilisant 90 % des données sélectionnées au hasard par rapport aux 10 % restants, et en comparant les estimations de la prévalence du modèle aux données observées (figure 3). La figure 4 montre la prévalence moyenne dans chaque pays à partir de toutes les études tracées par rapport à l'estimation du modèle. La figure 5 montre les distributions marginales et articulaires postérieures pour les paramètres ajustés. Le tableau 1 donne les valeurs estimées des paramètres avec les intervalles crédibles associés. <p>Au cours de l'exercice de validation (dans lequel les pays ont été consultés sur leurs estimations), il a été souligné que la Chine avait entrepris trois enquêtes sérologiques à très grande échelle dans la population afin d'établir la prévalence de base et les progrès vers l'élimination du VHB. Il y avait un grand nombre d'autres enquêtes en Chine, qui sont moins représentatives que ces trois enquêtes nationales. Nous avons effectué une analyse de sensibilité en limitant les données de la Chine aux trois enquêtes représentatives au niveau national. Cette modification des données d'entrée a eu pour effet de rendre l'effet de la vaccination plus distinct, mais les effets estimés sur l'âge (changement de la prévalence chez les enfants de moins de 5 ans, ou les jeunes (enfants de 5 à 15 ans)) n'étaient plus significativement différents de zéro (voir tableau 2 et figure 6). L'écart a été réduit de manière significative, ce qui suggère un modèle beaucoup plus adapté (tableau 2), bien que sur un ensemble de données quelque peu réduit.</p> 3 years ago
NelMed Translation changed SDG Metadata 3-3-4 French	English <p>The data was modelled using a Bayesian logistic regression looking at the proportion of individuals that tested positive for HBsAg in each study, weighting each study by its size and using a conditional autoregressive (CAR) model accounting for spatial and economic correlations between similar countries. This model uses data from well sampled countries to estimate prevalence in more data poor countries with effects such as sex, age and vaccination status, these are also informed by the geographic and countries GDP proximity to other countries (CAR model). Under the assumption that countries that are close together economically and/or geographically will have more similar prevalence due to similar social structure and health care capabilities. </p> <p>The response variable in the model was the prevalence of Hepatitis surface antigen (HBsAg) with the explanatory variables being age (three categories, under 5, juvenile (5-15) and adult (16+), split using the average age of participants in the study), sex (proportion female in the study), study bias (e.g. a high fraction of study participants from indigenous populations), 3 dose vaccine coverage, birth dose of the vaccine and country of study. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The WHO-UNICEF estimates are annual data for the country as a whole, and did not contain information on vaccine efficacy which was not used in the analysis as no data on this was obtained. The vaccine efficacy would be implicitly estimated in the analysis as we see vaccination having a variable effect across time and space across the studies. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. More explicitly, the model uses the ages and timing of the study to calculate the years across which the participants are born, so if the if there was an age group range of 10-15 in a study that was undertaken in 2015, the birth years would be from 2000-2005, we then average the vaccination coverage from the WHO-UNICEF estimates across those 5 years assuming that each age was evenly represented in that age group in the study. The same process was used for the 3 dose and birth dose vaccination. </p> <p> </p> <p>The general logistic model equation is described below, </p> <p>Yi ~Binomial (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p> <p> </p> <p>Where βj are the fixed effects of the explanatory variables xii. With the spatial random effects described by </p> <p>ui~ N(u−i,σ2u/ni)</p> <p> , </p> <p>where, </p> <p>u−i= ∑j ∈ neigh(i)wiuj/ni</p> <p>Where ni is the number of neighbours for country i and weights wi, are 1. </p> <p> </p> <p>The model was simulated in the Bayesian statistical package WinBUGS, and data manipulation and model initialisation run from R (3.3.1) using R2WinBUGS. The model considers the parameters of age, sex, study bias (e.g. a high fraction of study participants from indigenous populations), vaccine coverage, birth dose of the vaccine and country of study. </p> <p>The model uses the CAR-normal function, in WinBUGS, to model the spatial and economic autocorrelation related to neighbouring countries. For each country that had prevalence data, a weighted central position was calculated using the size and location of each study. For those countries with no data, we used the population centroid. In a novel approach, we considered 3 dimensions in the country adjacency matrix; we used the usual geographic dimensions, latitude and longitude and also combined these with the natural log of the country’s GDP per capita. This was to measure not only geographic but also the developmental proximity of countries. The adjacency matrix for the geo-economic distance gives a score between each country to every other country. Those countries which are close geographically and economically would have a low score and those further apart either geographically or economically would have a high score/distance. Therefore, those countries that are more alike will have a low score and those countries which are alike would have a high score. </p> <p>The way we proportioned the geographic and economic distance to produce the adjacency matrix was then explored, this is because geographic distance may be more or less important than economic similarities. Thus, by creating a number of different adjacency matrices (not definitive) we could select the most suitable matrix that explains reality best. We normalised the geographic and GDP distance and then calculated the distance between these two normalised figures. This creates a smoothed Gaussian surface that is dependent on both spatial proximity and GDP per-capita proximity. We compared ratios of, 1:0, 1:1, 2:1, 1:2 (Geographic:GDP). </p> <p>For each different adjacency matrix, we also had to select a neighbourhood distance, i.e. over what distance can a country be effected by another. Thus, we also varied the radius of distance from which to select neighbours for the neighbourhood network, we used the maximum minimum distance, twice the maximum minimum and three times the maximum minimum, thus varying the number of neighbours each country would have. </p> <p> </p> <p>Finally, to decide the magnitude of the effect one country has on another in the neighbourhood network we varied the weights of pairs of countries in the adjacency matrix, using either a neutral weighting of 1, so that each neighbour has an equal effect on each other (not dependent on the distance in the network), or decaying weights over distance with 1/distance, and 1/distance2, where the closer the country is the greater the effect it has on another country. The outcome of these 36 different combinations led to minimum DIC (Deviance Information Criterion) being found for a ratio of 1:2 (Geographic:GDP), the neighbourhood networks minimum distance being twice the maximum minimum distance and an even weighting of 1/distance for each adjacent country. </p> <p>This model structure produces estimates for all fixed effects and also individual country level risk, this provides information on which are significantly at greater or lower risk to the average risk. </p> <p>All parameters were given un-informative priors. Simulations were run with 3 MCMC chains with 50,000 burn in iterations and each parameter estimated from 1000 samples taken from a thinned 250,000 iterations to produce the posterior distribution. Convergence was attained, with r̂ values all very close to 1.000. Due to the Bayesian framework and WinBUGS software it was possible to gain estimates for countries where we had no data on prevalence, using their GDP and geographic proximity to inform this estimate. Those countries with the largest number of studies provided the estimates with the tightest confidence intervals and those with few or no data were less well defined, often producing a log normal distributed posterior distribution, giving estimates with long tails. </p> <p>Posterior distributions of parameters were inspected for convergence and to check for covariance between parameters. Where necessary parameters were centred and scaled to N (0, 1) to aid parameter convergence and remover covariance. This was done for the sex parameter, which was entered as the proportion of the sample that was female; this was seen to co-vary with the intercept and bias parameters before re-centring and scaling. However, the covariance of routine vaccination and birth dose persisted even after re-centring. This is in part unsurprising as there a few instances where birth dose is administered without the routine vaccination. Here we tried to reduce this interaction of the terms by transforming the birth dose data. We modelled birth dose using only data where the birth dose was greater than 60, 70, 80 & 90% respectively, we also modelled birth dose to the square, thus increasing the effect of high birth doses over smaller doses. Model selection dependent on which one both reduced the covariance between the parameters and returned the lowest DIC score. </p> <p>Model validation was conducted using 90% of randomly selected data against the remaining 10%, and by comparing model estimates of prevalence against observed data (Figure 3). Figure 4 shows the average prevalence in each country from all the studies plotted against the models estimate. Figure 5 shows the marginal and joint posterior distributions for the fitted parameters. Table 1 gives the estimated parameter values with associated credible intervals. </p> <p>During the validation exercise (in which countries were consulted over their estimates) it was pointed out that China had undertaken three very large-scale population-based serological surveys in order to establish baseline prevalence and progress towards HBV elimination. There were a large number of other surveys from China, that are less representative than these three nationwide surveys. We conducted a sensitivity analysis by restricting the data from China to the three nationally representative surveys. The effect of this change in input data was that the effect of vaccination was more distinct, but the estimated age effects (change in prevalence in children under 5, or juveniles (children 5-15 years)) were no longer significantly different from zero (see Table 2 and Figure 6). The deviance was significantly reduced, suggesting a much better fitting model (Table 2), albeit on a somewhat reduced dataset. </p> French 44 characters edited <h1>Méthodologie</h1> <h2>Méthode de calcul :</h2> <p>Les données ont été modélisées à l'aide d'une régression logistique bayésienne examinant la proportion d'individus testés positifs pour l'HBsAg dans chaque étude, en pondérant chaque étude par sa taille et en utilisant un modèle autorégressif conditionnel (CAR) tenant compte des corrélations spatiales et économiques entre des pays similaires. Ce modèle utilise des données provenant de pays bien échantillonnés pour estimer la prévalence dans des pays pauvres en données, avec des effets tels que le sexe, l'âge et le statut vaccinal, qui sont également informés par la proximité géographique et le PIB des pays par rapport aux autres pays (modèle CAR). En partant de l'hypothèse que les pays qui sont proches économiquement et/ou géographiquement, auront une prévalence plus similaire en raison de leur structure sociale et de leurs capacités en matière de soins de santé. </p> <p>La variable de réponse dans le modèle était la prévalence de l'antigène de surface de l'hépatite (HBsAg), les variables explicatives étant l'âge (trois catégories, moins de 5 ans, jeunes (5- à 15 ans) et adultes (16 et +), réparties en fonction de l'âge moyen des participants à l'étude), le sexe (proportion de femmes dans l'étude), le biais de l'étude (par exemple, une forte proportion de participants à l'étude issus de populations indigènes), la couverture vaccinale de 3 doses, la dose de naissance du vaccin et le pays de l'étude. La couverture de la vaccination de routine en 3 doses et de la vaccination à la naissance dans chaque étude, a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale de l'Organisation mondiale de la Santé (OMS) et de l'UNICEF pour ce pays. Les estimations OMS-UNICEF sont des données annuelles pour l'ensemble du pays et ne contiennent pas d'informations sur l'efficacité du vaccin qui n'ont pas été utilisées dans l'analyse car aucune donnée n'a été obtenue à ce sujet. L'efficacité du vaccin serait implicitement estimée dans l'analyse car nous constatons que la vaccination a un effet variable dans le temps et dans l'espace selon les études. La couverture de la vaccination de routine à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale de l'OMS et de l'UNICEF pour ce pays. La couverture de la vaccination systématique par trois doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale OMS-UNICEF pour ce pays. Plus explicitement, le modèle utilise l'âge et le moment de l'étude pour calculer les années de naissance des participants. Ainsi, s'il y avait une tranche d'âge de 10-15 ans dans une étude entreprise en 2015, les années de naissance seraient de 2000-2005, nous faisons alors la moyenne de la couverture vaccinale des estimations OMS-UNICEF sur ces 5 années en supposant que chaque âge est représenté de manière égale dans cette tranche d'âge dans l'étude. Le même processus a été utilisé pour la vaccination à 3 doses et la vaccination à la naissance. </p> <p>L'équation générale du modèle logistique est décrite ci-dessous, </p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAeEAAABRCAMAAADSKe79AAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAK1UExURf////T09NTU1Nzc3Pz8/O/v79DQ0Pr6+qampnh4eHR0dMLCwpGRkXp6em1tbc/Pz+Li4snJydfX11NTU4KCgt3d3erq6m9vb6Wlpby8vFZWVr6+vvHx8X19fZ+fn3Fxcf7+/uzs7K+vr+7u7l1dXZSUlP39/WdnZ9PT01VVVaenp4yMjJaWlre3t1RUVIiIiLCwsKKiouTk5J2dnWNjY+Pj4+vr6/j4+PX19YaGhoSEhPf399/f3/Dw8Pv7+4uLi2JiYl9fX6CgoNbW1pKSkpWVla2traysrHd3d66urvb29o+Pj0pKSktLS+jo6NXV1fn5+bGxsYODg2xsbGRkZOfn59jY2GlpaYmJicjIyGZmZmFhYY2NjZmZmXZ2duDg4Lm5uc3NzbKysk9PT25ubp6entHR0cDAwPPz81tbW1dXV6GhoWtra3BwcO3t7enp6YGBgbi4uJOTk7W1tVFRUXl5eX9/f+bm5tvb27+/v7Ozs7S0tM7Ozn5+ft7e3tra2uHh4cXFxfLy8nJycnV1daOjo5CQkJubm46OjsPDw8bGxk5OTqioqJeXl3x8fFJSUlBQUMzMzKqqql5eXlhYWMHBwWpqamBgYMrKyoWFhU1NTbq6utnZ2ampqZqamkxMTFxcXOXl5cvLy3Nzc4qKimVlZVlZWba2toCAgLu7u729vaSkpNLS0qurq5iYmIeHh8fHx1paWmhoaHt7e5ycnMTExLGtrfayso9ubvze3ptUVGhnZ/vc3MllZXFvb/3y8vivr/739//+/vvX17VXV3Vqav3r69pdXWtMTP/8/NiAgJhcXOfk5P79/fi6uvixse3q6v78/LN3d6g+PvGSkoBTU8u+vp5AQOy3t/rIyPWYmOLU1JKRkYBXV/WGhui0tJ6dncXExHRjY+GEhPWQkMGysgAAAH/C7rcA <p>Where βj sont les effets fixes des variables explicatives <em>x<sub>ii</sub></em>. Avec les effets aléatoires spatiaux décrits par </p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAJsAAAAuCAMAAAAIuJt4AAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAIfUExURf////r6+vLy8vHx8e/v7/X19f7+/r+/v319faenp7CwsIiIiIaGhuXl5fz8/ODg4KSkpMDAwLu7u/39/crKylhYWLKysp2dndHR0fv7+7y8vF1dXYuLi+np6dTU1FlZWaqqqoCAgPn5+WBgYJGRkcLCwmdnZ0pKSlZWVuvr62xsbExMTI6OjuHh4bW1tc7OztPT0/b29pubm15eXtXV1VtbW8vLy9LS0mpqaoeHh+rq6pKSkk5OTk1NTaysrPf395WVlV9fX1dXV5+fn6urq3p6eomJib29vWhoaLe3t35+fnNzc+7u7tra2mNjY4KCgnBwcPT09IyMjFVVVcjIyFxcXKOjo/j4+Nvb21RUVKKiomFhYePj4+zs7N3d3aCgoHh4eFNTU3t7e6WlpcnJyVpaWtzc3OTk5N/f3+bm5szMzJiYmOjo6PDw8MXFxY2NjWZmZuLi4tDQ0JeXl2VlZVFRUdfX166uroODg2JiYo+Pj3l5eXFxcWRkZJSUlN7e3r6+vufn57i4uIqKipCQkIWFhcbGxm1tbe3t7dnZ2bq6und3d8TExHZ2doGBgVBQUHx8fK+vr5mZmX9/f7a2tqmpqaGhofPz85OTk2lpaYSEhJaWlk9PT6ioqJ6enrOzs29vb8PDw3JyclJSUpycnMfHx7S0tM/Pz2tra9jY2EtLS7GxsZqams3Nza2trcHBwXR0dKamprm5udbW1gAAAPSlTP8AAAC1dFJOU/////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////// <p>où,</p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAPQAAABNCAMAAACmNLlxAAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAIlUExURf////7+/v39/bW1tZ6enujo6I+Pj0pKSktLS01NTdXV1e/v72xsbE5OTqWlpfT09Pf39/X19dHR0WBgYL+/v1paWl9fX6Ojo3Nzc+Hh4fHx8VxcXIqKin9/f+zs7IuLi+fn52tra1FRUaurq/n5+cDAwFdXV9fX18PDw2JiYmVlZc3Nzevr68XFxfj4+KqqqmZmZubm5oCAgIiIiPDw8HR0dFRUVK6urtPT08nJyVBQUOnp6e3t7UxMTJCQkO7u7sfHx7q6unp6eqKiol5eXuXl5ampqVJSUpeXl/r6+l1dXc/Pz6+vr9nZ2bS0tNLS0vz8/LGxsVZWVn5+foKCgtbW1ry8vPb29uPj43FxcaioqLm5ucrKyvv7+8bGxq2trbCwsLu7u8zMzM7OzuLi4o2NjU9PT2dnZ8jIyGNjY2RkZFlZWdTU1MTExPLy8m1tbZSUlODg4IWFhXV1dWhoaJWVlVhYWFVVVcHBwaGhoVtbW2FhYXd3d8LCwri4uIyMjKysrJGRkYSEhHx8fJaWloODg/Pz825ubnBwcIeHh6SkpH19fXZ2dp2dnXl5eVNTU5ycnN3d3W9vb4aGhtvb23h4eOrq6rOzs5mZmaamptDQ0Gpqat7e3t/f35iYmI6OjomJidjY2Kenp76+vre3t2lpaXt7e3JycuTk5JOTk7Kyspqampubm7a2tpKSktra2svLy6CgoIGBgb29vZ+fn9zc3AAAAEw+Zl4AAAC3dFJOU/////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////// <p>où <em>n<sub>i</sub></em> est le nombre de voisins pour le pays <em>i</em> et les poids <em>w<sub>i</sub></em>, sont 1. </p> <p>Le modèle a été simulé dans le progiciel statistique bayésien WinBUGS, et la manipulation des données et l'initialisation du modèle ont été effectuées à partir de R (3.3.1) en utilisant R2WinBUGS. Le modèle prend en compte les paramètres de l'âge, du sexe, du biais de l'étude (par exemple, une forte proportion de participants à l'étude issus de populations indigènes), de la couverture vaccinale, de la dose de naissance du vaccin et du pays d'étude. </p> <p>Le modèle utilise la fonction CAR-normale, dans WinBUGS, pour modéliser l'autocorrélation spatiale et économique liée aux pays voisins. Pour chaque pays disposant de données de prévalence, une position centrale pondérée a été calculée en utilisant la taille et la localisation de chaque étude. Pour les pays ne disposant pas de données, nous avons utilisé le centroïde de la population. Dans une nouvelle approche, nous avons pris en compte trois dimensions dans la matrice de contiguïté des pays ; nous avons utilisé les dimensions géographiques habituelles, la latitude et la longitude, et les avons également combinées avec le logarithme naturel du PIB par habitant du pays. Il s'agissait de mesurer non seulement la proximité géographique, mais aussi la proximité de développement des pays. La matrice de proximité pour la distance géo-économique donne un score entre chaque pays et chaque autre pays. Les pays qui sont proches géographiquement et économiquement ont un score faible et ceux qui sont plus éloignés géographiquement ou économiquement ont un score/distance élevé. Par conséquent, les pays qui se ressemblent le plus auront un score faible et les pays qui se ressemblent un score élevé. </p> <p>La façon dont nous avons proportionné la distance géographique et économique pour produire la matrice de contiguïté a ensuite été explorée, car la distance géographique peut être plus ou moins importante que les similitudes économiques. Ainsi, en créant un certain nombre de matrices de contiguïté différentes (non définitives), nous avons pu sélectionner la matrice la plus appropriée qui explique le mieux la réalité. Nous avons normalisé la distance géographique et la distance du PIB, puis nous avons calculé la distance entre ces deux chiffres normalisés. Cela crée une surface gaussienne lissée qui dépend à la fois de la proximité spatiale et de la proximité du PIB par habitant. Nous avons comparé les ratios de, 1:0, 1:1, 2:1, 1:2 (Géographique:PIB). </p> <p>Pour chaque matrice de proximité différente, nous avons également dû sélectionner une distance de voisinage, c'est-à-dire sur quelle distance un pays peut être affecté par un autre. Ainsi, nous avons également fait varier le rayon de la distance à partir de laquelle sélectionner les voisins pour le réseau de voisinage, nous avons utilisé la distance minimale maximale, deux fois la distance minimale maximale et trois fois la distance minimale maximale, faisant ainsi varier le nombre de voisins que chaque pays aurait. </p> <p>Enfin, pour décider de l'ampleur de l'effet d'un pays sur un autre dans le réseau de voisinage, nous avons fait varier les poids des paires de pays dans la matrice de contiguïté, en utilisant soit un poids neutre de 1, de sorte que chaque voisin a un effet égal sur l'autre (ne dépendant pas de la distance dans le réseau), soit des poids décroissants sur la distance avec 1/distance, et 1/distance2, où plus le pays est proche, plus l'effet qu'il a sur un autre pays est important. Le résultat de ces 36 combinaisons différentes a permis de trouver un DIC (Deviance Information Criterion) minimum pour un rapport de 1:2 (Géographie:PIB), la distance minimum des réseaux de voisinage étant le double de la distance minimum maximum et une pondération égale de 1/distance pour chaque pays adjacent. </p> <p>Cette structure de modèle produit des estimations pour tous les effets fixes et aussi pour le risque au niveau de chaque pays, ce qui fournit des informations sur ceux qui sont significativement plus ou moins exposés au risque moyen. </p> <p>Tous les paramètres ont été donnés des antécédents non informatifs. Des simulations ont été effectuées avec 3 chaînes MCMC avec 50 000 brûlures en itérations et chaque paramètre a été estimé à partir de 1000 échantillons prélevés sur 250 000 itérations diluées pour produire la distribution postérieure. La convergence a été atteinte, avec r&#x302 ; des valeurs toutes très proches de 1.000. Grâce au cadre bayésien et au logiciel WinBUGS, il a été possible d'obtenir des estimations pour les pays où nous ne disposions pas de données sur la prévalence, en utilisant leur PIB et leur proximité géographique pour étayer cette estimation. Les pays ayant réalisé le plus grand nombre d'études ont fourni les estimations avec les intervalles de confiance les plus étroits et ceux qui n'avaient que peu ou pas de données étaient moins bien définis, produisant souvent une distribution postérieure log-normale, donnant des estimations avec de longues queues. </p> <p>Les distributions postérieures des paramètres ont été inspectées pour vérifier la convergence et la covariance entre les paramètres. Le cas échéant, les paramètres ont été centrés et mis à l'échelle N (0, 1) pour faciliter la convergence des paramètres et la covariance de la suppression. Cela a été fait pour le paramètre du sexe, qui a été saisi comme la proportion de l'échantillon qui était féminine ; on a constaté qu'il variait avec les paramètres d'interception et de biais avant de recentrer et de mettre à l'échelle. Cependant, la covariance de la vaccination de routine et de la dose à la naissance a persisté même après le recadrage. Cela n'est pas surprenant car il y a eu quelques cas où la dose à la naissance a été administrée sans la vaccination de routine. Nous avons essayé ici de réduire cette interaction des termes en transformant les données relatives à la dose de naissance. Nous avons modélisé la dose de naissance en utilisant uniquement les données où la dose de naissance était supérieure à 60, 70, 80 &amp ; 90% respectivement, nous avons également modélisé la dose de naissance au carré, augmentant ainsi l'effet des doses de naissance élevées par rapport aux doses plus faibles. Le choix du modèle dépendait de celui qui réduisait la covariance entre les paramètres et donnait le score CIVD le plus bas. </p> <p>La validation du modèle a été réalisée en utilisant 90 % des données sélectionnées au hasard par rapport aux 10 % restants, et en comparant les estimations de la prévalence du modèle aux données observées (figure 3). La figure 4 montre la prévalence moyenne dans chaque pays à partir de toutes les études tracées par rapport à l'estimation du modèle. La figure 5 montre les distributions marginales et articulaires postérieures pour les paramètres ajustés. Le tableau 1 donne les valeurs estimées des paramètres avec les intervalles crédibles associés. <p>Au cours de l'exercice de validation (dans lequel les pays ont été consultés sur leurs estimations), il a été souligné que la Chine avait entrepris trois enquêtes sérologiques à très grande échelle dans la population afin d'établir la prévalence de base et les progrès vers l'élimination du VHB. Il y avait un grand nombre d'autres enquêtes en Chine, qui sont moins représentatives que ces trois enquêtes nationales. Nous avons effectué une analyse de sensibilité en limitant les données de la Chine aux trois enquêtes représentatives au niveau national. Cette modification des données d'entrée a eu pour effet de rendre l'effet de la vaccination plus distinct, mais les effets estimés sur l'âge (changement de la prévalence chez les enfants de moins de 5 ans, ou les jeunes (enfants de 5 à 15 ans)) n'étaient plus significativement différents de zéro (voir tableau 2 et figure 6). L'écart a été réduit de manière significative, ce qui suggère un modèle beaucoup plus adapté (tableau 2), bien que sur un ensemble de données quelque peu réduit.</p> 3 years ago