Loading…
deblsyl
Translation changed |
|
None
String updated in the repository |
<p>The data was modelled using a Bayesian logistic regression looking at the proportion of individuals that tested positive for HBsAg in each study, weighting each study by its size and using a conditional autoregressive (CAR) model accounting for spatial and economic correlations between similar countries. This model uses data from well sampled countries to estimate prevalence in more data poor countries with effects such as sex, age and vaccination status, these are also informed by the geographic and countries GDP proximity to other countries (CAR model). Under the assumption that countries that are close together economically and/or geographically will have more similar prevalence due to similar social structure and health care capabilities. </p>
<p>The response variable in the model was the prevalence of Hepatitis surface antigen (HBsAg) with the explanatory variables being age (three categories, under 5, juvenile (5-15) and adult (16+), split using the average age of participants in the study), sex (proportion female in the study), study bias (e.g. a high fraction of study participants from indigenous populations), 3 dose vaccine coverage, birth dose of the vaccine and country of study. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The WHO-UNICEF estimates are annual data for the country as a whole, and did not contain information on vaccine efficacy which was not used in the analysis as no data on this was obtained. The vaccine efficacy would be implicitly estimated in the analysis as we see vaccination having a variable effect across time and space across the studies. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. More explicitly, the model uses the ages and timing of the study to calculate the years across which the participants are born, so if the if there was an age group range of 10-15 in a study that was undertaken in 2015, the birth years would be from 2000-2005, we then average the vaccination coverage from the WHO-UNICEF estimates across those 5 years assuming that each age was evenly represented in that age group in the study. The same process was used for the 3 dose and birth dose vaccination. </p> <p> </p> <p>The general logistic model equation is described below, </p> <p>Yi ~Binomial (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p> <p> </p> <p>Where βj are the fixed effects of the explanatory variables xii. With the spatial random effects described by </p> <p>ui~ N(u−i,σ2u/ni)</p> <p> , </p> <p>where, </p> <p>u−i= ∑j ∈ neigh(i)wiuj/ni</p> <p>Where ni is the number of neighbours for country i and weights wi, are 1. </p> <p> </p> <p>The model was simulated in the Bayesian statistical package WinBUGS, and data manipulation and model initialisation run from R (3.3.1) using R2WinBUGS. The model considers the parameters of age, sex, study bias (e.g. a high fraction of study participants from indigenous populations), vaccine coverage, birth dose of the vaccine and country of study. </p> <p>The model uses the CAR-normal function, in WinBUGS, to model the spatial and economic autocorrelation related to neighbouring countries. For each country that had prevalence data, a weighted central position was calculated using the size and location of each study. For those countries with no data, we used the population centroid. In a novel approach, we considered 3 dimensions in the country adjacency matrix; we used the usual geographic dimensions, latitude and longitude and also combined these with the natural log of the country’s GDP per capita. This was to measure not only geographic but also the developmental proximity of countries. The adjacency matrix for the geo-economic distance gives a score between each country to every other country. Those countries which are close geographically and economically would have a low score and those further apart either geographically or economically would have a high score/distance. Therefore, those countries that are more alike will have a low score and those countries which are alike would have a high score. </p> <p>The way we proportioned the geographic and economic distance to produce the adjacency matrix was then explored, this is because geographic distance may be more or less important than economic similarities. Thus, by creating a number of different adjacency matrices (not definitive) we could select the most suitable matrix that explains reality best. We normalised the geographic and GDP distance and then calculated the distance between these two normalised figures. This creates a smoothed Gaussian surface that is dependent on both spatial proximity and GDP per-capita proximity. We compared ratios of, 1:0, 1:1, 2:1, 1:2 (Geographic:GDP). </p> <p>For each different adjacency matrix, we also had to select a neighbourhood distance, i.e. over what distance can a country be effected by another. Thus, we also varied the radius of distance from which to select neighbours for the neighbourhood network, we used the maximum minimum distance, twice the maximum minimum and three times the maximum minimum, thus varying the number of neighbours each country would have. </p> <p> </p> <p>Finally, to decide the magnitude of the effect one country has on another in the neighbourhood network we varied the weights of pairs of countries in the adjacency matrix, using either a neutral weighting of 1, so that each neighbour has an equal effect on each other (not dependent on the distance in the network), or decaying weights over distance with 1/distance, and 1/distance2, where the closer the country is the greater the effect it has on another country. The outcome of these 36 different combinations led to minimum DIC (Deviance Information Criterion) being found for a ratio of 1:2 (Geographic:GDP), the neighbourhood networks minimum distance being twice the maximum minimum distance and an even weighting of 1/distance for each adjacent country. </p> <p>This model structure produces estimates for all fixed effects and also individual country level risk, this provides information on which are significantly at greater or lower risk to the average risk. </p> <p>All parameters were given un-informative priors. Simulations were run with 3 MCMC chains with 50,000 burn in iterations and each parameter estimated from 1000 samples taken from a thinned 250,000 iterations to produce the posterior distribution. Convergence was attained, with r̂ values all very close to 1.000. Due to the Bayesian framework and WinBUGS software it was possible to gain estimates for countries where we had no data on prevalence, using their GDP and geographic proximity to inform this estimate. Those countries with the largest number of studies provided the estimates with the tightest confidence intervals and those with few or no data were less well defined, often producing a log normal distributed posterior distribution, giving estimates with long tails. </p> <p>Posterior distributions of parameters were inspected for convergence and to check for covariance between parameters. Where necessary parameters were centred and scaled to N (0, 1) to aid parameter convergence and remover covariance. This was done for the sex parameter, which was entered as the proportion of the sample that was female; this was seen to co-vary with the intercept and bias parameters before re-centring and scaling. However, the covariance of routine vaccination and birth dose persisted even after re-centring. This is in part unsurprising as there a few instances where birth dose is administered without the routine vaccination. Here we tried to reduce this interaction of the terms by transforming the birth dose data. We modelled birth dose using only data where the birth dose was greater than 60, 70, 80 & 90% respectively, we also modelled birth dose to the square, thus increasing the effect of high birth doses over smaller doses. Model selection dependent on which one both reduced the covariance between the parameters and returned the lowest DIC score. </p> <p>Model validation was conducted using 90% of randomly selected data against the remaining 10%, and by comparing model estimates of prevalence against observed data (Figure 3). Figure 4 shows the average prevalence in each country from all the studies plotted against the models estimate. Figure 5 shows the marginal and joint posterior distributions for the fitted parameters. Table 1 gives the estimated parameter values with associated credible intervals. </p> <p>During the validation exercise (in which countries were consulted over their estimates) it was pointed out that China had undertaken three very large-scale population-based serological surveys in order to establish baseline prevalence and progress towards HBV elimination. There were a large number of other surveys from China, that are less representative than these three nationwide surveys. We conducted a sensitivity analysis by restricting the data from China to the three nationally representative surveys. The effect of this change in input data was that the effect of vaccination was more distinct, but the estimated age effects (change in prevalence in children under 5, or juveniles (children 5-15 years)) were no longer significantly different from zero (see Table 2 and Figure 6). The deviance was significantly reduced, suggesting a much better fitting model (Table 2), albeit on a somewhat reduced dataset. </p>
<p>Les données ont été modélisées à l'aide d'une régression logistique bayésienne examinant la proportion d'individus testés positifs pour l'AgHBs dans chaque étude, en pondérant chaque étude par sa taille et en utilisant un modèle autorégressif conditionnel (CAR) tenant compte des corrélations spatiales et économiques entre pays similaires. Ce modèle utilise les données des pays bien échantillonnés pour estimer la prévalence dans les pays plus pauvres en données avec des effets tels que le sexe, l'âge et le statut vaccinal, ceux-ci sont également informés par la proximité géographique et le PIB des pays avec d'autres pays (modèle CAR). Selon l'hypothèse que les pays proches économiquement et/ou géographiquement auront une prévalence plus similaire en raison d'une structure sociale et de capacités de soins de santé similaires. </p>
<p>La variable réponse du modèle était la prévalence de l'antigène de surface de l'hépatite (AgHBs), les variables explicatives étant l'âge (trois catégories, moins de 5 ans, mineur (5-15 ans) et adulte (16 ans ou plus), réparties en utilisant l'âge moyen des participants à l'étude), le sexe (proportion de femmes dans l'étude), le biais de l'étude (par exemple, une fraction élevée de participants à l'étude provenant de populations indigènes), la couverture vaccinale à 3 doses, la dose de vaccin à la naissance et le pays de l'étude. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations de couverture vaccinale correspondantes de l'OMS-UNICEF pour ce pays. Les estimations de l'OMS-UNICEF sont des données annuelles pour l'ensemble du pays et ne contiennent pas d'informations sur l'efficacité du vaccin, celle-ci n'a pas été utilisée dans l'analyse car aucune donnée à ce sujet n'a été obtenue. L'efficacité du vaccin serait implicitement estimée dans l'analyse car nous constatons que la vaccination a un effet variable dans le temps et l'espace dans les études. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations correspondantes de la couverture vaccinale de l'OMS-UNICEF pour ce pays. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations de couverture vaccinale de l'OMS-UNICEF correspondantes pour ce pays. Plus précisément, le modèle utilise les âges et le moment de l'étude pour calculer les années de naissance des participants. Ainsi, si une étude menée en 2015 portait sur une tranche d'âge de 10 à 15 ans, les années de naissance s'étendraient de 2000 à 2005, nous avons ensuite calculé la moyenne de la couverture vaccinale à partir des estimations de l'OMS-UNICEF sur ces 5 années en supposant que chaque âge était représenté de manière égale dans cette tranche d'âge dans l'étude. Le même processus a été utilisé pour la vaccination à 3 doses et la vaccination à la naissance. </p> <p> </p> <p>L'équation du modèle logistique général est décrite ci-dessous, </p> <p>Yi ~Binôme (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p> <p> </p> <p>où βj sont les effets fixes des variables explicatives xii. Avec les effets aléatoires spatiaux décrits par </p> <p>ui~ N(u−i,σ2u/ni)</p> <p>où </p> <p>u−i= ∑j ∈ neigh(i)wiuj/ni</p> <p>où ni est le nombre de voisins pour le pays i et les poids wi, valent 1. </p> <p> </p> <p>Le modèle a été simulé dans le module statistique bayésien WinBUGS, et la manipulation des données et l'initialisation du modèle exécutées à partir de R (3.3.1) en utilisant R2WinBUGS. Le modèle prend en compte les paramètres de l'âge, du sexe, du biais de l'étude (par exemple, une fraction élevée de participants à l'étude provenant de populations indigènes), de la couverture vaccinale, de la dose du vaccin à la naissance et du pays de l'étude. </p> <p>Le modèle utilise la fonction CAR-normale, dans WinBUGS, pour modéliser l'autocorrélation géographique et économique liée aux pays voisins. Pour chaque pays disposant de données de prévalence, une position centrale pondérée a été calculée en utilisant la taille et la localisation de chaque étude. Pour les pays ne disposant pas de données, nous avons utilisé le centroïde de la population. Dans une approche novatrice, nous avons considéré 3 dimensions dans la matrice d'adjacence des pays; nous avons utilisé les dimensions géographiques habituelles, la latitude et la longitude, et nous les avons également combinées avec le log naturel du PIB par habitant du pays, ceci afin de mesurer non seulement la proximité géographique mais aussi la proximité de développement des pays. La matrice d'adjacence pour la distance géo-économique donne un score entre chaque pays et tous les autres pays. Les pays qui sont proches géographiquement et économiquement ont un score faible et ceux qui sont plus éloignés géographiquement ou économiquement ont un score/distance élevé. Par conséquent, les pays qui se ressemblent le plus auront un score faible et les pays qui sont moins semblables auront un score élevé. </p> <p>On a ensuite exploré la façon dont nous avons proportionné la distance géographique et économique pour produire la matrice d'adjacence, ceci parce que la distance géographique peut être plus ou moins importante que les similitudes économiques. Ainsi, en créant un certain nombre de matrices d'adjacence différentes (non définitives), nous avons pu sélectionner la matrice la plus adaptée qui explique le mieux la réalité. Nous avons normalisé la distance géographique et la distance du PIB, puis nous avons calculé la distance entre ces deux chiffres normalisés. Cela crée une surface gaussienne lissée qui dépend à la fois de la proximité spatiale et de la proximité du PIB par habitant. Nous avons comparé des ratios de, 1:0, 1:1, 2:1, 1:2 (Géographie:PIB). </p> <p>Pour chaque matrice d'adjacence différente, nous avons également dû choisir une distance de voisinage, c'est-à-dire sur quelle distance un pays peut être affecté par un autre. Ainsi, nous avons également fait varier le rayon de distance à partir duquel sélectionner les voisins pour le réseau de voisinage, nous avons utilisé la distance minimale maximale, deux fois le minimum maximal et trois fois le minimum maximal, faisant ainsi varier le nombre de voisins que chaque pays aurait. </p> <p> </p> <p>Enfin, pour décider de l'ampleur de l'effet d'un pays sur un autre dans le réseau de voisinage, nous avons fait varier les poids des paires de pays dans la matrice d'adjacence, en utilisant soit une pondération neutre de 1, de sorte que chaque voisin a un effet égal sur les autres (ne dépendant pas de la distance dans le réseau), soit des poids décroissants sur la distance avec 1/distance, et 1/distance2, où plus le pays est proche, plus son effet sur un autre pays est important. Le résultat de ces 36 combinaisons différentes a conduit à trouver un DIC (Deviance Information Criterion) minimal pour un rapport de 1:2 (Géographie:PIB), la distance minimale des réseaux de voisinage étant deux fois la distance minimale maximale et une pondération égale de 1/distance pour chaque pays adjacent. </p> <p>Cette structure de modèle produit des estimations pour tous les effets fixes et aussi pour le risque individuel au niveau du pays, cela fournit des informations sur ceux qui sont significativement plus à risque ou moins à risque par rapport au risque moyen. </p> <p>Tous les paramètres étaient a priori non informatifs. Les simulations ont été effectuées avec 3 chaînes MCMC avec 50 000 essais par itération et chaque paramètre estimé à partir de 1 000 échantillons prélevés sur un nombre réduit de 250 000 itérations pour produire la distribution postérieure. La convergence a été atteinte, avec des valeurs r̂ toutes très proches de 1,000. Grâce au cadre bayésien et au logiciel WinBUGS, il a été possible d'obtenir des estimations pour les pays pour lesquels nous n'avions pas de données sur la prévalence, en utilisant leur PIB et leur proximité géographique pour informer cette estimation. Les pays avec le plus grand nombre d'études ont fourni les estimations avec les intervalles de confiance les plus serrés et ceux avec peu ou pas de données étaient moins bien définis, produisant souvent une distribution postérieure log normale, donnant des estimations avec de longues queues. </p> <p>Les distributions postérieures des paramètres ont été inspectées pour vérifier la convergence et pour vérifier la covariance entre les paramètres. Si nécessaire, les paramètres ont été centrés et mis à l'échelle d'une loi N (0, 1) pour faciliter la convergence des paramètres et supprimer la covariance. C'est ce qui a été fait pour le paramètre de sexe, qui a été saisi comme la proportion de l'échantillon qui était féminine; on a constaté qu'il covarie avec les paramètres d'interception et de biais avant le recentrage et la mise à l'échelle. Cependant, la covariance de la vaccination systématique et de la dose à la naissance est restée même après recentrage. Ceci n'est en partie pas surprenant car il existe quelques cas où la dose à la naissance est administrée sans la vaccination systématique. Nous avons essayé de réduire cette interaction des termes en transformant les données sur la dose à la naissance. Nous avons modélisé celle-ci en utilisant uniquement les données où la dose à la naissance était supérieure à 60, 70, 80 et 90% respectivement, nous avons également modélisé la dose à la naissance au carré, augmentant ainsi l'effet des doses à la naissance élevées par rapport aux doses plus petites. La sélection du modèle dépendait de celui qui à la fois réduisait la covariance entre les paramètres et retournait le score DIC le plus bas. </p> <p>La validation du modèle a été effectuée en utilisant 90% des données sélectionnées au hasard contre les 10% restants, et en comparant les estimations de prévalence du modèle aux données observées (figure 3). La figure 4 montre la prévalence moyenne dans chaque pays à partir de toutes les études tracées contre l'estimation du modèle. La figure 5 montre les distributions marginales et conjointes postérieures des paramètres ajustés. Le tableau 1 donne les valeurs estimées des paramètres avec les intervalles de confiance associés. </p> <p>Lors de l'exercice de validation (au cours duquel les pays ont été consultés au sujet de leurs estimations), il a été souligné que la Chine avait entrepris trois enquêtes sérologiques en population de très grande envergure afin d'établir la prévalence de base et les progrès vers l'élimination du VHB. Il y avait un grand nombre d'autres enquêtes en Chine, qui sont moins représentatives que ces trois enquêtes nationales. Nous avons effectué une analyse de sensibilité en limitant les données de la Chine aux trois enquêtes représentatives au niveau national. Cette modification des données d'entrée a eu pour effet de rendre plus net l'effet de la vaccination, mais les effets estimés sur l'âge (changement de la prévalence chez les enfants de moins de 5 ans ou les jeunes (enfants de 5 à 15 ans)) n'étaient plus significativement différents de zéro (voir tableau 2 et figure 6). La déviance était significativement réduite, ce qui suggère un modèle beaucoup mieux ajusté (tableau 2), bien que sur un ensemble de données quelque peu réduit. </p> |
deblsyl
Translation changed |
<p>The data was modelled using a Bayesian logistic regression looking at the proportion of individuals that tested positive for HBsAg in each study, weighting each study by its size and using a conditional autoregressive (CAR) model accounting for spatial and economic correlations between similar countries. This model uses data from well sampled countries to estimate prevalence in more data poor countries with effects such as sex, age and vaccination status, these are also informed by the geographic and countries GDP proximity to other countries (CAR model). Under the assumption that countries that are close together economically and/or geographically will have more similar prevalence due to similar social structure and health care capabilities. </p>
<p>The response variable in the model was the prevalence of Hepatitis surface antigen (HBsAg) with the explanatory variables being age (three categories, under 5, juvenile (5-15) and adult (16+), split using the average age of participants in the study), sex (proportion female in the study), study bias (e.g. a high fraction of study participants from indigenous populations), 3 dose vaccine coverage, birth dose of the vaccine and country of study. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The WHO-UNICEF estimates are annual data for the country as a whole, and did not contain information on vaccine efficacy which was not used in the analysis as no data on this was obtained. The vaccine efficacy would be implicitly estimated in the analysis as we see vaccination having a variable effect across time and space across the studies. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. More explicitly, the model uses the ages and timing of the study to calculate the years across which the participants are born, so if the if there was an age group range of 10-15 in a study that was undertaken in 2015, the birth years would be from 2000-2005, we then average the vaccination coverage from the WHO-UNICEF estimates across those 5 years assuming that each age was evenly represented in that age group in the study. The same process was used for the 3 dose and birth dose vaccination. </p> <p> </p> <p>The general logistic model equation is described below, </p> <p>Yi ~Binomial (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p> <p> </p> <p>Where βj are the fixed effects of the explanatory variables xii. With the spatial random effects described by </p> <p>ui~ N(u−i,σ2u/ni)</p> <p> , </p> <p>where, </p> <p>u−i= ∑j ∈ neigh(i)wiuj/ni</p> <p>Where ni is the number of neighbours for country i and weights wi, are 1. </p> <p> </p> <p>The model was simulated in the Bayesian statistical package WinBUGS, and data manipulation and model initialisation run from R (3.3.1) using R2WinBUGS. The model considers the parameters of age, sex, study bias (e.g. a high fraction of study participants from indigenous populations), vaccine coverage, birth dose of the vaccine and country of study. </p> <p>The model uses the CAR-normal function, in WinBUGS, to model the spatial and economic autocorrelation related to neighbouring countries. For each country that had prevalence data, a weighted central position was calculated using the size and location of each study. For those countries with no data, we used the population centroid. In a novel approach, we considered 3 dimensions in the country adjacency matrix; we used the usual geographic dimensions, latitude and longitude and also combined these with the natural log of the country’s GDP per capita. This was to measure not only geographic but also the developmental proximity of countries. The adjacency matrix for the geo-economic distance gives a score between each country to every other country. Those countries which are close geographically and economically would have a low score and those further apart either geographically or economically would have a high score/distance. Therefore, those countries that are more alike will have a low score and those countries which are alike would have a high score. </p> <p>The way we proportioned the geographic and economic distance to produce the adjacency matrix was then explored, this is because geographic distance may be more or less important than economic similarities. Thus, by creating a number of different adjacency matrices (not definitive) we could select the most suitable matrix that explains reality best. We normalised the geographic and GDP distance and then calculated the distance between these two normalised figures. This creates a smoothed Gaussian surface that is dependent on both spatial proximity and GDP per-capita proximity. We compared ratios of, 1:0, 1:1, 2:1, 1:2 (Geographic:GDP). </p> <p>For each different adjacency matrix, we also had to select a neighbourhood distance, i.e. over what distance can a country be effected by another. Thus, we also varied the radius of distance from which to select neighbours for the neighbourhood network, we used the maximum minimum distance, twice the maximum minimum and three times the maximum minimum, thus varying the number of neighbours each country would have. </p> <p> </p> <p>Finally, to decide the magnitude of the effect one country has on another in the neighbourhood network we varied the weights of pairs of countries in the adjacency matrix, using either a neutral weighting of 1, so that each neighbour has an equal effect on each other (not dependent on the distance in the network), or decaying weights over distance with 1/distance, and 1/distance2, where the closer the country is the greater the effect it has on another country. The outcome of these 36 different combinations led to minimum DIC (Deviance Information Criterion) being found for a ratio of 1:2 (Geographic:GDP), the neighbourhood networks minimum distance being twice the maximum minimum distance and an even weighting of 1/distance for each adjacent country. </p> <p>This model structure produces estimates for all fixed effects and also individual country level risk, this provides information on which are significantly at greater or lower risk to the average risk. </p> <p>All parameters were given un-informative priors. Simulations were run with 3 MCMC chains with 50,000 burn in iterations and each parameter estimated from 1000 samples taken from a thinned 250,000 iterations to produce the posterior distribution. Convergence was attained, with r̂ values all very close to 1.000. Due to the Bayesian framework and WinBUGS software it was possible to gain estimates for countries where we had no data on prevalence, using their GDP and geographic proximity to inform this estimate. Those countries with the largest number of studies provided the estimates with the tightest confidence intervals and those with few or no data were less well defined, often producing a log normal distributed posterior distribution, giving estimates with long tails. </p> <p>Posterior distributions of parameters were inspected for convergence and to check for covariance between parameters. Where necessary parameters were centred and scaled to N (0, 1) to aid parameter convergence and remover covariance. This was done for the sex parameter, which was entered as the proportion of the sample that was female; this was seen to co-vary with the intercept and bias parameters before re-centring and scaling. However, the covariance of routine vaccination and birth dose persisted even after re-centring. This is in part unsurprising as there a few instances where birth dose is administered without the routine vaccination. Here we tried to reduce this interaction of the terms by transforming the birth dose data. We modelled birth dose using only data where the birth dose was greater than 60, 70, 80 & 90% respectively, we also modelled birth dose to the square, thus increasing the effect of high birth doses over smaller doses. Model selection dependent on which one both reduced the covariance between the parameters and returned the lowest DIC score. </p> <p>Model validation was conducted using 90% of randomly selected data against the remaining 10%, and by comparing model estimates of prevalence against observed data (Figure 3). Figure 4 shows the average prevalence in each country from all the studies plotted against the models estimate. Figure 5 shows the marginal and joint posterior distributions for the fitted parameters. Table 1 gives the estimated parameter values with associated credible intervals. </p> <p>During the validation exercise (in which countries were consulted over their estimates) it was pointed out that China had undertaken three very large-scale population-based serological surveys in order to establish baseline prevalence and progress towards HBV elimination. There were a large number of other surveys from China, that are less representative than these three nationwide surveys. We conducted a sensitivity analysis by restricting the data from China to the three nationally representative surveys. The effect of this change in input data was that the effect of vaccination was more distinct, but the estimated age effects (change in prevalence in children under 5, or juveniles (children 5-15 years)) were no longer significantly different from zero (see Table 2 and Figure 6). The deviance was significantly reduced, suggesting a much better fitting model (Table 2), albeit on a somewhat reduced dataset. </p>
<p>Les données ont été modélisées à l'aide d'une régression logistique bayésienne examinant la proportion d'individus testés positifs pour l'AgHBs dans chaque étude, en pondérant chaque étude par sa taille et en utilisant un modèle autorégressif conditionnel (CAR) tenant compte des corrélations spatiales et économiques entre pays similaires. Ce modèle utilise les données des pays bien échantillonnés pour estimer la prévalence dans les pays plus pauvres en données avec des effets tels que le sexe, l'âge et le statut vaccinal, ceux-ci sont également informés par la proximité géographique et le PIB des pays avec d'autres pays (modèle CAR). Selon l'hypothèse que les pays proches économiquement et/ou géographiquement auront une prévalence plus similaire en raison d'une structure sociale et de capacités de soins de santé similaires. </p>
<p>La variable réponse du modèle était la prévalence de l'antigène de surface de l'hépatite (AgHBs), les variables explicatives étant l'âge (trois catégories, moins de 5 ans, mineur (5-15 ans) et adulte (16 ans ou plus), réparties en utilisant l'âge moyen des participants à l'étude), le sexe (proportion de femmes dans l'étude), le biais de l'étude (par exemple, une fraction élevée de participants à l'étude provenant de populations indigènes), la couverture vaccinale à 3 doses, la dose de vaccin à la naissance et le pays de l'étude. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations de couverture vaccinale correspondantes de l'OMS-UNICEF pour ce pays. Les estimations de l'OMS-UNICEF sont des données annuelles pour l'ensemble du pays et ne contiennent pas d'informations sur l'efficacité du vaccin, celle-ci n'a pas été utilisée dans l'analyse car aucune donnée à ce sujet n'a été obtenue. L'efficacité du vaccin serait implicitement estimée dans l'analyse car nous constatons que la vaccination a un effet variable dans le temps et l'espace dans les études. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations correspondantes de la couverture vaccinale de l'OMS-UNICEF pour ce pays. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations de couverture vaccinale de l'OMS-UNICEF correspondantes pour ce pays. Plus précisément, le modèle utilise les âges et le moment de l'étude pour calculer les années de naissance des participants. Ainsi, si une étude menée en 2015 portait sur une tranche d'âge de 10 à 15 ans, les années de naissance s'étendraient de 2000 à 2005, nous avons ensuite calculé la moyenne de la couverture vaccinale à partir des estimations de l'OMS-UNICEF sur ces 5 années en supposant que chaque âge était représenté de manière égale dans cette tranche d'âge dans l'étude. Le même processus a été utilisé pour la vaccination à 3 doses et la vaccination à la naissance. </p> <p> </p> <p>L'équation du modèle logistique général est décrite ci-dessous, </p> <p>Yi ~Binôme (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p> <p> </p> <p>où βj sont les effets fixes des variables explicatives xii. Avec les effets aléatoires spatiaux décrits par </p> <p>ui~ N(u−i,σ2u/ni)</p> <p>où </p> <p>u−i= ∑j ∈ neigh(i)wiuj/ni</p> <p>où ni est le nombre de voisins pour le pays i et les poids wi, valent 1. </p> <p> </p> <p>Le modèle a été simulé dans le <p>Le modèle utilise la fonction CAR-normale, dans WinBUGS, pour modéliser l'autocorrélation géographique et économique liée aux pays voisins. Pour chaque pays disposant de données de prévalence, une position centrale pondérée a été calculée en utilisant la taille et la localisation de chaque étude. Pour les pays ne disposant pas de données, nous avons utilisé le centroïde de la population. Dans une approche novatrice, nous avons considéré 3 dimensions dans la matrice d'adjacence des pays <p>On a ensuite exploré la façon dont nous avons proportionné la distance géographique et économique pour produire la matrice d'adjacence, ceci parce que la distance géographique peut être plus ou moins importante que les similitudes économiques. Ainsi, en créant un certain nombre de matrices d'adjacence différentes (non définitives), nous avons pu sélectionner la matrice la plus adaptée qui explique le mieux la réalité. Nous avons normalisé la distance géographique et la distance du PIB, puis nous avons calculé la distance entre ces deux chiffres normalisés. Cela crée une surface gaussienne lissée qui dépend à la fois de la proximité spatiale et de la proximité du PIB par habitant. Nous avons comparé des ratios de, 1:0, 1:1, 2:1, 1:2 (Géographi <p>Pour chaque matrice d'adjacence différente, nous avons également dû choisir une distance de voisinage, c'est-à-dire sur quelle distance un pays peut être affecté par un autre. Ainsi, nous avons également fait varier le rayon de distance à partir duquel sélectionner les voisins pour le réseau de voisinage, nous avons utilisé la distance minimale maximale, deux fois le minimum maximal et trois fois le minimum maximal, faisant ainsi varier le nombre de voisins que chaque pays aurait. </p> <p> </p> <p>Enfin, pour décider de l'ampleur de l'effet d'un pays sur un autre dans le réseau de voisinage, nous avons fait varier les poids des paires de pays dans la matrice d'adjacence, en utilisant soit une pondération neutre de 1, de sorte que chaque voisin a un effet égal sur les autres (ne dépendant pas de la distance dans le réseau), soit des poids décroissants sur la distance avec 1/distance, et 1/distance2, où plus le pays est proche, plus son effet sur un autre pays est important. Le résultat de ces 36 combinaisons différentes a conduit à trouver un DIC (Deviance Information Criterion) minimal pour un rapport de 1:2 (Géographie:PIB), la distance minimale des réseaux de voisinage étant deux fois la distance minimale maximale et une pondération égale de 1/distance pour chaque pays adjacent. </p> <p>Cette structure de modèle produit des estimations pour tous les effets fixes et aussi pour le risque individuel au niveau du pays, cela fournit des informations sur ceux qui sont significativement plus à risque ou moins à risque par rapport au risque moyen. </p> <p>Tous les paramètres étaient a priori non informatifs. Les simulations ont été effectuées avec 3 chaînes MCMC avec 50 000 essais par itération et chaque paramètre estimé à partir de 1 000 échantillons prélevés sur un nombre réduit de 250 000 itérations pour produire la distribution postérieure. La convergence a été atteinte, avec des valeurs r̂ toutes très proches de 1,000. Grâce au cadre bayésien et au logiciel WinBUGS, il a été possible d'obtenir des estimations pour les pays pour lesquels nous n'avions pas de données sur la prévalence, en utilisant leur PIB et leur proximité géographique pour informer cette estimation. Les pays avec le plus grand nombre d'études ont fourni les estimations avec les intervalles de confiance les plus serrés et ceux avec peu ou pas de données étaient moins bien définis, produisant souvent une distribution postérieure log normale, donnant des estimations avec de longues queues. </p> <p>Les distributions postérieures des paramètres ont été inspectées pour vérifier la convergence et pour vérifier la covariance entre les paramètres. Si nécessaire, les paramètres ont été centrés et mis à l'échelle d'une loi N (0, 1) pour faciliter la convergence des paramètres et supprimer la covariance. C'est ce qui a été fait pour le paramètre de sexe, qui a été saisi comme la proportion de l'échantillon qui était féminine; on a constaté qu'il covarie avec les paramètres d'interception et de biais avant le recentrage et la mise à l'échelle. Cependant, la covariance de la vaccination systématique et de la dose à la naissance est restée même après recentrage. Ceci n'est en partie pas surprenant car il existe quelques cas où la dose à la naissance est administrée sans la vaccination systématique. Nous avons essayé de réduire cette interaction des termes en transformant les données sur la dose à la naissance. Nous avons modélisé celle-ci en utilisant uniquement les données où la dose à la naissance était supérieure à 60, 70, 80 et 90% respectivement, nous avons également modélisé la dose à la naissance au carré, augmentant ainsi l'effet des doses à la naissance élevées par rapport aux doses plus petites. La sélection du modèle dépendait de celui qui à la fois réduisait la covariance entre les paramètres et retournait le score DIC le plus bas. </p> <p>La validation du modèle a été effectuée en utilisant 90% des données sélectionnées au hasard contre les 10% restants, et en comparant les estimations de prévalence du modèle aux données observées (figure 3). La figure 4 montre la prévalence moyenne dans chaque pays à partir de toutes les études tracées contre l'estimation du modèle. La figure 5 montre les distributions marginales et conjointes postérieures des paramètres ajustés. Le tableau 1 donne les valeurs estimées des paramètres avec les intervalles de confiance associés. </p> <p>Lors de l'exercice de validation (au cours duquel les pays ont été consultés au sujet de leurs estimations), il a été souligné que la Chine avait entrepris trois enquêtes sérologiques en population de très grande envergure afin d'établir la prévalence de base et les progrès vers l'élimination du VHB. Il y avait un grand nombre d'autres enquêtes en Chine, qui sont moins représentatives que ces trois enquêtes nationales. Nous avons effectué une analyse de sensibilité en limitant les données de la Chine aux trois enquêtes représentatives au niveau national. Cette modification des données d'entrée a eu pour effet de rendre plus net l'effet de la vaccination, mais les effets estimés sur l'âge (changement de la prévalence chez les enfants de moins de 5 ans ou les jeunes (enfants de 5 à 15 ans)) n'étaient plus significativement différents de zéro (voir tableau 2 et figure 6). La déviance était significativement réduite, ce qui suggère un modèle beaucoup mieux ajusté (tableau 2), bien que sur un ensemble de données quelque peu réduit. </p> |
deblsyl
Translation changed |
<p>The data was modelled using a Bayesian logistic regression looking at the proportion of individuals that tested positive for HBsAg in each study, weighting each study by its size and using a conditional autoregressive (CAR) model accounting for spatial and economic correlations between similar countries. This model uses data from well sampled countries to estimate prevalence in more data poor countries with effects such as sex, age and vaccination status, these are also informed by the geographic and countries GDP proximity to other countries (CAR model). Under the assumption that countries that are close together economically and/or geographically will have more similar prevalence due to similar social structure and health care capabilities. </p>
<p>The response variable in the model was the prevalence of Hepatitis surface antigen (HBsAg) with the explanatory variables being age (three categories, under 5, juvenile (5-15) and adult (16+), split using the average age of participants in the study), sex (proportion female in the study), study bias (e.g. a high fraction of study participants from indigenous populations), 3 dose vaccine coverage, birth dose of the vaccine and country of study. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The WHO-UNICEF estimates are annual data for the country as a whole, and did not contain information on vaccine efficacy which was not used in the analysis as no data on this was obtained. The vaccine efficacy would be implicitly estimated in the analysis as we see vaccination having a variable effect across time and space across the studies. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. More explicitly, the model uses the ages and timing of the study to calculate the years across which the participants are born, so if the if there was an age group range of 10-15 in a study that was undertaken in 2015, the birth years would be from 2000-2005, we then average the vaccination coverage from the WHO-UNICEF estimates across those 5 years assuming that each age was evenly represented in that age group in the study. The same process was used for the 3 dose and birth dose vaccination. </p> <p> </p> <p>The general logistic model equation is described below, </p> <p>Yi ~Binomial (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p> <p> </p> <p>Where βj are the fixed effects of the explanatory variables xii. With the spatial random effects described by </p> <p>ui~ N(u−i,σ2u/ni)</p> <p> , </p> <p>where, </p> <p>u−i= ∑j ∈ neigh(i)wiuj/ni</p> <p>Where ni is the number of neighbours for country i and weights wi, are 1. </p> <p> </p> <p>The model was simulated in the Bayesian statistical package WinBUGS, and data manipulation and model initialisation run from R (3.3.1) using R2WinBUGS. The model considers the parameters of age, sex, study bias (e.g. a high fraction of study participants from indigenous populations), vaccine coverage, birth dose of the vaccine and country of study. </p> <p>The model uses the CAR-normal function, in WinBUGS, to model the spatial and economic autocorrelation related to neighbouring countries. For each country that had prevalence data, a weighted central position was calculated using the size and location of each study. For those countries with no data, we used the population centroid. In a novel approach, we considered 3 dimensions in the country adjacency matrix; we used the usual geographic dimensions, latitude and longitude and also combined these with the natural log of the country’s GDP per capita. This was to measure not only geographic but also the developmental proximity of countries. The adjacency matrix for the geo-economic distance gives a score between each country to every other country. Those countries which are close geographically and economically would have a low score and those further apart either geographically or economically would have a high score/distance. Therefore, those countries that are more alike will have a low score and those countries which are alike would have a high score. </p> <p>The way we proportioned the geographic and economic distance to produce the adjacency matrix was then explored, this is because geographic distance may be more or less important than economic similarities. Thus, by creating a number of different adjacency matrices (not definitive) we could select the most suitable matrix that explains reality best. We normalised the geographic and GDP distance and then calculated the distance between these two normalised figures. This creates a smoothed Gaussian surface that is dependent on both spatial proximity and GDP per-capita proximity. We compared ratios of, 1:0, 1:1, 2:1, 1:2 (Geographic:GDP). </p> <p>For each different adjacency matrix, we also had to select a neighbourhood distance, i.e. over what distance can a country be effected by another. Thus, we also varied the radius of distance from which to select neighbours for the neighbourhood network, we used the maximum minimum distance, twice the maximum minimum and three times the maximum minimum, thus varying the number of neighbours each country would have. </p> <p> </p> <p>Finally, to decide the magnitude of the effect one country has on another in the neighbourhood network we varied the weights of pairs of countries in the adjacency matrix, using either a neutral weighting of 1, so that each neighbour has an equal effect on each other (not dependent on the distance in the network), or decaying weights over distance with 1/distance, and 1/distance2, where the closer the country is the greater the effect it has on another country. The outcome of these 36 different combinations led to minimum DIC (Deviance Information Criterion) being found for a ratio of 1:2 (Geographic:GDP), the neighbourhood networks minimum distance being twice the maximum minimum distance and an even weighting of 1/distance for each adjacent country. </p> <p>This model structure produces estimates for all fixed effects and also individual country level risk, this provides information on which are significantly at greater or lower risk to the average risk. </p> <p>All parameters were given un-informative priors. Simulations were run with 3 MCMC chains with 50,000 burn in iterations and each parameter estimated from 1000 samples taken from a thinned 250,000 iterations to produce the posterior distribution. Convergence was attained, with r̂ values all very close to 1.000. Due to the Bayesian framework and WinBUGS software it was possible to gain estimates for countries where we had no data on prevalence, using their GDP and geographic proximity to inform this estimate. Those countries with the largest number of studies provided the estimates with the tightest confidence intervals and those with few or no data were less well defined, often producing a log normal distributed posterior distribution, giving estimates with long tails. </p> <p>Posterior distributions of parameters were inspected for convergence and to check for covariance between parameters. Where necessary parameters were centred and scaled to N (0, 1) to aid parameter convergence and remover covariance. This was done for the sex parameter, which was entered as the proportion of the sample that was female; this was seen to co-vary with the intercept and bias parameters before re-centring and scaling. However, the covariance of routine vaccination and birth dose persisted even after re-centring. This is in part unsurprising as there a few instances where birth dose is administered without the routine vaccination. Here we tried to reduce this interaction of the terms by transforming the birth dose data. We modelled birth dose using only data where the birth dose was greater than 60, 70, 80 & 90% respectively, we also modelled birth dose to the square, thus increasing the effect of high birth doses over smaller doses. Model selection dependent on which one both reduced the covariance between the parameters and returned the lowest DIC score. </p> <p>Model validation was conducted using 90% of randomly selected data against the remaining 10%, and by comparing model estimates of prevalence against observed data (Figure 3). Figure 4 shows the average prevalence in each country from all the studies plotted against the models estimate. Figure 5 shows the marginal and joint posterior distributions for the fitted parameters. Table 1 gives the estimated parameter values with associated credible intervals. </p> <p>During the validation exercise (in which countries were consulted over their estimates) it was pointed out that China had undertaken three very large-scale population-based serological surveys in order to establish baseline prevalence and progress towards HBV elimination. There were a large number of other surveys from China, that are less representative than these three nationwide surveys. We conducted a sensitivity analysis by restricting the data from China to the three nationally representative surveys. The effect of this change in input data was that the effect of vaccination was more distinct, but the estimated age effects (change in prevalence in children under 5, or juveniles (children 5-15 years)) were no longer significantly different from zero (see Table 2 and Figure 6). The deviance was significantly reduced, suggesting a much better fitting model (Table 2), albeit on a somewhat reduced dataset. </p>
<
<h2>Méthode de calcul :</h2> <p>Les données ont été modélisées à l'aide d'une régression logistique bayésienne examinant la proportion d'individus testés positifs pour l'HBsAg dans chaque étude, en pondérant chaque étude par sa taille et en utilisant un modèle autorégressif conditionnel (CAR) tenant compte des corrélations spatiales et économiques entre des pays similaires. Ce modèle utilise des données provenant de pays bien échantillonnés pour estimer la prévalence dans des pays pauvres en données, avec des effets tels que le sexe, l'âge et le statut vaccinal, qui sont également informés par la proximité géographique et le PIB des pays par rapport aux autres pays (modèle CAR). En partant de l'hypothèse que les pays qui sont proches économiquement et/ou géographiquement, auront une prévalence plus similaire en raison de leur structure sociale et de leurs capacités en matière de soins de santé. </p> <p>La variable de réponse dans le modèle était la prévalence de l'antigène de surface de l'hépatite (HBsAg), les variables explicatives étant l'âge (trois catégories, moins de 5 ans, jeunes (5 à 15 ans) et adultes (16 et +), réparties en fonction de l'âge moyen des participants à l'étude), le sexe (proportion de femmes dans l'étude), le biais de l'étude (par exemple, une forte proportion de participants à l'étude issus de populations indigènes), la couverture vaccinale de 3 doses, la dose de naissance du vaccin et le pays de l'étude. La couverture de la vaccination de routine en 3 doses et de la vaccination à la naissance dans chaque étude, a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale de l'Organisation mondiale de la Santé (OMS) et de le Fonds des Nations Unies pour l'enfance (UNICEF) pour ce pays. Les estimations OMS-UNICEF sont des données annuelles pour l'ensemble du pays et ne contiennent pas de l'informations sur l'efficacité du vaccin qui n'ont pas été utilisées dans l'analyse, car aucune donnée n'a été obtenue à ce sujet. L'efficacité du vaccin serait implicitement estimée dans l'analyse, car nous constatons que la vaccination a un effet variable dans le temps et dans l'espace selon les études. La couverture de la vaccination de routine à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale de l'OMS et de l'UNICEF pour ce pays. La couverture de la vaccination systématique par trois doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale OMS-UNICEF pour ce pays. Plus explicitement, le modèle utilise l'âge et le moment de l'étude pour calculer les années de naissance des participants. Ainsi, s'il y avait une tranche d'âge de 10 à 15 ans dans une étude entreprise en 2015, les années de naissance seraient de 2000 à 2005, nous faisons alors la moyenne de la couverture vaccinale des estimations OMS-UNICEF sur ces 5 années en supposant que chaque âge est représenté de manière égale dans cette tranche d'âge dans l'étude. Le même processus a été utilisé pour la vaccination à 3 doses et la vaccination à la naissance. </p> <p>L'équation générale du modèle logistique est décrite ci-dessous, </p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAeEAAABRCAMAAADSKe79AAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAK1UExURf////T09NTU1Nzc3Pz8/O/v79DQ0Pr6+qampnh4eHR0dMLCwpGRkXp6em1tbc/Pz+Li4snJydfX11NTU4KCgt3d3erq6m9vb6Wlpby8vFZWVr6+vvHx8X19fZ+fn3Fxcf7+/uzs7K+vr+7u7l1dXZSUlP39/WdnZ9PT01VVVaenp4yMjJaWlre3t1RUVIiIiLCwsKKiouTk5J2dnWNjY+Pj4+vr6/j4+PX19YaGhoSEhPf399/f3/Dw8Pv7+4uLi2JiYl9fX6CgoNbW1pKSkpWVla2traysrHd3d66urvb29o+Pj0pKSktLS+jo6NXV1fn5+bGxsYODg2xsbGRkZOfn59jY2GlpaYmJicjIyGZmZmFhYY2NjZmZmXZ2duDg4Lm5uc3NzbKysk9PT25ubp6entHR0cDAwPPz81tbW1dXV6GhoWtra3BwcO3t7enp6YGBgbi4uJOTk7W1tVFRUXl5eX9/f+bm5tvb27+/v7Ozs7S0tM7Ozn5+ft7e3tra2uHh4cXFxfLy8nJycnV1daOjo5CQkJubm46OjsPDw8bGxk5OTqioqJeXl3x8fFJSUlBQUMzMzKqqql5eXlhYWMHBwWpqamBgYMrKyoWFhU1NTbq6utnZ2ampqZqamkxMTFxcXOXl5cvLy3Nzc4qKimVlZVlZWba2toCAgLu7u729vaSkpNLS0qurq5iYmIeHh8fHx1paWmhoaHt7e5ycnMTExLGtrfayso9ubvze3ptUVGhnZ/vc3MllZXFvb/3y8vivr/739//+/vvX17VXV3Vqav3r69pdXWtMTP/8/NiAgJhcXOfk5P79/fi6uvixse3q6v78/LN3d6g+PvGSkoBTU8u+vp5AQOy3t/rIyPWYmOLU1JKRkYBXV/WGhui0tJ6dncXExHRjY+GEhPWQkMGysgAAAH/C7rcA <p>Where βj sont les effets fixes des variables explicatives <em>x<sub>ii</sub></em>. Avec les effets aléatoires spatiaux décrits par </p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAJsAAAAuCAMAAAAIuJt4AAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAIfUExURf////r6+vLy8vHx8e/v7/X19f7+/r+/v319faenp7CwsIiIiIaGhuXl5fz8/ODg4KSkpMDAwLu7u/39/crKylhYWLKysp2dndHR0fv7+7y8vF1dXYuLi+np6dTU1FlZWaqqqoCAgPn5+WBgYJGRkcLCwmdnZ0pKSlZWVuvr62xsbExMTI6OjuHh4bW1tc7OztPT0/b29pubm15eXtXV1VtbW8vLy9LS0mpqaoeHh+rq6pKSkk5OTk1NTaysrPf395WVlV9fX1dXV5+fn6urq3p6eomJib29vWhoaLe3t35+fnNzc+7u7tra2mNjY4KCgnBwcPT09IyMjFVVVcjIyFxcXKOjo/j4+Nvb21RUVKKiomFhYePj4+zs7N3d3aCgoHh4eFNTU3t7e6WlpcnJyVpaWtzc3OTk5N/f3+bm5szMzJiYmOjo6PDw8MXFxY2NjWZmZuLi4tDQ0JeXl2VlZVFRUdfX166uroODg2JiYo+Pj3l5eXFxcWRkZJSUlN7e3r6+vufn57i4uIqKipCQkIWFhcbGxm1tbe3t7dnZ2bq6und3d8TExHZ2doGBgVBQUHx8fK+vr5mZmX9/f7a2tqmpqaGhofPz85OTk2lpaYSEhJaWlk9PT6ioqJ6enrOzs29vb8PDw3JyclJSUpycnMfHx7S0tM/Pz2tra9jY2EtLS7GxsZqams3Nza2trcHBwXR0dKamprm5udbW1gAAAPSlTP8AAAC1dFJOU/////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////// <p>où,</p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAPQAAABNCAMAAACmNLlxAAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAIlUExURf////7+/v39/bW1tZ6enujo6I+Pj0pKSktLS01NTdXV1e/v72xsbE5OTqWlpfT09Pf39/X19dHR0WBgYL+/v1paWl9fX6Ojo3Nzc+Hh4fHx8VxcXIqKin9/f+zs7IuLi+fn52tra1FRUaurq/n5+cDAwFdXV9fX18PDw2JiYmVlZc3Nzevr68XFxfj4+KqqqmZmZubm5oCAgIiIiPDw8HR0dFRUVK6urtPT08nJyVBQUOnp6e3t7UxMTJCQkO7u7sfHx7q6unp6eqKiol5eXuXl5ampqVJSUpeXl/r6+l1dXc/Pz6+vr9nZ2bS0tNLS0vz8/LGxsVZWVn5+foKCgtbW1ry8vPb29uPj43FxcaioqLm5ucrKyvv7+8bGxq2trbCwsLu7u8zMzM7OzuLi4o2NjU9PT2dnZ8jIyGNjY2RkZFlZWdTU1MTExPLy8m1tbZSUlODg4IWFhXV1dWhoaJWVlVhYWFVVVcHBwaGhoVtbW2FhYXd3d8LCwri4uIyMjKysrJGRkYSEhHx8fJaWloODg/Pz825ubnBwcIeHh6SkpH19fXZ2dp2dnXl5eVNTU5ycnN3d3W9vb4aGhtvb23h4eOrq6rOzs5mZmaamptDQ0Gpqat7e3t/f35iYmI6OjomJidjY2Kenp76+vre3t2lpaXt7e3JycuTk5JOTk7Kyspqampubm7a2tpKSktra2svLy6CgoIGBgb29vZ+fn9zc3AAAAEw+Zl4AAAC3dFJOU/////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////// <p>où <em>n<sub>i</sub></em> est le nombre de voisins pour le pays <em>i</em> et les poids <em>w<sub>i</sub></em>, sont 1. </p> <p>Le modèle a été simulé dans le progiciel statistique bayésien WinBUGS, et la manipulation des données et l'initialisation du modèle ont été effectuées à partir de R (3.3.1) en utilisant R2WinBUGS. Le modèle prend en compte les paramètres de l'âge, du sexe, du biais de l'étude (par exemple, une forte proportion de participants à l'étude issus de populations indigènes), de la couverture vaccinale, de la dose de naissance du vaccin et du pays d'étude. </p> <p>Le modèle utilise la fonction CAR-normale, dans WinBUGS, pour modéliser l'autocorrélation spatiale et économique liée aux pays voisins. Pour chaque pays disposant de données de prévalence, une position centrale pondérée a été calculée en utilisant la taille et la localisation de chaque étude. Pour les pays ne disposant pas de données, nous avons utilisé le centroïde de la population. Dans une nouvelle approche, nous avons pris en compte trois dimensions dans la matrice de contiguïté des pays ; nous avons utilisé les dimensions géographiques habituelles, la latitude et la longitude, et les avons également combinées avec le logarithme naturel du PIB par habitant du pays. Il s'agissait de mesurer non seulement la proximité géographique, mais aussi la proximité de développement des pays. La matrice de proximité pour la distance géo-économique donne un score entre chaque pays et chaque autre pays. Les pays qui sont proches géographiquement et économiquement ont un score faible et ceux qui sont plus éloignés géographiquement ou économiquement ont un score/distance élevé. Par conséquent, les pays qui se ressemblent le plus auront un score faible et les pays qui se ressemblent un score élevé. </p> <p>La façon dont nous avons proportionné la distance géographique et économique pour produire la matrice de contiguïté a ensuite été explorée, car la distance géographique peut être plus ou moins importante que les similitudes économiques. Ainsi, en créant un certain nombre de matrices de contiguïté différentes (non définitives), nous avons pu sélectionner la matrice la plus appropriée qui explique le mieux la réalité. Nous avons normalisé la distance géographique et la distance du PIB, puis nous avons calculé la distance entre ces deux chiffres normalisés. Cela crée une surface gaussienne lissée qui dépend à la fois de la proximité spatiale et de la proximité du PIB par habitant. Nous avons comparé les ratios de, 1:0, 1:1, 2:1, 1:2 (Géographique:PIB). </p> <p>Pour chaque matrice de proximité différente, nous avons également dû sélectionner une distance de voisinage, c'est-à-dire sur quelle distance un pays peut être affecté par un autre. Ainsi, nous avons également fait varier le rayon de la distance à partir de laquelle sélectionner les voisins pour le réseau de voisinage, nous avons utilisé la distance minimale maximale, deux fois la distance minimale maximale et trois fois la distance minimale maximale, faisant ainsi varier le nombre de voisins que chaque pays aurait. </p> <p>Enfin, pour décider de l'ampleur de l'effet d'un pays sur un autre dans le réseau de voisinage, nous avons fait varier les poids des paires de pays dans la matrice de contiguïté, en utilisant soit un poids neutre de 1, de sorte que chaque voisin a un effet égal sur l'autre (ne dépendant pas de la distance dans le réseau), soit des poids décroissants sur la distance avec 1/distance, et 1/distance2, où plus le pays est proche, plus l'effet qu'il a sur un autre pays est important. Le résultat de ces 36 combinaisons différentes a permis de trouver un DIC (Deviance Information Criterion) minimum pour un rapport de 1:2 (Géographie:PIB), la distance minimum des réseaux de voisinage étant le double de la distance minimum maximum et une pondération égale de 1/distance pour chaque pays adjacent. </p> <p>Cette structure de modèle produit des estimations pour tous les effets fixes et aussi pour le risque au niveau de chaque pays, ce qui fournit des informations sur ceux qui sont significativement plus ou moins exposés au risque moyen. </p> <p>Tous les paramètres ont été donnés des antécédents non informatifs. Des simulations ont été effectuées avec 3 chaînes MCMC avec 50 000 brûlures en itérations et chaque paramètre a été estimé à partir de 1000 échantillons prélevés sur 250 000 itérations diluées pour produire la distribution postérieure. La convergence a été atteinte, avec r̂ ; des valeurs toutes très proches de 1.000. Grâce au cadre bayésien et au logiciel WinBUGS, il a été possible d'obtenir des estimations pour les pays où nous ne disposions pas de données sur la prévalence, en utilisant leur PIB et leur proximité géographique pour étayer cette estimation. Les pays ayant réalisé le plus grand nombre d'études ont fourni les estimations avec les intervalles de confiance les plus étroits et ceux qui n'avaient que peu ou pas de données étaient moins bien définis, produisant souvent une distribution postérieure log-normale, donnant des estimations avec de longues queues. </p> <p>Les distributions postérieures des paramètres ont été inspectées pour vérifier la convergence et la covariance entre les paramètres. Le cas échéant, les paramètres ont été centrés et mis à l'échelle N (0, 1) pour faciliter la convergence des paramètres et la covariance de la suppression. Cela a été fait pour le paramètre du sexe, qui a été saisi comme la proportion de l'échantillon qui était féminine ; on a constaté qu'il variait avec les paramètres d'interception et de biais avant de recentrer et de mettre à l'échelle. Cependant, la covariance de la vaccination de routine et de la dose à la naissance a persisté même après le recadrage. Cela n'est pas surprenant car il y a eu quelques cas où la dose à la naissance a été administrée sans la vaccination de routine. Nous avons essayé ici de réduire cette interaction des termes en transformant les données relatives à la dose de naissance. Nous avons modélisé la dose de naissance en utilisant uniquement les données où la dose de naissance était supérieure à 60, 70, 80 & ; 90% respectivement, nous avons également modélisé la dose de naissance au carré, augmentant ainsi l'effet des doses de naissance élevées par rapport aux doses plus faibles. Le choix du modèle dépendait de celui qui réduisait la covariance entre les paramètres et donnait le score CIVD le plus bas. </p> <p>La validation du modèle a été réalisée en utilisant 90 % des données sélectionnées au hasard par rapport aux 10 % restants, et en comparant les estimations de la prévalence du modèle aux données observées (figure 3). La figure 4 montre la prévalence moyenne dans chaque pays à partir de toutes les études tracées par rapport à l'estimation du modèle. La figure 5 montre les distributions marginales et articulaires postérieures pour les paramètres ajustés. Le tableau 1 donne les valeurs estimées des paramètres avec les intervalles crédibles associés. <p>Au cours de l'exercice de validation (dans lequel les pays ont été consultés sur leurs estimations), il a été souligné que la Chine avait entrepris trois enquêtes sérologiques à très grande échelle dans la population afin d'établir la prévalence de base et les progrès vers l'élimination du VHB. Il y avait un grand nombre d'autres enquêtes en Chine, qui sont moins représentatives que ces trois enquêtes nationales. Nous avons effectué une analyse de sensibilité en limitant les données de la Chine aux trois enquêtes représentatives au niveau national. Cette modification des données d'entrée a eu pour effet de rendre l'effet de la vaccination plus distinct, mais les effets estimés sur l'âge (changement de la prévalence chez les enfants de moins de 5 ans, ou les jeunes (enfants de 5 à 15 ans)) n'étaient plus significativement différents de zéro (voir tableau 2 et figure 6). L'écart a été réduit de manière significative, ce qui suggère un modèle beaucoup plus adapté (tableau 2), bien que sur un ensemble de données quelque peu réduit. <p>La variable réponse du modèle était la prévalence de l'antigène de surface de l'hépatite (AgHBs), les variables explicatives étant l'âge (trois catégories, moins de 5 ans, mineur (5-15 ans) et adulte (16 ans ou plus), réparties en utilisant l'âge moyen des participants à l'étude), le sexe (proportion de femmes dans l'étude), le biais de l'étude (par exemple, une fraction élevée de participants à l'étude provenant de populations indigènes), la couverture vaccinale à 3 doses, la dose de vaccin à la naissance et le pays de l'étude. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations de couverture vaccinale correspondantes de l'OMS-UNICEF pour ce pays. Les estimations de l'OMS-UNICEF sont des données annuelles pour l'ensemble du pays et ne contiennent pas d'informations sur l'efficacité du vaccin, celle-ci n'a pas été utilisée dans l'analyse car aucune donnée à ce sujet n'a été obtenue. L'efficacité du vaccin serait implicitement estimée dans l'analyse car nous constatons que la vaccination a un effet variable dans le temps et l'espace dans les études. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations correspondantes de la couverture vaccinale de l'OMS-UNICEF pour ce pays. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations de couverture vaccinale de l'OMS-UNICEF correspondantes pour ce pays. Plus précisément, le modèle utilise les âges et le moment de l'étude pour calculer les années de naissance des participants. Ainsi, si une étude menée en 2015 portait sur une tranche d'âge de 10 à 15 ans, les années de naissance s'étendraient de 2000 à 2005, nous avons ensuite calculé la moyenne de la couverture vaccinale à partir des estimations de l'OMS-UNICEF sur ces 5 années en supposant que chaque âge était représenté de manière égale dans cette tranche d'âge dans l'étude. Le même processus a été utilisé pour la vaccination à 3 doses et la vaccination à la naissance. </p> <p> </p> <p>L'équation du modèle logistique général est décrite ci-dessous, </p> <p>Yi ~Binôme (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p> <p> </p> <p>où βj sont les effets fixes des variables explicatives xii. Avec les effets aléatoires spatiaux décrits par </p> <p>ui~ N(u−i,σ2u/ni)</p> <p>où </p> <p>u−i= ∑j ∈ neigh(i)wiuj/ni</p> <p>où ni est le nombre de voisins pour le pays i et les poids wi, valent 1. </p> <p> </p> <p>Le modèle a été simulé dans le paquet statistique bayésien WinBUGS, et la manipulation des données et l'initialisation du modèle exécutées à partir de R (3.3.1) en utilisant R2WinBUGS. Le modèle prend en compte les paramètres de l'âge, du sexe, du biais de l'étude (par exemple, une fraction élevée de participants à l'étude provenant de populations indigènes), de la couverture vaccinale, de la dose du vaccin à la naissance et du pays de l'étude. </p> <p>Le modèle utilise la fonction CAR-normale, dans WinBUGS, pour modéliser l'autocorrélation géographique et économique liée aux pays voisins. Pour chaque pays disposant de données de prévalence, une position centrale pondérée a été calculée en utilisant la taille et la localisation de chaque étude. Pour les pays ne disposant pas de données, nous avons utilisé le centroïde de la population. Dans une approche novatrice, nous avons considéré 3 dimensions dans la matrice d'adjacence des pays ; nous avons utilisé les dimensions géographiques habituelles, la latitude et la longitude, et nous les avons également combinées avec le log naturel du PIB par habitant du pays, ceci afin de mesurer non seulement la proximité géographique mais aussi la proximité de développement des pays. La matrice d'adjacence pour la distance géo-économique donne un score entre chaque pays et tous les autres pays. Les pays qui sont proches géographiquement et économiquement ont un score faible et ceux qui sont plus éloignés géographiquement ou économiquement ont un score/distance élevé. Par conséquent, les pays qui se ressemblent le plus auront un score faible et les pays qui sont moins semblables auront un score élevé. </p> <p>On a ensuite exploré la façon dont nous avons proportionné la distance géographique et économique pour produire la matrice d'adjacence, ceci parce que la distance géographique peut être plus ou moins importante que les similitudes économiques. Ainsi, en créant un certain nombre de matrices d'adjacence différentes (non définitives), nous avons pu sélectionner la matrice la plus adaptée qui explique le mieux la réalité. Nous avons normalisé la distance géographique et la distance du PIB, puis nous avons calculé la distance entre ces deux chiffres normalisés. Cela crée une surface gaussienne lissée qui dépend à la fois de la proximité spatiale et de la proximité du PIB par habitant. Nous avons comparé des ratios de, 1:0, 1:1, 2:1, 1:2 (Géographique:PIB). </p> <p>Pour chaque matrice d'adjacence différente, nous avons également dû choisir une distance de voisinage, c'est-à-dire sur quelle distance un pays peut être affecté par un autre. Ainsi, nous avons également fait varier le rayon de distance à partir duquel sélectionner les voisins pour le réseau de voisinage, nous avons utilisé la distance minimale maximale, deux fois le minimum maximal et trois fois le minimum maximal, faisant ainsi varier le nombre de voisins que chaque pays aurait. </p> <p> </p> <p>Enfin, pour décider de l'ampleur de l'effet d'un pays sur un autre dans le réseau de voisinage, nous avons fait varier les poids des paires de pays dans la matrice d'adjacence, en utilisant soit une pondération neutre de 1, de sorte que chaque voisin a un effet égal sur les autres (ne dépendant pas de la distance dans le réseau), soit des poids décroissants sur la distance avec 1/distance, et 1/distance2, où plus le pays est proche, plus son effet sur un autre pays est important. Le résultat de ces 36 combinaisons différentes a conduit à trouver un DIC (Deviance Information Criterion) minimal pour un rapport de 1:2 (Géographie:PIB), la distance minimale des réseaux de voisinage étant deux fois la distance minimale maximale et une pondération égale de 1/distance pour chaque pays adjacent. </p> <p>Cette structure de modèle produit des estimations pour tous les effets fixes et aussi pour le risque individuel au niveau du pays, cela fournit des informations sur ceux qui sont significativement plus à risque ou moins à risque par rapport au risque moyen. </p> <p>Tous les paramètres étaient a priori non informatifs. Les simulations ont été effectuées avec 3 chaînes MCMC avec 50 000 essais par itération et chaque paramètre estimé à partir de 1 000 échantillons prélevés sur un nombre réduit de 250 000 itérations pour produire la distribution postérieure. La convergence a été atteinte, avec des valeurs r̂ toutes très proches de 1,000. Grâce au cadre bayésien et au logiciel WinBUGS, il a été possible d'obtenir des estimations pour les pays pour lesquels nous n'avions pas de données sur la prévalence, en utilisant leur PIB et leur proximité géographique pour informer cette estimation. Les pays avec le plus grand nombre d'études ont fourni les estimations avec les intervalles de confiance les plus serrés et ceux avec peu ou pas de données étaient moins bien définis, produisant souvent une distribution postérieure log normale, donnant des estimations avec de longues queues. </p> <p>Les distributions postérieures des paramètres ont été inspectées pour vérifier la convergence et pour vérifier la covariance entre les paramètres. Si nécessaire, les paramètres ont été centrés et mis à l'échelle d'une loi N (0, 1) pour faciliter la convergence des paramètres et supprimer la covariance. C'est ce qui a été fait pour le paramètre de sexe, qui a été saisi comme la proportion de l'échantillon qui était féminine; on a constaté qu'il covarie avec les paramètres d'interception et de biais avant le recentrage et la mise à l'échelle. Cependant, la covariance de la vaccination systématique et de la dose à la naissance est restée même après recentrage. Ceci n'est en partie pas surprenant car il existe quelques cas où la dose à la naissance est administrée sans la vaccination systématique. Nous avons essayé de réduire cette interaction des termes en transformant les données sur la dose à la naissance. Nous avons modélisé celle-ci en utilisant uniquement les données où la dose à la naissance était supérieure à 60, 70, 80 et 90% respectivement, nous avons également modélisé la dose à la naissance au carré, augmentant ainsi l'effet des doses à la naissance élevées par rapport aux doses plus petites. La sélection du modèle dépendait de celui qui à la fois réduisait la covariance entre les paramètres et retournait le score DIC le plus bas. </p> <p>La validation du modèle a été effectuée en utilisant 90% des données sélectionnées au hasard contre les 10% restants, et en comparant les estimations de prévalence du modèle aux données observées (figure 3). La figure 4 montre la prévalence moyenne dans chaque pays à partir de toutes les études tracées contre l'estimation du modèle. La figure 5 montre les distributions marginales et conjointes postérieures des paramètres ajustés. Le tableau 1 donne les valeurs estimées des paramètres avec les intervalles de confiance associés. </p> <p>Lors de l'exercice de validation (au cours duquel les pays ont été consultés au sujet de leurs estimations), il a été souligné que la Chine avait entrepris trois enquêtes sérologiques en population de très grande envergure afin d'établir la prévalence de base et les progrès vers l'élimination du VHB. Il y avait un grand nombre d'autres enquêtes en Chine, qui sont moins représentatives que ces trois enquêtes nationales. Nous avons effectué une analyse de sensibilité en limitant les données de la Chine aux trois enquêtes représentatives au niveau national. Cette modification des données d'entrée a eu pour effet de rendre plus net l'effet de la vaccination, mais les effets estimés sur l'âge (changement de la prévalence chez les enfants de moins de 5 ans ou les jeunes (enfants de 5 à 15 ans)) n'étaient plus significativement différents de zéro (voir tableau 2 et figure 6). La déviance était significativement réduite, ce qui suggère un modèle beaucoup mieux ajusté (tableau 2), bien que sur un ensemble de données quelque peu réduit. </p> |
None
Source string changed |
<h2>Computation method:</h2> <p>The response variable in the model was the prevalence of Hepatitis surface antigen (HBsAg) with the explanatory variables being age (three categories, under 5, juvenile (5-15) and adult (16+), split using the average age of participants in the study), sex (proportion female in the study), study bias (e.g. a high fraction of study participants from indigenous populations), 3 dose vaccine coverage, birth dose of the vaccine and country of study. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The WHO-UNICEF estimates are annual data for the country as a whole, and did not contain information on vaccine efficacy which was not used in the analysis as no data on this was obtained. The vaccine efficacy would be implicitly estimated in the analysis as we see vaccination having a variable effect across time and space across the studies. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. More explicitly, the model uses the ages and timing of the study to calculate the years across which the participants are born, so if the if there was an age group range of 10-15 in a study that was undertaken in 2015, the birth years would be from 2000-2005, we then average the vaccination coverage from the WHO-UNICEF estimates across those 5 years assuming that each age was evenly represented in that age group in the study. The same process was used for the 3 dose and birth dose vaccination. </p> <p> </p> <p>The general logistic model equation is described below, </p> <p> <p>Where βj are the fixed effects of the explanatory variables <em>x<sub>ii</sub></em>. With the spatial random effects described by</p> <p><img src="data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAJsAAAAuCAMAAAAIuJt4AAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAIfUExURf////r6+vLy8vHx8e/v7/X19f7+/r+/v319faenp7CwsIiIiIaGhuXl5fz8/ODg4KSkpMDAwLu7u/39/crKylhYWLKysp2dndHR0fv7+7y8vF1dXYuLi+np6dTU1FlZWaqqqoCAgPn5+WBgYJGRkcLCwmdnZ0pKSlZWVuvr62xsbExMTI6OjuHh4bW1tc7OztPT0/b29pubm15eXtXV1VtbW8vLy9LS0mpqaoeHh+rq6pKSkk5OTk1NTaysrPf395WVlV9fX1dXV5+fn6urq3p6eomJib29vWhoaLe3t35+fnNzc+7u7tra2mNjY4KCgnBwcPT09IyMjFVVVcjIyFxcXKOjo/j4+Nvb21RUVKKiomFhYePj4+zs7N3d3aCgoHh4eFNTU3t7e6WlpcnJyVpaWtzc3OTk5N/f3+bm5szMzJiYmOjo6PDw8MXFxY2NjWZmZuLi4tDQ0JeXl2VlZVFRUdfX166uroODg2JiYo+Pj3l5eXFxcWRkZJSUlN7e3r6+vufn57i4uIqKipCQkIWFhcbGxm1tbe3t7dnZ2bq6und3d8TExHZ2doGBgVBQUHx8fK+vr5mZmX9/f7a2tqmpqaGhofPz85OTk2lpaYSEhJaWlk9PT6ioqJ6enrOzs29vb8PDw3JyclJSUpycnMfHx7S0tM/Pz2tra9jY2EtLS7GxsZqams3Nza2trcHBwXR0dKamprm5udbW1gAAAPSlTP8AAAC1dFJOU////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////wChHAOwAAAACXBIWXMAACHVAAAh1QEEnLSdAAADnElEQVRYR+1XO5LtKgx0TsYKlLEZZeRaABH7IGPFt/XB9vH4zOfOq1c3cE/VGJufpG4JzvbgwYMHDx48ePBfgTfmaP5ryIMojf/POqEcra+Radtaxb/PMVs0folc08/iICfbeNzaST1F6yfIvRQ1pfWSRD9Qt6hJc9i3T8GzHoNyvY9Q6z902DBLMVdntcmtTn1sNAL29hmyO+MY77Qn3df9Ecaouj8nj/pwE7+PF7Wd6b1g9j26LLZHPD5BpVEwi4f51WoIQ3yi3HPKYkALcT7tMI1S2xRD/Fvg8CGnrnZCC19kSCttFpgl3QaGdpiGGcmj6+sFbY6q0GnqkixSpYMCpoRsklF9xQXusRQnSQUz+EuKqHIrEIn4wOSPTFhbfTO+L6BaRq7T8oQKJLknYVbpCsGj3CmV17lGjyJvYduL3zclPHXmghBnG8jJxwvDKzybhvQC9IzGwdDsFX9rUFKWWLbR55B8sS2VPY5mppz95gwPs5rH9t+giZhq3qblOHyJHqeA1MELpikshbTZYE0QHLt1FUQrK5yOua8lFrHm781GUSe4OfBl7hZLh/8NVOhTLVo9+g2WmwWcTsoJd43yCxp8VBgRTrAqPyw/2WZanh5H0mjw0IDPWupJpc1YqF182SNuZHKzhPJBC5Fvd7ZFidSI4QowXV/rI2yxiUBWq6R6hwfdxwglOpbNqipIgZyiQ5/QoVLqTPtMR5QJuOPvBzjKtkdopeE++dDbxEnEqWqZ5vn+qHV2G0LpW0WeQjKY2ZJKhmke8ly2ZQtNnpiFvPQeWuEd2rB6onuHD5xWnvIojRMhg2D30sFHRMUVHKb+HkRo8WBJmgooL9aJSJkNWReTrtvPrjTNkAG0uhrqoKY4zKdlEaZ4Q+lAamM4QWWyHLqCIR5bL61asZ8LA/Mp14GQiwkFHNkuWrxoWOo0URZTiH2vN83YQs4QelA/19clNxhMYCJTxoKWCncAKa69tg4eyMD9bETNFlE3tRNxsw6cApNCsThUwL6bdHDm9z+2vXkvCafz9IwRsfgOXs9Hg5N2Jwy1OjI89HVFiEZdi8YrGJy8CdwN4v52gM011rp4hWa1l0DV4Z1wQk4My29NwMVFmf0u8jiXWqzbqbXbnyyM2xqk10yzVnQ+QKpkrEbjAxsO0ayI9ndw+b2AJPAb8QdojdJ80eEv17gDvjdDu2+wH3h/h09ma5d3vxv0u60fPHjw4MGvsW1/AGGYQZ8WYoN2AAAAAElFTkSuQmCC"></p> <p>where,</p> <p><img src="data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAPQAAABNCAMAAACmNLlxAAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAIlUExURf////7+/v39/bW1tZ6enujo6I+Pj0pKSktLS01NTdXV1e/v72xsbE5OTqWlpfT09Pf39/X19dHR0WBgYL+/v1paWl9fX6Ojo3Nzc+Hh4fHx8VxcXIqKin9/f+zs7IuLi+fn52tra1FRUaurq/n5+cDAwFdXV9fX18PDw2JiYmVlZc3Nzevr68XFxfj4+KqqqmZmZubm5oCAgIiIiPDw8HR0dFRUVK6urtPT08nJyVBQUOnp6e3t7UxMTJCQkO7u7sfHx7q6unp6eqKiol5eXuXl5ampqVJSUpeXl/r6+l1dXc/Pz6+vr9nZ2bS0tNLS0vz8/LGxsVZWVn5+foKCgtbW1ry8vPb29uPj43FxcaioqLm5ucrKyvv7+8bGxq2trbCwsLu7u8zMzM7OzuLi4o2NjU9PT2dnZ8jIyGNjY2RkZFlZWdTU1MTExPLy8m1tbZSUlODg4IWFhXV1dWhoaJWVlVhYWFVVVcHBwaGhoVtbW2FhYXd3d8LCwri4uIyMjKysrJGRkYSEhHx8fJaWloODg/Pz825ubnBwcIeHh6SkpH19fXZ2dp2dnXl5eVNTU5ycnN3d3W9vb4aGhtvb23h4eOrq6rOzs5mZmaamptDQ0Gpqat7e3t/f35iYmI6OjomJidjY2Kenp76+vre3t2lpaXt7e3JycuTk5JOTk7Kyspqampubm7a2tpKSktra2svLy6CgoIGBgb29vZ+fn9zc3AAAAEw+Zl4AAAC3dFJOU///////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////ABGphX4AAAAJcEhZcwAAIdUAACHVAQSctJ0AAAZkSURBVHhe7VpLluMqDM3My4FzWIDWIjbBhE0wY7nvSgI7iXFVknKq/Vy53ZX4Q2xd9EEgLh988MEHH3zwgYLrNqi1OR3CpEirf0BpbU4H8mDs5MBO+2fE9agnZ0SEUtOAXj2xpi8EdpNf86N0YtLm1nkdtMKJzRs67W59C05n1rQGLc/tZAbF0w5ZAnLi1qemOEIeu/W5UcA6ub/GWtx6NFqfG3/SrUlG6/CbrJn/fR+TBLNfnFhRyt/lAWJ9htCu7I6ykYS/Ce57JoU73ieWA+tfG7coHyRuytTjt1gX/33YjKxpIkV+Y0JMHrpeJ+HfgZj1R8SSuEZ2s4gQ19TJK7Gdvkga0NLsBiXkNAnr4gdTn3iDn2gKj4dbP/0ETioVJ1EentEHgUXsdG/LlKUtoQHeV6WvV2/lihGl4iCm9cy3WIDrWE0cngHEn3I7fhwI/PJWN3k9mQk6B7FFoegOuzKDk9Bhh9YuBJfHbjX/enWTIqxj+fuZ+Ytbj17/JUAawuEz4adFddgRWnfcZwCh90xOGeNkHJJGcgw2VFucp6cFexAYt+6V8gCqmGEJSforGh2TELYuYhv1K7FjaiQxl5cjHvIqXqf0/dfhTbkT8eTvvO8R6JgbnK61BBW/ZH0MyOETAdLsr4Zmh06tG4C3C6Pa4qe74cX6a+s4aXp9k27Rrr4EKNre/hyEdPRFVMKmaGexx6mSEIlUKsqzfvuqTNSEv5+jgV5tsAjvpmSn17gLZK8I3QE7fMmEhFUOIiSlm0w2NPu8C46cejbmmjLXoQpQl2avIVyGwqs2VENd/tfWha8AIWMYRL8FSDN+yVOtKj2xM8f2EtqcN00U10ZrmsNYi+5uxEtIw3Iy47OQWHn70b7g1XD6IOCZGXYMWzVXphauKaVCLlf4LdwOwdgeX3zvW8Qx9AM62wkv9NHN+8OUcIUnF/F0DG7t8q6ITSPPg5KShKO1+MS2ugpOCZYLTozegNjG1c1rrzAR+YK+pcEl32YhMXtlK5/3/r4TXnVoQdCYT74/wGlMBvnsQ1ThcX9WsHm6IHqzazSTH8yu3kBQf/+M7ZH74lWHBvqY0YcOSzL1yMTWG7GNU3GZVNpt9Ic1+MrSuJnJrog7FuzIj0yRm67Cls7cVxIE36qLOyKmQZHjVcTkutKv0Kx6zsZWQINtXjkXGxL2w08ceg2QttnmNQi6EmB8Gr9JpirbI67DsLifhArMkDZf9zyQNK+7EGFOv/Icxu4BIbZ5/TDXHODlEXoDIwlLC1O02bv78/oK0e/o0BtARN/Rln4OOPQgtpDNl/YBHPr9/foMkDSOlGDTwp2ACcLOofeHwGg1EmhX0kcDZgtDw8Mg1o7Oh7FDi6L77OF8kF0I1Q3w0hL4/wRSmN7CWUlL1W4T75jLHQEy1fV+/lsgZ4dKJvZEwZSW5r8FODst5/PiqW1w9GVhSB8lTcrR7aAtwD+GaDPADiohLH1WtEZRfL3EMFonOBDiMzvEylJeViB5mbusZB3FtAmFQ+/8v5ItYrKT5nKvqIqW26a561M5JlnlaYfZlgasCVkPHBPkdHlVwLkya/EfIK61wF7NDIpjV8GOg1HBOS7gVsE8uDWKtubBwfJTN6zFHATc60vkry0S9KaauWoOQrmSLluTrT0THDlqUaakkNnrAmawJL2vX8f1zuHjoK+8Q1MIPgI9K6T7GnRhloSPxCeQ1saiRZDDEUsjKcxIn8ktdIN99/NDovaVOJDUtKvvWmNZl3RyV7ojBrlukR78CReFlNRgrOJWWufNtYZeeT0gaK6DglpR2KktRAepi+WUQ9WaohFhmWw45S8Lt3gEjjrZ2gPhW6pL+wBe2kh3VXUoFRmWl0U7spV4rTPaWq3YMPwaR6X58FxzPLCmVWsKmsVVqPnSxMizhR9FtMM1gn6l8uJ0/4D6OKMRfNxWWGgKlpa/p464D+qSXESfdcHAqFsISwEjmkvByfclTrBz3e0TqsYx3TfDaCSlVg3sZcJD5AnF9948HOaqsEB2AKW29klVbrRdATW1cS2YOmHfxilIY/i0WLZtM8A9a/pUdvu7WMr+D4OkCG46vsFtTKB6WOuGJq8lfQhKdzQKtz1DhvjK5qvfAGYLLxQWkKpwbHn2LdyyMZ2Pm4+V2PKvp0BlY7slzbXUaH79N/CHqH7wwQe74HL5D0umWDbJ9MB4AAAAAElFTkSuQmCC"></p> <p>Where <em>n<sub>i</sub></em> is the number of neighbours for country <em>i</em> and weights <em>w<sub>i</sub></em>, are 1. <p> </p> <p>Where βj are the fixed effects of the explanatory variables xii. With the spatial random effects described by </p> <p>ui~ N(u−i,σ2u/ni)</p> <p> , </p> <p>where, </p> <p>u−i= ∑j ∈ neigh(i)wiuj/ni</p> <p>Where ni is the number of neighbours for country i and weights wi, are 1. </p> <p> </p> <p>The model was simulated in the Bayesian statistical package WinBUGS, and data manipulation and model initialisation run from R (3.3.1) using R2WinBUGS. The model considers the parameters of age, sex, study bias (e.g. a high fraction of study participants from indigenous populations), vaccine coverage, birth dose of the vaccine and country of study. </p> <p>The model uses the CAR-normal function, in WinBUGS, to model the spatial and economic autocorrelation related to neighbouring countries. For each country that had prevalence data, a weighted central position was calculated using the size and location of each study. For those countries with no data, we used the population centroid. In a novel approach, we considered 3 dimensions in the country adjacency matrix; we used the usual geographic dimensions, latitude and longitude and also combined these with the natural log of the country’s GDP per capita. This was to measure not only geographic but also the developmental proximity of countries. The adjacency matrix for the geo-economic distance gives a score between each country to every other country. Those countries which are close geographically and economically would have a low score and those further apart either geographically or economically would have a high score/distance. Therefore, those countries that are more alike will have a low score and those countries which are alike would have a high score. </p> <p>The way we proportioned the geographic and economic distance to produce the adjacency matrix was then explored, this is because geographic distance may be more or less important than economic similarities. Thus, by creating a number of different adjacency matrices (not definitive) we could select the most suitable matrix that explains reality best. We normalised the geographic and GDP distance and then calculated the distance between these two normalised figures. This creates a smoothed Gaussian surface that is dependent on both spatial proximity and GDP per-capita proximity. We compared ratios of, 1:0, 1:1, 2:1, 1:2 (Geographic:GDP). </p> <p>For each different adjacency matrix, we also had to select a neighbourhood distance, i.e. over what distance can a country be effected by another. Thus, we also varied the radius of distance from which to select neighbours for the neighbourhood network, we used the maximum minimum distance, twice the maximum minimum and three times the maximum minimum, thus varying the number of neighbours each country would have. </p> <p> </p> <p>Finally, to decide the magnitude of the effect one country has on another in the neighbourhood network we varied the weights of pairs of countries in the adjacency matrix, using either a neutral weighting of 1, so that each neighbour has an equal effect on each other (not dependent on the distance in the network), or decaying weights over distance with 1/distance, and 1/distance2, where the closer the country is the greater the effect it has on another country. The outcome of these 36 different combinations led to minimum DIC (Deviance Information Criterion) being found for a ratio of 1:2 (Geographic:GDP), the neighbourhood networks minimum distance being twice the maximum minimum distance and an even weighting of 1/distance for each adjacent country. </p> <p>This model structure produces estimates for all fixed effects and also individual country level risk, this provides information on which are significantly at greater or lower risk to the average risk. </p> <p>All parameters were given un-informative priors. Simulations were run with 3 MCMC chains with 50,000 burn in iterations and each parameter estimated from 1000 samples taken from a thinned 250,000 iterations to produce the posterior distribution. Convergence was attained, with r̂ values all very close to 1.000. Due to the Bayesian framework and WinBUGS software it was possible to gain estimates for countries where we had no data on prevalence, using their GDP and geographic proximity to inform this estimate. Those countries with the largest number of studies provided the estimates with the tightest confidence intervals and those with few or no data were less well defined, often producing a log normal distributed posterior distribution, giving estimates with long tails. </p> <p>Posterior distributions of parameters were inspected for convergence and to check for covariance between parameters. Where necessary parameters were centred and scaled to N (0, 1) to aid parameter convergence and remover covariance. This was done for the sex parameter, which was entered as the proportion of the sample that was female; this was seen to co-vary with the intercept and bias parameters before re-centring and scaling. However, the covariance of routine vaccination and birth dose persisted even after re-centring. This is in part unsurprising as there a few instances where birth dose is administered without the routine vaccination. Here we tried to reduce this interaction of the terms by transforming the birth dose data. We modelled birth dose using only data where the birth dose was greater than 60, 70, 80 & 90% respectively, we also modelled birth dose to the square, thus increasing the effect of high birth doses over smaller doses. Model selection dependent on which one both reduced the covariance between the parameters and returned the lowest DIC score. </p> <p>Model validation was conducted using 90% of randomly selected data against the remaining 10%, and by comparing model estimates of prevalence against observed data (Figure 3). Figure 4 shows the average prevalence in each country from all the studies plotted against the models estimate. Figure 5 shows the marginal and joint posterior distributions for the fitted parameters. Table 1 gives the estimated parameter values with associated credible intervals. </p> <p>During the validation exercise (in which countries were consulted over their estimates) it was pointed out that China had undertaken three very large-scale population-based serological surveys in order to establish baseline prevalence and progress towards HBV elimination. There were a large number of other surveys from China, that are less representative than these three nationwide surveys. We conducted a sensitivity analysis by restricting the data from China to the three nationally representative surveys. The effect of this change in input data was that the effect of vaccination was more distinct, but the estimated age effects (change in prevalence in children under 5, or juveniles (children 5-15 years)) were no longer significantly different from zero (see Table 2 and Figure 6). The deviance was significantly reduced, suggesting a much better fitting model (Table 2), albeit on a somewhat reduced dataset. </p> |
brockfanning
Bulk status changed |
<p>The data was modelled using a Bayesian logistic regression looking at the proportion of individuals that tested positive for HBsAg in each study, weighting each study by its size and using a conditional autoregressive (CAR) model accounting for spatial and economic correlations between similar countries. This model uses data from well sampled countries to estimate prevalence in more data poor countries with effects such as sex, age and vaccination status, these are also informed by the geographic and countries GDP proximity to other countries (CAR model). Under the assumption that countries that are close together economically and/or geographically will have more similar prevalence due to similar social structure and health care capabilities. </p>
<p>The response variable in the model was the prevalence of Hepatitis surface antigen (HBsAg) with the explanatory variables being age (three categories, under 5, juvenile (5-15) and adult (16+), split using the average age of participants in the study), sex (proportion female in the study), study bias (e.g. a high fraction of study participants from indigenous populations), 3 dose vaccine coverage, birth dose of the vaccine and country of study. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The WHO-UNICEF estimates are annual data for the country as a whole, and did not contain information on vaccine efficacy which was not used in the analysis as no data on this was obtained. The vaccine efficacy would be implicitly estimated in the analysis as we see vaccination having a variable effect across time and space across the studies. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. More explicitly, the model uses the ages and timing of the study to calculate the years across which the participants are born, so if the if there was an age group range of 10-15 in a study that was undertaken in 2015, the birth years would be from 2000-2005, we then average the vaccination coverage from the WHO-UNICEF estimates across those 5 years assuming that each age was evenly represented in that age group in the study. The same process was used for the 3 dose and birth dose vaccination. </p> <p> </p> <p>The general logistic model equation is described below, </p> <p>Yi ~Binomial (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p> <p> </p> <p>Where βj are the fixed effects of the explanatory variables xii. With the spatial random effects described by </p> <p>ui~ N(u−i,σ2u/ni)</p> <p> , </p> <p>where, </p> <p>u−i= ∑j ∈ neigh(i)wiuj/ni</p> <p>Where ni is the number of neighbours for country i and weights wi, are 1. </p> <p> </p> <p>The model was simulated in the Bayesian statistical package WinBUGS, and data manipulation and model initialisation run from R (3.3.1) using R2WinBUGS. The model considers the parameters of age, sex, study bias (e.g. a high fraction of study participants from indigenous populations), vaccine coverage, birth dose of the vaccine and country of study. </p> <p>The model uses the CAR-normal function, in WinBUGS, to model the spatial and economic autocorrelation related to neighbouring countries. For each country that had prevalence data, a weighted central position was calculated using the size and location of each study. For those countries with no data, we used the population centroid. In a novel approach, we considered 3 dimensions in the country adjacency matrix; we used the usual geographic dimensions, latitude and longitude and also combined these with the natural log of the country’s GDP per capita. This was to measure not only geographic but also the developmental proximity of countries. The adjacency matrix for the geo-economic distance gives a score between each country to every other country. Those countries which are close geographically and economically would have a low score and those further apart either geographically or economically would have a high score/distance. Therefore, those countries that are more alike will have a low score and those countries which are alike would have a high score. </p> <p>The way we proportioned the geographic and economic distance to produce the adjacency matrix was then explored, this is because geographic distance may be more or less important than economic similarities. Thus, by creating a number of different adjacency matrices (not definitive) we could select the most suitable matrix that explains reality best. We normalised the geographic and GDP distance and then calculated the distance between these two normalised figures. This creates a smoothed Gaussian surface that is dependent on both spatial proximity and GDP per-capita proximity. We compared ratios of, 1:0, 1:1, 2:1, 1:2 (Geographic:GDP). </p> <p>For each different adjacency matrix, we also had to select a neighbourhood distance, i.e. over what distance can a country be effected by another. Thus, we also varied the radius of distance from which to select neighbours for the neighbourhood network, we used the maximum minimum distance, twice the maximum minimum and three times the maximum minimum, thus varying the number of neighbours each country would have. </p> <p> </p> <p>Finally, to decide the magnitude of the effect one country has on another in the neighbourhood network we varied the weights of pairs of countries in the adjacency matrix, using either a neutral weighting of 1, so that each neighbour has an equal effect on each other (not dependent on the distance in the network), or decaying weights over distance with 1/distance, and 1/distance2, where the closer the country is the greater the effect it has on another country. The outcome of these 36 different combinations led to minimum DIC (Deviance Information Criterion) being found for a ratio of 1:2 (Geographic:GDP), the neighbourhood networks minimum distance being twice the maximum minimum distance and an even weighting of 1/distance for each adjacent country. </p> <p>This model structure produces estimates for all fixed effects and also individual country level risk, this provides information on which are significantly at greater or lower risk to the average risk. </p> <p>All parameters were given un-informative priors. Simulations were run with 3 MCMC chains with 50,000 burn in iterations and each parameter estimated from 1000 samples taken from a thinned 250,000 iterations to produce the posterior distribution. Convergence was attained, with r̂ values all very close to 1.000. Due to the Bayesian framework and WinBUGS software it was possible to gain estimates for countries where we had no data on prevalence, using their GDP and geographic proximity to inform this estimate. Those countries with the largest number of studies provided the estimates with the tightest confidence intervals and those with few or no data were less well defined, often producing a log normal distributed posterior distribution, giving estimates with long tails. </p> <p>Posterior distributions of parameters were inspected for convergence and to check for covariance between parameters. Where necessary parameters were centred and scaled to N (0, 1) to aid parameter convergence and remover covariance. This was done for the sex parameter, which was entered as the proportion of the sample that was female; this was seen to co-vary with the intercept and bias parameters before re-centring and scaling. However, the covariance of routine vaccination and birth dose persisted even after re-centring. This is in part unsurprising as there a few instances where birth dose is administered without the routine vaccination. Here we tried to reduce this interaction of the terms by transforming the birth dose data. We modelled birth dose using only data where the birth dose was greater than 60, 70, 80 & 90% respectively, we also modelled birth dose to the square, thus increasing the effect of high birth doses over smaller doses. Model selection dependent on which one both reduced the covariance between the parameters and returned the lowest DIC score. </p> <p>Model validation was conducted using 90% of randomly selected data against the remaining 10%, and by comparing model estimates of prevalence against observed data (Figure 3). Figure 4 shows the average prevalence in each country from all the studies plotted against the models estimate. Figure 5 shows the marginal and joint posterior distributions for the fitted parameters. Table 1 gives the estimated parameter values with associated credible intervals. </p> <p>During the validation exercise (in which countries were consulted over their estimates) it was pointed out that China had undertaken three very large-scale population-based serological surveys in order to establish baseline prevalence and progress towards HBV elimination. There were a large number of other surveys from China, that are less representative than these three nationwide surveys. We conducted a sensitivity analysis by restricting the data from China to the three nationally representative surveys. The effect of this change in input data was that the effect of vaccination was more distinct, but the estimated age effects (change in prevalence in children under 5, or juveniles (children 5-15 years)) were no longer significantly different from zero (see Table 2 and Figure 6). The deviance was significantly reduced, suggesting a much better fitting model (Table 2), albeit on a somewhat reduced dataset. </p>
<h1>Méthodologie</h1>
<h2>Méthode de calcul :</h2> <p>Les données ont été modélisées à l'aide d'une régression logistique bayésienne examinant la proportion d'individus testés positifs pour l'HBsAg dans chaque étude, en pondérant chaque étude par sa taille et en utilisant un modèle autorégressif conditionnel (CAR) tenant compte des corrélations spatiales et économiques entre des pays similaires. Ce modèle utilise des données provenant de pays bien échantillonnés pour estimer la prévalence dans des pays pauvres en données, avec des effets tels que le sexe, l'âge et le statut vaccinal, qui sont également informés par la proximité géographique et le PIB des pays par rapport aux autres pays (modèle CAR). En partant de l'hypothèse que les pays qui sont proches économiquement et/ou géographiquement, auront une prévalence plus similaire en raison de leur structure sociale et de leurs capacités en matière de soins de santé. </p> <p>La variable de réponse dans le modèle était la prévalence de l'antigène de surface de l'hépatite (HBsAg), les variables explicatives étant l'âge (trois catégories, moins de 5 ans, jeunes (5 à 15 ans) et adultes (16 et +), réparties en fonction de l'âge moyen des participants à l'étude), le sexe (proportion de femmes dans l'étude), le biais de l'étude (par exemple, une forte proportion de participants à l'étude issus de populations indigènes), la couverture vaccinale de 3 doses, la dose de naissance du vaccin et le pays de l'étude. La couverture de la vaccination de routine en 3 doses et de la vaccination à la naissance dans chaque étude, a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale de l'Organisation mondiale de la Santé (OMS) et de le Fonds des Nations Unies pour l'enfance (UNICEF) pour ce pays. Les estimations OMS-UNICEF sont des données annuelles pour l'ensemble du pays et ne contiennent pas de l'informations sur l'efficacité du vaccin qui n'ont pas été utilisées dans l'analyse, car aucune donnée n'a été obtenue à ce sujet. L'efficacité du vaccin serait implicitement estimée dans l'analyse, car nous constatons que la vaccination a un effet variable dans le temps et dans l'espace selon les études. La couverture de la vaccination de routine à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale de l'OMS et de l'UNICEF pour ce pays. La couverture de la vaccination systématique par trois doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale OMS-UNICEF pour ce pays. Plus explicitement, le modèle utilise l'âge et le moment de l'étude pour calculer les années de naissance des participants. Ainsi, s'il y avait une tranche d'âge de 10 à 15 ans dans une étude entreprise en 2015, les années de naissance seraient de 2000 à 2005, nous faisons alors la moyenne de la couverture vaccinale des estimations OMS-UNICEF sur ces 5 années en supposant que chaque âge est représenté de manière égale dans cette tranche d'âge dans l'étude. Le même processus a été utilisé pour la vaccination à 3 doses et la vaccination à la naissance. </p> <p>L'équation générale du modèle logistique est décrite ci-dessous, </p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAeEAAABRCAMAAADSKe79AAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAK1UExURf////T09NTU1Nzc3Pz8/O/v79DQ0Pr6+qampnh4eHR0dMLCwpGRkXp6em1tbc/Pz+Li4snJydfX11NTU4KCgt3d3erq6m9vb6Wlpby8vFZWVr6+vvHx8X19fZ+fn3Fxcf7+/uzs7K+vr+7u7l1dXZSUlP39/WdnZ9PT01VVVaenp4yMjJaWlre3t1RUVIiIiLCwsKKiouTk5J2dnWNjY+Pj4+vr6/j4+PX19YaGhoSEhPf399/f3/Dw8Pv7+4uLi2JiYl9fX6CgoNbW1pKSkpWVla2traysrHd3d66urvb29o+Pj0pKSktLS+jo6NXV1fn5+bGxsYODg2xsbGRkZOfn59jY2GlpaYmJicjIyGZmZmFhYY2NjZmZmXZ2duDg4Lm5uc3NzbKysk9PT25ubp6entHR0cDAwPPz81tbW1dXV6GhoWtra3BwcO3t7enp6YGBgbi4uJOTk7W1tVFRUXl5eX9/f+bm5tvb27+/v7Ozs7S0tM7Ozn5+ft7e3tra2uHh4cXFxfLy8nJycnV1daOjo5CQkJubm46OjsPDw8bGxk5OTqioqJeXl3x8fFJSUlBQUMzMzKqqql5eXlhYWMHBwWpqamBgYMrKyoWFhU1NTbq6utnZ2ampqZqamkxMTFxcXOXl5cvLy3Nzc4qKimVlZVlZWba2toCAgLu7u729vaSkpNLS0qurq5iYmIeHh8fHx1paWmhoaHt7e5ycnMTExLGtrfayso9ubvze3ptUVGhnZ/vc3MllZXFvb/3y8vivr/739//+/vvX17VXV3Vqav3r69pdXWtMTP/8/NiAgJhcXOfk5P79/fi6uvixse3q6v78/LN3d6g+PvGSkoBTU8u+vp5AQOy3t/rIyPWYmOLU1JKRkYBXV/WGhui0tJ6dncXExHRjY+GEhPWQkMGysgAAAH/C7rcA <p>Where βj sont les effets fixes des variables explicatives <em>x<sub>ii</sub></em>. Avec les effets aléatoires spatiaux décrits par </p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAJsAAAAuCAMAAAAIuJt4AAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAIfUExURf////r6+vLy8vHx8e/v7/X19f7+/r+/v319faenp7CwsIiIiIaGhuXl5fz8/ODg4KSkpMDAwLu7u/39/crKylhYWLKysp2dndHR0fv7+7y8vF1dXYuLi+np6dTU1FlZWaqqqoCAgPn5+WBgYJGRkcLCwmdnZ0pKSlZWVuvr62xsbExMTI6OjuHh4bW1tc7OztPT0/b29pubm15eXtXV1VtbW8vLy9LS0mpqaoeHh+rq6pKSkk5OTk1NTaysrPf395WVlV9fX1dXV5+fn6urq3p6eomJib29vWhoaLe3t35+fnNzc+7u7tra2mNjY4KCgnBwcPT09IyMjFVVVcjIyFxcXKOjo/j4+Nvb21RUVKKiomFhYePj4+zs7N3d3aCgoHh4eFNTU3t7e6WlpcnJyVpaWtzc3OTk5N/f3+bm5szMzJiYmOjo6PDw8MXFxY2NjWZmZuLi4tDQ0JeXl2VlZVFRUdfX166uroODg2JiYo+Pj3l5eXFxcWRkZJSUlN7e3r6+vufn57i4uIqKipCQkIWFhcbGxm1tbe3t7dnZ2bq6und3d8TExHZ2doGBgVBQUHx8fK+vr5mZmX9/f7a2tqmpqaGhofPz85OTk2lpaYSEhJaWlk9PT6ioqJ6enrOzs29vb8PDw3JyclJSUpycnMfHx7S0tM/Pz2tra9jY2EtLS7GxsZqams3Nza2trcHBwXR0dKamprm5udbW1gAAAPSlTP8AAAC1dFJOU/////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////// <p>où,</p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAPQAAABNCAMAAACmNLlxAAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAIlUExURf////7+/v39/bW1tZ6enujo6I+Pj0pKSktLS01NTdXV1e/v72xsbE5OTqWlpfT09Pf39/X19dHR0WBgYL+/v1paWl9fX6Ojo3Nzc+Hh4fHx8VxcXIqKin9/f+zs7IuLi+fn52tra1FRUaurq/n5+cDAwFdXV9fX18PDw2JiYmVlZc3Nzevr68XFxfj4+KqqqmZmZubm5oCAgIiIiPDw8HR0dFRUVK6urtPT08nJyVBQUOnp6e3t7UxMTJCQkO7u7sfHx7q6unp6eqKiol5eXuXl5ampqVJSUpeXl/r6+l1dXc/Pz6+vr9nZ2bS0tNLS0vz8/LGxsVZWVn5+foKCgtbW1ry8vPb29uPj43FxcaioqLm5ucrKyvv7+8bGxq2trbCwsLu7u8zMzM7OzuLi4o2NjU9PT2dnZ8jIyGNjY2RkZFlZWdTU1MTExPLy8m1tbZSUlODg4IWFhXV1dWhoaJWVlVhYWFVVVcHBwaGhoVtbW2FhYXd3d8LCwri4uIyMjKysrJGRkYSEhHx8fJaWloODg/Pz825ubnBwcIeHh6SkpH19fXZ2dp2dnXl5eVNTU5ycnN3d3W9vb4aGhtvb23h4eOrq6rOzs5mZmaamptDQ0Gpqat7e3t/f35iYmI6OjomJidjY2Kenp76+vre3t2lpaXt7e3JycuTk5JOTk7Kyspqampubm7a2tpKSktra2svLy6CgoIGBgb29vZ+fn9zc3AAAAEw+Zl4AAAC3dFJOU/////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////// <p>où <em>n<sub>i</sub></em> est le nombre de voisins pour le pays <em>i</em> et les poids <em>w<sub>i</sub></em>, sont 1. </p> <p>Le modèle a été simulé dans le progiciel statistique bayésien WinBUGS, et la manipulation des données et l'initialisation du modèle ont été effectuées à partir de R (3.3.1) en utilisant R2WinBUGS. Le modèle prend en compte les paramètres de l'âge, du sexe, du biais de l'étude (par exemple, une forte proportion de participants à l'étude issus de populations indigènes), de la couverture vaccinale, de la dose de naissance du vaccin et du pays d'étude. </p> <p>Le modèle utilise la fonction CAR-normale, dans WinBUGS, pour modéliser l'autocorrélation spatiale et économique liée aux pays voisins. Pour chaque pays disposant de données de prévalence, une position centrale pondérée a été calculée en utilisant la taille et la localisation de chaque étude. Pour les pays ne disposant pas de données, nous avons utilisé le centroïde de la population. Dans une nouvelle approche, nous avons pris en compte trois dimensions dans la matrice de contiguïté des pays ; nous avons utilisé les dimensions géographiques habituelles, la latitude et la longitude, et les avons également combinées avec le logarithme naturel du PIB par habitant du pays. Il s'agissait de mesurer non seulement la proximité géographique, mais aussi la proximité de développement des pays. La matrice de proximité pour la distance géo-économique donne un score entre chaque pays et chaque autre pays. Les pays qui sont proches géographiquement et économiquement ont un score faible et ceux qui sont plus éloignés géographiquement ou économiquement ont un score/distance élevé. Par conséquent, les pays qui se ressemblent le plus auront un score faible et les pays qui se ressemblent un score élevé. </p> <p>La façon dont nous avons proportionné la distance géographique et économique pour produire la matrice de contiguïté a ensuite été explorée, car la distance géographique peut être plus ou moins importante que les similitudes économiques. Ainsi, en créant un certain nombre de matrices de contiguïté différentes (non définitives), nous avons pu sélectionner la matrice la plus appropriée qui explique le mieux la réalité. Nous avons normalisé la distance géographique et la distance du PIB, puis nous avons calculé la distance entre ces deux chiffres normalisés. Cela crée une surface gaussienne lissée qui dépend à la fois de la proximité spatiale et de la proximité du PIB par habitant. Nous avons comparé les ratios de, 1:0, 1:1, 2:1, 1:2 (Géographique:PIB). </p> <p>Pour chaque matrice de proximité différente, nous avons également dû sélectionner une distance de voisinage, c'est-à-dire sur quelle distance un pays peut être affecté par un autre. Ainsi, nous avons également fait varier le rayon de la distance à partir de laquelle sélectionner les voisins pour le réseau de voisinage, nous avons utilisé la distance minimale maximale, deux fois la distance minimale maximale et trois fois la distance minimale maximale, faisant ainsi varier le nombre de voisins que chaque pays aurait. </p> <p>Enfin, pour décider de l'ampleur de l'effet d'un pays sur un autre dans le réseau de voisinage, nous avons fait varier les poids des paires de pays dans la matrice de contiguïté, en utilisant soit un poids neutre de 1, de sorte que chaque voisin a un effet égal sur l'autre (ne dépendant pas de la distance dans le réseau), soit des poids décroissants sur la distance avec 1/distance, et 1/distance2, où plus le pays est proche, plus l'effet qu'il a sur un autre pays est important. Le résultat de ces 36 combinaisons différentes a permis de trouver un DIC (Deviance Information Criterion) minimum pour un rapport de 1:2 (Géographie:PIB), la distance minimum des réseaux de voisinage étant le double de la distance minimum maximum et une pondération égale de 1/distance pour chaque pays adjacent. </p> <p>Cette structure de modèle produit des estimations pour tous les effets fixes et aussi pour le risque au niveau de chaque pays, ce qui fournit des informations sur ceux qui sont significativement plus ou moins exposés au risque moyen. </p> <p>Tous les paramètres ont été donnés des antécédents non informatifs. Des simulations ont été effectuées avec 3 chaînes MCMC avec 50 000 brûlures en itérations et chaque paramètre a été estimé à partir de 1000 échantillons prélevés sur 250 000 itérations diluées pour produire la distribution postérieure. La convergence a été atteinte, avec r̂ ; des valeurs toutes très proches de 1.000. Grâce au cadre bayésien et au logiciel WinBUGS, il a été possible d'obtenir des estimations pour les pays où nous ne disposions pas de données sur la prévalence, en utilisant leur PIB et leur proximité géographique pour étayer cette estimation. Les pays ayant réalisé le plus grand nombre d'études ont fourni les estimations avec les intervalles de confiance les plus étroits et ceux qui n'avaient que peu ou pas de données étaient moins bien définis, produisant souvent une distribution postérieure log-normale, donnant des estimations avec de longues queues. </p> <p>Les distributions postérieures des paramètres ont été inspectées pour vérifier la convergence et la covariance entre les paramètres. Le cas échéant, les paramètres ont été centrés et mis à l'échelle N (0, 1) pour faciliter la convergence des paramètres et la covariance de la suppression. Cela a été fait pour le paramètre du sexe, qui a été saisi comme la proportion de l'échantillon qui était féminine ; on a constaté qu'il variait avec les paramètres d'interception et de biais avant de recentrer et de mettre à l'échelle. Cependant, la covariance de la vaccination de routine et de la dose à la naissance a persisté même après le recadrage. Cela n'est pas surprenant car il y a eu quelques cas où la dose à la naissance a été administrée sans la vaccination de routine. Nous avons essayé ici de réduire cette interaction des termes en transformant les données relatives à la dose de naissance. Nous avons modélisé la dose de naissance en utilisant uniquement les données où la dose de naissance était supérieure à 60, 70, 80 & ; 90% respectivement, nous avons également modélisé la dose de naissance au carré, augmentant ainsi l'effet des doses de naissance élevées par rapport aux doses plus faibles. Le choix du modèle dépendait de celui qui réduisait la covariance entre les paramètres et donnait le score CIVD le plus bas. </p> <p>La validation du modèle a été réalisée en utilisant 90 % des données sélectionnées au hasard par rapport aux 10 % restants, et en comparant les estimations de la prévalence du modèle aux données observées (figure 3). La figure 4 montre la prévalence moyenne dans chaque pays à partir de toutes les études tracées par rapport à l'estimation du modèle. La figure 5 montre les distributions marginales et articulaires postérieures pour les paramètres ajustés. Le tableau 1 donne les valeurs estimées des paramètres avec les intervalles crédibles associés. <p>Au cours de l'exercice de validation (dans lequel les pays ont été consultés sur leurs estimations), il a été souligné que la Chine avait entrepris trois enquêtes sérologiques à très grande échelle dans la population afin d'établir la prévalence de base et les progrès vers l'élimination du VHB. Il y avait un grand nombre d'autres enquêtes en Chine, qui sont moins représentatives que ces trois enquêtes nationales. Nous avons effectué une analyse de sensibilité en limitant les données de la Chine aux trois enquêtes représentatives au niveau national. Cette modification des données d'entrée a eu pour effet de rendre l'effet de la vaccination plus distinct, mais les effets estimés sur l'âge (changement de la prévalence chez les enfants de moins de 5 ans, ou les jeunes (enfants de 5 à 15 ans)) n'étaient plus significativement différents de zéro (voir tableau 2 et figure 6). L'écart a été réduit de manière significative, ce qui suggère un modèle beaucoup plus adapté (tableau 2), bien que sur un ensemble de données quelque peu réduit.</p> |
brockfanning
Bulk status changed |
<p>The data was modelled using a Bayesian logistic regression looking at the proportion of individuals that tested positive for HBsAg in each study, weighting each study by its size and using a conditional autoregressive (CAR) model accounting for spatial and economic correlations between similar countries. This model uses data from well sampled countries to estimate prevalence in more data poor countries with effects such as sex, age and vaccination status, these are also informed by the geographic and countries GDP proximity to other countries (CAR model). Under the assumption that countries that are close together economically and/or geographically will have more similar prevalence due to similar social structure and health care capabilities. </p>
<p>The response variable in the model was the prevalence of Hepatitis surface antigen (HBsAg) with the explanatory variables being age (three categories, under 5, juvenile (5-15) and adult (16+), split using the average age of participants in the study), sex (proportion female in the study), study bias (e.g. a high fraction of study participants from indigenous populations), 3 dose vaccine coverage, birth dose of the vaccine and country of study. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The WHO-UNICEF estimates are annual data for the country as a whole, and did not contain information on vaccine efficacy which was not used in the analysis as no data on this was obtained. The vaccine efficacy would be implicitly estimated in the analysis as we see vaccination having a variable effect across time and space across the studies. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. More explicitly, the model uses the ages and timing of the study to calculate the years across which the participants are born, so if the if there was an age group range of 10-15 in a study that was undertaken in 2015, the birth years would be from 2000-2005, we then average the vaccination coverage from the WHO-UNICEF estimates across those 5 years assuming that each age was evenly represented in that age group in the study. The same process was used for the 3 dose and birth dose vaccination. </p> <p> </p> <p>The general logistic model equation is described below, </p> <p>Yi ~Binomial (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p> <p> </p> <p>Where βj are the fixed effects of the explanatory variables xii. With the spatial random effects described by </p> <p>ui~ N(u−i,σ2u/ni)</p> <p> , </p> <p>where, </p> <p>u−i= ∑j ∈ neigh(i)wiuj/ni</p> <p>Where ni is the number of neighbours for country i and weights wi, are 1. </p> <p> </p> <p>The model was simulated in the Bayesian statistical package WinBUGS, and data manipulation and model initialisation run from R (3.3.1) using R2WinBUGS. The model considers the parameters of age, sex, study bias (e.g. a high fraction of study participants from indigenous populations), vaccine coverage, birth dose of the vaccine and country of study. </p> <p>The model uses the CAR-normal function, in WinBUGS, to model the spatial and economic autocorrelation related to neighbouring countries. For each country that had prevalence data, a weighted central position was calculated using the size and location of each study. For those countries with no data, we used the population centroid. In a novel approach, we considered 3 dimensions in the country adjacency matrix; we used the usual geographic dimensions, latitude and longitude and also combined these with the natural log of the country’s GDP per capita. This was to measure not only geographic but also the developmental proximity of countries. The adjacency matrix for the geo-economic distance gives a score between each country to every other country. Those countries which are close geographically and economically would have a low score and those further apart either geographically or economically would have a high score/distance. Therefore, those countries that are more alike will have a low score and those countries which are alike would have a high score. </p> <p>The way we proportioned the geographic and economic distance to produce the adjacency matrix was then explored, this is because geographic distance may be more or less important than economic similarities. Thus, by creating a number of different adjacency matrices (not definitive) we could select the most suitable matrix that explains reality best. We normalised the geographic and GDP distance and then calculated the distance between these two normalised figures. This creates a smoothed Gaussian surface that is dependent on both spatial proximity and GDP per-capita proximity. We compared ratios of, 1:0, 1:1, 2:1, 1:2 (Geographic:GDP). </p> <p>For each different adjacency matrix, we also had to select a neighbourhood distance, i.e. over what distance can a country be effected by another. Thus, we also varied the radius of distance from which to select neighbours for the neighbourhood network, we used the maximum minimum distance, twice the maximum minimum and three times the maximum minimum, thus varying the number of neighbours each country would have. </p> <p> </p> <p>Finally, to decide the magnitude of the effect one country has on another in the neighbourhood network we varied the weights of pairs of countries in the adjacency matrix, using either a neutral weighting of 1, so that each neighbour has an equal effect on each other (not dependent on the distance in the network), or decaying weights over distance with 1/distance, and 1/distance2, where the closer the country is the greater the effect it has on another country. The outcome of these 36 different combinations led to minimum DIC (Deviance Information Criterion) being found for a ratio of 1:2 (Geographic:GDP), the neighbourhood networks minimum distance being twice the maximum minimum distance and an even weighting of 1/distance for each adjacent country. </p> <p>This model structure produces estimates for all fixed effects and also individual country level risk, this provides information on which are significantly at greater or lower risk to the average risk. </p> <p>All parameters were given un-informative priors. Simulations were run with 3 MCMC chains with 50,000 burn in iterations and each parameter estimated from 1000 samples taken from a thinned 250,000 iterations to produce the posterior distribution. Convergence was attained, with r̂ values all very close to 1.000. Due to the Bayesian framework and WinBUGS software it was possible to gain estimates for countries where we had no data on prevalence, using their GDP and geographic proximity to inform this estimate. Those countries with the largest number of studies provided the estimates with the tightest confidence intervals and those with few or no data were less well defined, often producing a log normal distributed posterior distribution, giving estimates with long tails. </p> <p>Posterior distributions of parameters were inspected for convergence and to check for covariance between parameters. Where necessary parameters were centred and scaled to N (0, 1) to aid parameter convergence and remover covariance. This was done for the sex parameter, which was entered as the proportion of the sample that was female; this was seen to co-vary with the intercept and bias parameters before re-centring and scaling. However, the covariance of routine vaccination and birth dose persisted even after re-centring. This is in part unsurprising as there a few instances where birth dose is administered without the routine vaccination. Here we tried to reduce this interaction of the terms by transforming the birth dose data. We modelled birth dose using only data where the birth dose was greater than 60, 70, 80 & 90% respectively, we also modelled birth dose to the square, thus increasing the effect of high birth doses over smaller doses. Model selection dependent on which one both reduced the covariance between the parameters and returned the lowest DIC score. </p> <p>Model validation was conducted using 90% of randomly selected data against the remaining 10%, and by comparing model estimates of prevalence against observed data (Figure 3). Figure 4 shows the average prevalence in each country from all the studies plotted against the models estimate. Figure 5 shows the marginal and joint posterior distributions for the fitted parameters. Table 1 gives the estimated parameter values with associated credible intervals. </p> <p>During the validation exercise (in which countries were consulted over their estimates) it was pointed out that China had undertaken three very large-scale population-based serological surveys in order to establish baseline prevalence and progress towards HBV elimination. There were a large number of other surveys from China, that are less representative than these three nationwide surveys. We conducted a sensitivity analysis by restricting the data from China to the three nationally representative surveys. The effect of this change in input data was that the effect of vaccination was more distinct, but the estimated age effects (change in prevalence in children under 5, or juveniles (children 5-15 years)) were no longer significantly different from zero (see Table 2 and Figure 6). The deviance was significantly reduced, suggesting a much better fitting model (Table 2), albeit on a somewhat reduced dataset. </p>
<h1>Méthodologie</h1>
<h2>Méthode de calcul :</h2> <p>Les données ont été modélisées à l'aide d'une régression logistique bayésienne examinant la proportion d'individus testés positifs pour l'HBsAg dans chaque étude, en pondérant chaque étude par sa taille et en utilisant un modèle autorégressif conditionnel (CAR) tenant compte des corrélations spatiales et économiques entre des pays similaires. Ce modèle utilise des données provenant de pays bien échantillonnés pour estimer la prévalence dans des pays pauvres en données, avec des effets tels que le sexe, l'âge et le statut vaccinal, qui sont également informés par la proximité géographique et le PIB des pays par rapport aux autres pays (modèle CAR). En partant de l'hypothèse que les pays qui sont proches économiquement et/ou géographiquement, auront une prévalence plus similaire en raison de leur structure sociale et de leurs capacités en matière de soins de santé. </p> <p>La variable de réponse dans le modèle était la prévalence de l'antigène de surface de l'hépatite (HBsAg), les variables explicatives étant l'âge (trois catégories, moins de 5 ans, jeunes (5 à 15 ans) et adultes (16 et +), réparties en fonction de l'âge moyen des participants à l'étude), le sexe (proportion de femmes dans l'étude), le biais de l'étude (par exemple, une forte proportion de participants à l'étude issus de populations indigènes), la couverture vaccinale de 3 doses, la dose de naissance du vaccin et le pays de l'étude. La couverture de la vaccination de routine en 3 doses et de la vaccination à la naissance dans chaque étude, a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale de l'Organisation mondiale de la Santé (OMS) et de le Fonds des Nations Unies pour l'enfance (UNICEF) pour ce pays. Les estimations OMS-UNICEF sont des données annuelles pour l'ensemble du pays et ne contiennent pas de l'informations sur l'efficacité du vaccin qui n'ont pas été utilisées dans l'analyse, car aucune donnée n'a été obtenue à ce sujet. L'efficacité du vaccin serait implicitement estimée dans l'analyse, car nous constatons que la vaccination a un effet variable dans le temps et dans l'espace selon les études. La couverture de la vaccination de routine à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale de l'OMS et de l'UNICEF pour ce pays. La couverture de la vaccination systématique par trois doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale OMS-UNICEF pour ce pays. Plus explicitement, le modèle utilise l'âge et le moment de l'étude pour calculer les années de naissance des participants. Ainsi, s'il y avait une tranche d'âge de 10 à 15 ans dans une étude entreprise en 2015, les années de naissance seraient de 2000 à 2005, nous faisons alors la moyenne de la couverture vaccinale des estimations OMS-UNICEF sur ces 5 années en supposant que chaque âge est représenté de manière égale dans cette tranche d'âge dans l'étude. Le même processus a été utilisé pour la vaccination à 3 doses et la vaccination à la naissance. </p> <p>L'équation générale du modèle logistique est décrite ci-dessous, </p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAeEAAABRCAMAAADSKe79AAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAK1UExURf////T09NTU1Nzc3Pz8/O/v79DQ0Pr6+qampnh4eHR0dMLCwpGRkXp6em1tbc/Pz+Li4snJydfX11NTU4KCgt3d3erq6m9vb6Wlpby8vFZWVr6+vvHx8X19fZ+fn3Fxcf7+/uzs7K+vr+7u7l1dXZSUlP39/WdnZ9PT01VVVaenp4yMjJaWlre3t1RUVIiIiLCwsKKiouTk5J2dnWNjY+Pj4+vr6/j4+PX19YaGhoSEhPf399/f3/Dw8Pv7+4uLi2JiYl9fX6CgoNbW1pKSkpWVla2traysrHd3d66urvb29o+Pj0pKSktLS+jo6NXV1fn5+bGxsYODg2xsbGRkZOfn59jY2GlpaYmJicjIyGZmZmFhYY2NjZmZmXZ2duDg4Lm5uc3NzbKysk9PT25ubp6entHR0cDAwPPz81tbW1dXV6GhoWtra3BwcO3t7enp6YGBgbi4uJOTk7W1tVFRUXl5eX9/f+bm5tvb27+/v7Ozs7S0tM7Ozn5+ft7e3tra2uHh4cXFxfLy8nJycnV1daOjo5CQkJubm46OjsPDw8bGxk5OTqioqJeXl3x8fFJSUlBQUMzMzKqqql5eXlhYWMHBwWpqamBgYMrKyoWFhU1NTbq6utnZ2ampqZqamkxMTFxcXOXl5cvLy3Nzc4qKimVlZVlZWba2toCAgLu7u729vaSkpNLS0qurq5iYmIeHh8fHx1paWmhoaHt7e5ycnMTExLGtrfayso9ubvze3ptUVGhnZ/vc3MllZXFvb/3y8vivr/739//+/vvX17VXV3Vqav3r69pdXWtMTP/8/NiAgJhcXOfk5P79/fi6uvixse3q6v78/LN3d6g+PvGSkoBTU8u+vp5AQOy3t/rIyPWYmOLU1JKRkYBXV/WGhui0tJ6dncXExHRjY+GEhPWQkMGysgAAAH/C7rcA <p>Where βj sont les effets fixes des variables explicatives <em>x<sub>ii</sub></em>. Avec les effets aléatoires spatiaux décrits par </p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAJsAAAAuCAMAAAAIuJt4AAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAIfUExURf////r6+vLy8vHx8e/v7/X19f7+/r+/v319faenp7CwsIiIiIaGhuXl5fz8/ODg4KSkpMDAwLu7u/39/crKylhYWLKysp2dndHR0fv7+7y8vF1dXYuLi+np6dTU1FlZWaqqqoCAgPn5+WBgYJGRkcLCwmdnZ0pKSlZWVuvr62xsbExMTI6OjuHh4bW1tc7OztPT0/b29pubm15eXtXV1VtbW8vLy9LS0mpqaoeHh+rq6pKSkk5OTk1NTaysrPf395WVlV9fX1dXV5+fn6urq3p6eomJib29vWhoaLe3t35+fnNzc+7u7tra2mNjY4KCgnBwcPT09IyMjFVVVcjIyFxcXKOjo/j4+Nvb21RUVKKiomFhYePj4+zs7N3d3aCgoHh4eFNTU3t7e6WlpcnJyVpaWtzc3OTk5N/f3+bm5szMzJiYmOjo6PDw8MXFxY2NjWZmZuLi4tDQ0JeXl2VlZVFRUdfX166uroODg2JiYo+Pj3l5eXFxcWRkZJSUlN7e3r6+vufn57i4uIqKipCQkIWFhcbGxm1tbe3t7dnZ2bq6und3d8TExHZ2doGBgVBQUHx8fK+vr5mZmX9/f7a2tqmpqaGhofPz85OTk2lpaYSEhJaWlk9PT6ioqJ6enrOzs29vb8PDw3JyclJSUpycnMfHx7S0tM/Pz2tra9jY2EtLS7GxsZqams3Nza2trcHBwXR0dKamprm5udbW1gAAAPSlTP8AAAC1dFJOU/////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////// <p>où,</p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAPQAAABNCAMAAACmNLlxAAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAIlUExURf////7+/v39/bW1tZ6enujo6I+Pj0pKSktLS01NTdXV1e/v72xsbE5OTqWlpfT09Pf39/X19dHR0WBgYL+/v1paWl9fX6Ojo3Nzc+Hh4fHx8VxcXIqKin9/f+zs7IuLi+fn52tra1FRUaurq/n5+cDAwFdXV9fX18PDw2JiYmVlZc3Nzevr68XFxfj4+KqqqmZmZubm5oCAgIiIiPDw8HR0dFRUVK6urtPT08nJyVBQUOnp6e3t7UxMTJCQkO7u7sfHx7q6unp6eqKiol5eXuXl5ampqVJSUpeXl/r6+l1dXc/Pz6+vr9nZ2bS0tNLS0vz8/LGxsVZWVn5+foKCgtbW1ry8vPb29uPj43FxcaioqLm5ucrKyvv7+8bGxq2trbCwsLu7u8zMzM7OzuLi4o2NjU9PT2dnZ8jIyGNjY2RkZFlZWdTU1MTExPLy8m1tbZSUlODg4IWFhXV1dWhoaJWVlVhYWFVVVcHBwaGhoVtbW2FhYXd3d8LCwri4uIyMjKysrJGRkYSEhHx8fJaWloODg/Pz825ubnBwcIeHh6SkpH19fXZ2dp2dnXl5eVNTU5ycnN3d3W9vb4aGhtvb23h4eOrq6rOzs5mZmaamptDQ0Gpqat7e3t/f35iYmI6OjomJidjY2Kenp76+vre3t2lpaXt7e3JycuTk5JOTk7Kyspqampubm7a2tpKSktra2svLy6CgoIGBgb29vZ+fn9zc3AAAAEw+Zl4AAAC3dFJOU/////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////// <p>où <em>n<sub>i</sub></em> est le nombre de voisins pour le pays <em>i</em> et les poids <em>w<sub>i</sub></em>, sont 1. </p> <p>Le modèle a été simulé dans le progiciel statistique bayésien WinBUGS, et la manipulation des données et l'initialisation du modèle ont été effectuées à partir de R (3.3.1) en utilisant R2WinBUGS. Le modèle prend en compte les paramètres de l'âge, du sexe, du biais de l'étude (par exemple, une forte proportion de participants à l'étude issus de populations indigènes), de la couverture vaccinale, de la dose de naissance du vaccin et du pays d'étude. </p> <p>Le modèle utilise la fonction CAR-normale, dans WinBUGS, pour modéliser l'autocorrélation spatiale et économique liée aux pays voisins. Pour chaque pays disposant de données de prévalence, une position centrale pondérée a été calculée en utilisant la taille et la localisation de chaque étude. Pour les pays ne disposant pas de données, nous avons utilisé le centroïde de la population. Dans une nouvelle approche, nous avons pris en compte trois dimensions dans la matrice de contiguïté des pays ; nous avons utilisé les dimensions géographiques habituelles, la latitude et la longitude, et les avons également combinées avec le logarithme naturel du PIB par habitant du pays. Il s'agissait de mesurer non seulement la proximité géographique, mais aussi la proximité de développement des pays. La matrice de proximité pour la distance géo-économique donne un score entre chaque pays et chaque autre pays. Les pays qui sont proches géographiquement et économiquement ont un score faible et ceux qui sont plus éloignés géographiquement ou économiquement ont un score/distance élevé. Par conséquent, les pays qui se ressemblent le plus auront un score faible et les pays qui se ressemblent un score élevé. </p> <p>La façon dont nous avons proportionné la distance géographique et économique pour produire la matrice de contiguïté a ensuite été explorée, car la distance géographique peut être plus ou moins importante que les similitudes économiques. Ainsi, en créant un certain nombre de matrices de contiguïté différentes (non définitives), nous avons pu sélectionner la matrice la plus appropriée qui explique le mieux la réalité. Nous avons normalisé la distance géographique et la distance du PIB, puis nous avons calculé la distance entre ces deux chiffres normalisés. Cela crée une surface gaussienne lissée qui dépend à la fois de la proximité spatiale et de la proximité du PIB par habitant. Nous avons comparé les ratios de, 1:0, 1:1, 2:1, 1:2 (Géographique:PIB). </p> <p>Pour chaque matrice de proximité différente, nous avons également dû sélectionner une distance de voisinage, c'est-à-dire sur quelle distance un pays peut être affecté par un autre. Ainsi, nous avons également fait varier le rayon de la distance à partir de laquelle sélectionner les voisins pour le réseau de voisinage, nous avons utilisé la distance minimale maximale, deux fois la distance minimale maximale et trois fois la distance minimale maximale, faisant ainsi varier le nombre de voisins que chaque pays aurait. </p> <p>Enfin, pour décider de l'ampleur de l'effet d'un pays sur un autre dans le réseau de voisinage, nous avons fait varier les poids des paires de pays dans la matrice de contiguïté, en utilisant soit un poids neutre de 1, de sorte que chaque voisin a un effet égal sur l'autre (ne dépendant pas de la distance dans le réseau), soit des poids décroissants sur la distance avec 1/distance, et 1/distance2, où plus le pays est proche, plus l'effet qu'il a sur un autre pays est important. Le résultat de ces 36 combinaisons différentes a permis de trouver un DIC (Deviance Information Criterion) minimum pour un rapport de 1:2 (Géographie:PIB), la distance minimum des réseaux de voisinage étant le double de la distance minimum maximum et une pondération égale de 1/distance pour chaque pays adjacent. </p> <p>Cette structure de modèle produit des estimations pour tous les effets fixes et aussi pour le risque au niveau de chaque pays, ce qui fournit des informations sur ceux qui sont significativement plus ou moins exposés au risque moyen. </p> <p>Tous les paramètres ont été donnés des antécédents non informatifs. Des simulations ont été effectuées avec 3 chaînes MCMC avec 50 000 brûlures en itérations et chaque paramètre a été estimé à partir de 1000 échantillons prélevés sur 250 000 itérations diluées pour produire la distribution postérieure. La convergence a été atteinte, avec r̂ ; des valeurs toutes très proches de 1.000. Grâce au cadre bayésien et au logiciel WinBUGS, il a été possible d'obtenir des estimations pour les pays où nous ne disposions pas de données sur la prévalence, en utilisant leur PIB et leur proximité géographique pour étayer cette estimation. Les pays ayant réalisé le plus grand nombre d'études ont fourni les estimations avec les intervalles de confiance les plus étroits et ceux qui n'avaient que peu ou pas de données étaient moins bien définis, produisant souvent une distribution postérieure log-normale, donnant des estimations avec de longues queues. </p> <p>Les distributions postérieures des paramètres ont été inspectées pour vérifier la convergence et la covariance entre les paramètres. Le cas échéant, les paramètres ont été centrés et mis à l'échelle N (0, 1) pour faciliter la convergence des paramètres et la covariance de la suppression. Cela a été fait pour le paramètre du sexe, qui a été saisi comme la proportion de l'échantillon qui était féminine ; on a constaté qu'il variait avec les paramètres d'interception et de biais avant de recentrer et de mettre à l'échelle. Cependant, la covariance de la vaccination de routine et de la dose à la naissance a persisté même après le recadrage. Cela n'est pas surprenant car il y a eu quelques cas où la dose à la naissance a été administrée sans la vaccination de routine. Nous avons essayé ici de réduire cette interaction des termes en transformant les données relatives à la dose de naissance. Nous avons modélisé la dose de naissance en utilisant uniquement les données où la dose de naissance était supérieure à 60, 70, 80 & ; 90% respectivement, nous avons également modélisé la dose de naissance au carré, augmentant ainsi l'effet des doses de naissance élevées par rapport aux doses plus faibles. Le choix du modèle dépendait de celui qui réduisait la covariance entre les paramètres et donnait le score CIVD le plus bas. </p> <p>La validation du modèle a été réalisée en utilisant 90 % des données sélectionnées au hasard par rapport aux 10 % restants, et en comparant les estimations de la prévalence du modèle aux données observées (figure 3). La figure 4 montre la prévalence moyenne dans chaque pays à partir de toutes les études tracées par rapport à l'estimation du modèle. La figure 5 montre les distributions marginales et articulaires postérieures pour les paramètres ajustés. Le tableau 1 donne les valeurs estimées des paramètres avec les intervalles crédibles associés. <p>Au cours de l'exercice de validation (dans lequel les pays ont été consultés sur leurs estimations), il a été souligné que la Chine avait entrepris trois enquêtes sérologiques à très grande échelle dans la population afin d'établir la prévalence de base et les progrès vers l'élimination du VHB. Il y avait un grand nombre d'autres enquêtes en Chine, qui sont moins représentatives que ces trois enquêtes nationales. Nous avons effectué une analyse de sensibilité en limitant les données de la Chine aux trois enquêtes représentatives au niveau national. Cette modification des données d'entrée a eu pour effet de rendre l'effet de la vaccination plus distinct, mais les effets estimés sur l'âge (changement de la prévalence chez les enfants de moins de 5 ans, ou les jeunes (enfants de 5 à 15 ans)) n'étaient plus significativement différents de zéro (voir tableau 2 et figure 6). L'écart a été réduit de manière significative, ce qui suggère un modèle beaucoup plus adapté (tableau 2), bien que sur un ensemble de données quelque peu réduit.</p> |
NelMed
Translation changed |
<p>The data was modelled using a Bayesian logistic regression looking at the proportion of individuals that tested positive for HBsAg in each study, weighting each study by its size and using a conditional autoregressive (CAR) model accounting for spatial and economic correlations between similar countries. This model uses data from well sampled countries to estimate prevalence in more data poor countries with effects such as sex, age and vaccination status, these are also informed by the geographic and countries GDP proximity to other countries (CAR model). Under the assumption that countries that are close together economically and/or geographically will have more similar prevalence due to similar social structure and health care capabilities. </p>
<p>The response variable in the model was the prevalence of Hepatitis surface antigen (HBsAg) with the explanatory variables being age (three categories, under 5, juvenile (5-15) and adult (16+), split using the average age of participants in the study), sex (proportion female in the study), study bias (e.g. a high fraction of study participants from indigenous populations), 3 dose vaccine coverage, birth dose of the vaccine and country of study. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The WHO-UNICEF estimates are annual data for the country as a whole, and did not contain information on vaccine efficacy which was not used in the analysis as no data on this was obtained. The vaccine efficacy would be implicitly estimated in the analysis as we see vaccination having a variable effect across time and space across the studies. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. More explicitly, the model uses the ages and timing of the study to calculate the years across which the participants are born, so if the if there was an age group range of 10-15 in a study that was undertaken in 2015, the birth years would be from 2000-2005, we then average the vaccination coverage from the WHO-UNICEF estimates across those 5 years assuming that each age was evenly represented in that age group in the study. The same process was used for the 3 dose and birth dose vaccination. </p> <p> </p> <p>The general logistic model equation is described below, </p> <p>Yi ~Binomial (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p> <p> </p> <p>Where βj are the fixed effects of the explanatory variables xii. With the spatial random effects described by </p> <p>ui~ N(u−i,σ2u/ni)</p> <p> , </p> <p>where, </p> <p>u−i= ∑j ∈ neigh(i)wiuj/ni</p> <p>Where ni is the number of neighbours for country i and weights wi, are 1. </p> <p> </p> <p>The model was simulated in the Bayesian statistical package WinBUGS, and data manipulation and model initialisation run from R (3.3.1) using R2WinBUGS. The model considers the parameters of age, sex, study bias (e.g. a high fraction of study participants from indigenous populations), vaccine coverage, birth dose of the vaccine and country of study. </p> <p>The model uses the CAR-normal function, in WinBUGS, to model the spatial and economic autocorrelation related to neighbouring countries. For each country that had prevalence data, a weighted central position was calculated using the size and location of each study. For those countries with no data, we used the population centroid. In a novel approach, we considered 3 dimensions in the country adjacency matrix; we used the usual geographic dimensions, latitude and longitude and also combined these with the natural log of the country’s GDP per capita. This was to measure not only geographic but also the developmental proximity of countries. The adjacency matrix for the geo-economic distance gives a score between each country to every other country. Those countries which are close geographically and economically would have a low score and those further apart either geographically or economically would have a high score/distance. Therefore, those countries that are more alike will have a low score and those countries which are alike would have a high score. </p> <p>The way we proportioned the geographic and economic distance to produce the adjacency matrix was then explored, this is because geographic distance may be more or less important than economic similarities. Thus, by creating a number of different adjacency matrices (not definitive) we could select the most suitable matrix that explains reality best. We normalised the geographic and GDP distance and then calculated the distance between these two normalised figures. This creates a smoothed Gaussian surface that is dependent on both spatial proximity and GDP per-capita proximity. We compared ratios of, 1:0, 1:1, 2:1, 1:2 (Geographic:GDP). </p> <p>For each different adjacency matrix, we also had to select a neighbourhood distance, i.e. over what distance can a country be effected by another. Thus, we also varied the radius of distance from which to select neighbours for the neighbourhood network, we used the maximum minimum distance, twice the maximum minimum and three times the maximum minimum, thus varying the number of neighbours each country would have. </p> <p> </p> <p>Finally, to decide the magnitude of the effect one country has on another in the neighbourhood network we varied the weights of pairs of countries in the adjacency matrix, using either a neutral weighting of 1, so that each neighbour has an equal effect on each other (not dependent on the distance in the network), or decaying weights over distance with 1/distance, and 1/distance2, where the closer the country is the greater the effect it has on another country. The outcome of these 36 different combinations led to minimum DIC (Deviance Information Criterion) being found for a ratio of 1:2 (Geographic:GDP), the neighbourhood networks minimum distance being twice the maximum minimum distance and an even weighting of 1/distance for each adjacent country. </p> <p>This model structure produces estimates for all fixed effects and also individual country level risk, this provides information on which are significantly at greater or lower risk to the average risk. </p> <p>All parameters were given un-informative priors. Simulations were run with 3 MCMC chains with 50,000 burn in iterations and each parameter estimated from 1000 samples taken from a thinned 250,000 iterations to produce the posterior distribution. Convergence was attained, with r̂ values all very close to 1.000. Due to the Bayesian framework and WinBUGS software it was possible to gain estimates for countries where we had no data on prevalence, using their GDP and geographic proximity to inform this estimate. Those countries with the largest number of studies provided the estimates with the tightest confidence intervals and those with few or no data were less well defined, often producing a log normal distributed posterior distribution, giving estimates with long tails. </p> <p>Posterior distributions of parameters were inspected for convergence and to check for covariance between parameters. Where necessary parameters were centred and scaled to N (0, 1) to aid parameter convergence and remover covariance. This was done for the sex parameter, which was entered as the proportion of the sample that was female; this was seen to co-vary with the intercept and bias parameters before re-centring and scaling. However, the covariance of routine vaccination and birth dose persisted even after re-centring. This is in part unsurprising as there a few instances where birth dose is administered without the routine vaccination. Here we tried to reduce this interaction of the terms by transforming the birth dose data. We modelled birth dose using only data where the birth dose was greater than 60, 70, 80 & 90% respectively, we also modelled birth dose to the square, thus increasing the effect of high birth doses over smaller doses. Model selection dependent on which one both reduced the covariance between the parameters and returned the lowest DIC score. </p> <p>Model validation was conducted using 90% of randomly selected data against the remaining 10%, and by comparing model estimates of prevalence against observed data (Figure 3). Figure 4 shows the average prevalence in each country from all the studies plotted against the models estimate. Figure 5 shows the marginal and joint posterior distributions for the fitted parameters. Table 1 gives the estimated parameter values with associated credible intervals. </p> <p>During the validation exercise (in which countries were consulted over their estimates) it was pointed out that China had undertaken three very large-scale population-based serological surveys in order to establish baseline prevalence and progress towards HBV elimination. There were a large number of other surveys from China, that are less representative than these three nationwide surveys. We conducted a sensitivity analysis by restricting the data from China to the three nationally representative surveys. The effect of this change in input data was that the effect of vaccination was more distinct, but the estimated age effects (change in prevalence in children under 5, or juveniles (children 5-15 years)) were no longer significantly different from zero (see Table 2 and Figure 6). The deviance was significantly reduced, suggesting a much better fitting model (Table 2), albeit on a somewhat reduced dataset. </p>
<h1>Méthodologie</h1>
<h2>Méthode de calcul :</h2> <p>Les données ont été modélisées à l'aide d'une régression logistique bayésienne examinant la proportion d'individus testés positifs pour l'HBsAg dans chaque étude, en pondérant chaque étude par sa taille et en utilisant un modèle autorégressif conditionnel (CAR) tenant compte des corrélations spatiales et économiques entre des pays similaires. Ce modèle utilise des données provenant de pays bien échantillonnés pour estimer la prévalence dans des pays pauvres en données, avec des effets tels que le sexe, l'âge et le statut vaccinal, qui sont également informés par la proximité géographique et le PIB des pays par rapport aux autres pays (modèle CAR). En partant de l'hypothèse que les pays qui sont proches économiquement et/ou géographiquement, auront une prévalence plus similaire en raison de leur structure sociale et de leurs capacités en matière de soins de santé. </p> <p>La variable de réponse dans le modèle était la prévalence de l'antigène de surface de l'hépatite (HBsAg), les variables explicatives étant l'âge (trois catégories, moins de 5 ans, jeunes (5 à 15 ans) et adultes (16 et +), réparties en fonction de l'âge moyen des participants à l'étude), le sexe (proportion de femmes dans l'étude), le biais de l'étude (par exemple, une forte proportion de participants à l'étude issus de populations indigènes), la couverture vaccinale de 3 doses, la dose de naissance du vaccin et le pays de l'étude. La couverture de la vaccination de routine en 3 doses et de la vaccination à la naissance dans chaque étude, a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale de l'Organisation mondiale de la Santé (OMS) et de le Fonds des Nations Unies pour l'enfance (UNICEF) pour ce pays. Les estimations OMS-UNICEF sont des données annuelles pour l'ensemble du pays et ne contiennent pas de l'informations sur l'efficacité du vaccin qui n'ont pas été utilisées dans l'analyse, car aucune donnée n'a été obtenue à ce sujet. L'efficacité du vaccin serait implicitement estimée dans l'analyse, car nous constatons que la vaccination a un effet variable dans le temps et dans l'espace selon les études. La couverture de la vaccination de routine à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale de l'OMS et de l'UNICEF pour ce pays. La couverture de la vaccination systématique par trois doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale OMS-UNICEF pour ce pays. Plus explicitement, le modèle utilise l'âge et le moment de l'étude pour calculer les années de naissance des participants. Ainsi, s'il y avait une tranche d'âge de 10 <p>L'équation générale du modèle logistique est décrite ci-dessous, </p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAeEAAABRCAMAAADSKe79AAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAK1UExURf////T09NTU1Nzc3Pz8/O/v79DQ0Pr6+qampnh4eHR0dMLCwpGRkXp6em1tbc/Pz+Li4snJydfX11NTU4KCgt3d3erq6m9vb6Wlpby8vFZWVr6+vvHx8X19fZ+fn3Fxcf7+/uzs7K+vr+7u7l1dXZSUlP39/WdnZ9PT01VVVaenp4yMjJaWlre3t1RUVIiIiLCwsKKiouTk5J2dnWNjY+Pj4+vr6/j4+PX19YaGhoSEhPf399/f3/Dw8Pv7+4uLi2JiYl9fX6CgoNbW1pKSkpWVla2traysrHd3d66urvb29o+Pj0pKSktLS+jo6NXV1fn5+bGxsYODg2xsbGRkZOfn59jY2GlpaYmJicjIyGZmZmFhYY2NjZmZmXZ2duDg4Lm5uc3NzbKysk9PT25ubp6entHR0cDAwPPz81tbW1dXV6GhoWtra3BwcO3t7enp6YGBgbi4uJOTk7W1tVFRUXl5eX9/f+bm5tvb27+/v7Ozs7S0tM7Ozn5+ft7e3tra2uHh4cXFxfLy8nJycnV1daOjo5CQkJubm46OjsPDw8bGxk5OTqioqJeXl3x8fFJSUlBQUMzMzKqqql5eXlhYWMHBwWpqamBgYMrKyoWFhU1NTbq6utnZ2ampqZqamkxMTFxcXOXl5cvLy3Nzc4qKimVlZVlZWba2toCAgLu7u729vaSkpNLS0qurq5iYmIeHh8fHx1paWmhoaHt7e5ycnMTExLGtrfayso9ubvze3ptUVGhnZ/vc3MllZXFvb/3y8vivr/739//+/vvX17VXV3Vqav3r69pdXWtMTP/8/NiAgJhcXOfk5P79/fi6uvixse3q6v78/LN3d6g+PvGSkoBTU8u+vp5AQOy3t/rIyPWYmOLU1JKRkYBXV/WGhui0tJ6dncXExHRjY+GEhPWQkMGysgAAAH/C7rcA <p>Where βj sont les effets fixes des variables explicatives <em>x<sub>ii</sub></em>. Avec les effets aléatoires spatiaux décrits par </p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAJsAAAAuCAMAAAAIuJt4AAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAIfUExURf////r6+vLy8vHx8e/v7/X19f7+/r+/v319faenp7CwsIiIiIaGhuXl5fz8/ODg4KSkpMDAwLu7u/39/crKylhYWLKysp2dndHR0fv7+7y8vF1dXYuLi+np6dTU1FlZWaqqqoCAgPn5+WBgYJGRkcLCwmdnZ0pKSlZWVuvr62xsbExMTI6OjuHh4bW1tc7OztPT0/b29pubm15eXtXV1VtbW8vLy9LS0mpqaoeHh+rq6pKSkk5OTk1NTaysrPf395WVlV9fX1dXV5+fn6urq3p6eomJib29vWhoaLe3t35+fnNzc+7u7tra2mNjY4KCgnBwcPT09IyMjFVVVcjIyFxcXKOjo/j4+Nvb21RUVKKiomFhYePj4+zs7N3d3aCgoHh4eFNTU3t7e6WlpcnJyVpaWtzc3OTk5N/f3+bm5szMzJiYmOjo6PDw8MXFxY2NjWZmZuLi4tDQ0JeXl2VlZVFRUdfX166uroODg2JiYo+Pj3l5eXFxcWRkZJSUlN7e3r6+vufn57i4uIqKipCQkIWFhcbGxm1tbe3t7dnZ2bq6und3d8TExHZ2doGBgVBQUHx8fK+vr5mZmX9/f7a2tqmpqaGhofPz85OTk2lpaYSEhJaWlk9PT6ioqJ6enrOzs29vb8PDw3JyclJSUpycnMfHx7S0tM/Pz2tra9jY2EtLS7GxsZqams3Nza2trcHBwXR0dKamprm5udbW1gAAAPSlTP8AAAC1dFJOU/////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////// <p>où,</p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAPQAAABNCAMAAACmNLlxAAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAIlUExURf////7+/v39/bW1tZ6enujo6I+Pj0pKSktLS01NTdXV1e/v72xsbE5OTqWlpfT09Pf39/X19dHR0WBgYL+/v1paWl9fX6Ojo3Nzc+Hh4fHx8VxcXIqKin9/f+zs7IuLi+fn52tra1FRUaurq/n5+cDAwFdXV9fX18PDw2JiYmVlZc3Nzevr68XFxfj4+KqqqmZmZubm5oCAgIiIiPDw8HR0dFRUVK6urtPT08nJyVBQUOnp6e3t7UxMTJCQkO7u7sfHx7q6unp6eqKiol5eXuXl5ampqVJSUpeXl/r6+l1dXc/Pz6+vr9nZ2bS0tNLS0vz8/LGxsVZWVn5+foKCgtbW1ry8vPb29uPj43FxcaioqLm5ucrKyvv7+8bGxq2trbCwsLu7u8zMzM7OzuLi4o2NjU9PT2dnZ8jIyGNjY2RkZFlZWdTU1MTExPLy8m1tbZSUlODg4IWFhXV1dWhoaJWVlVhYWFVVVcHBwaGhoVtbW2FhYXd3d8LCwri4uIyMjKysrJGRkYSEhHx8fJaWloODg/Pz825ubnBwcIeHh6SkpH19fXZ2dp2dnXl5eVNTU5ycnN3d3W9vb4aGhtvb23h4eOrq6rOzs5mZmaamptDQ0Gpqat7e3t/f35iYmI6OjomJidjY2Kenp76+vre3t2lpaXt7e3JycuTk5JOTk7Kyspqampubm7a2tpKSktra2svLy6CgoIGBgb29vZ+fn9zc3AAAAEw+Zl4AAAC3dFJOU/////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////// <p>où <em>n<sub>i</sub></em> est le nombre de voisins pour le pays <em>i</em> et les poids <em>w<sub>i</sub></em>, sont 1. </p> <p>Le modèle a été simulé dans le progiciel statistique bayésien WinBUGS, et la manipulation des données et l'initialisation du modèle ont été effectuées à partir de R (3.3.1) en utilisant R2WinBUGS. Le modèle prend en compte les paramètres de l'âge, du sexe, du biais de l'étude (par exemple, une forte proportion de participants à l'étude issus de populations indigènes), de la couverture vaccinale, de la dose de naissance du vaccin et du pays d'étude. </p> <p>Le modèle utilise la fonction CAR-normale, dans WinBUGS, pour modéliser l'autocorrélation spatiale et économique liée aux pays voisins. Pour chaque pays disposant de données de prévalence, une position centrale pondérée a été calculée en utilisant la taille et la localisation de chaque étude. Pour les pays ne disposant pas de données, nous avons utilisé le centroïde de la population. Dans une nouvelle approche, nous avons pris en compte trois dimensions dans la matrice de contiguïté des pays ; nous avons utilisé les dimensions géographiques habituelles, la latitude et la longitude, et les avons également combinées avec le logarithme naturel du PIB par habitant du pays. Il s'agissait de mesurer non seulement la proximité géographique, mais aussi la proximité de développement des pays. La matrice de proximité pour la distance géo-économique donne un score entre chaque pays et chaque autre pays. Les pays qui sont proches géographiquement et économiquement ont un score faible et ceux qui sont plus éloignés géographiquement ou économiquement ont un score/distance élevé. Par conséquent, les pays qui se ressemblent le plus auront un score faible et les pays qui se ressemblent un score élevé. </p> <p>La façon dont nous avons proportionné la distance géographique et économique pour produire la matrice de contiguïté a ensuite été explorée, car la distance géographique peut être plus ou moins importante que les similitudes économiques. Ainsi, en créant un certain nombre de matrices de contiguïté différentes (non définitives), nous avons pu sélectionner la matrice la plus appropriée qui explique le mieux la réalité. Nous avons normalisé la distance géographique et la distance du PIB, puis nous avons calculé la distance entre ces deux chiffres normalisés. Cela crée une surface gaussienne lissée qui dépend à la fois de la proximité spatiale et de la proximité du PIB par habitant. Nous avons comparé les ratios de, 1:0, 1:1, 2:1, 1:2 (Géographique:PIB). </p> <p>Pour chaque matrice de proximité différente, nous avons également dû sélectionner une distance de voisinage, c'est-à-dire sur quelle distance un pays peut être affecté par un autre. Ainsi, nous avons également fait varier le rayon de la distance à partir de laquelle sélectionner les voisins pour le réseau de voisinage, nous avons utilisé la distance minimale maximale, deux fois la distance minimale maximale et trois fois la distance minimale maximale, faisant ainsi varier le nombre de voisins que chaque pays aurait. </p> <p>Enfin, pour décider de l'ampleur de l'effet d'un pays sur un autre dans le réseau de voisinage, nous avons fait varier les poids des paires de pays dans la matrice de contiguïté, en utilisant soit un poids neutre de 1, de sorte que chaque voisin a un effet égal sur l'autre (ne dépendant pas de la distance dans le réseau), soit des poids décroissants sur la distance avec 1/distance, et 1/distance2, où plus le pays est proche, plus l'effet qu'il a sur un autre pays est important. Le résultat de ces 36 combinaisons différentes a permis de trouver un DIC (Deviance Information Criterion) minimum pour un rapport de 1:2 (Géographie:PIB), la distance minimum des réseaux de voisinage étant le double de la distance minimum maximum et une pondération égale de 1/distance pour chaque pays adjacent. </p> <p>Cette structure de modèle produit des estimations pour tous les effets fixes et aussi pour le risque au niveau de chaque pays, ce qui fournit des informations sur ceux qui sont significativement plus ou moins exposés au risque moyen. </p> <p>Tous les paramètres ont été donnés des antécédents non informatifs. Des simulations ont été effectuées avec 3 chaînes MCMC avec 50 000 brûlures en itérations et chaque paramètre a été estimé à partir de 1000 échantillons prélevés sur 250 000 itérations diluées pour produire la distribution postérieure. La convergence a été atteinte, avec r̂ ; des valeurs toutes très proches de 1.000. Grâce au cadre bayésien et au logiciel WinBUGS, il a été possible d'obtenir des estimations pour les pays où nous ne disposions pas de données sur la prévalence, en utilisant leur PIB et leur proximité géographique pour étayer cette estimation. Les pays ayant réalisé le plus grand nombre d'études ont fourni les estimations avec les intervalles de confiance les plus étroits et ceux qui n'avaient que peu ou pas de données étaient moins bien définis, produisant souvent une distribution postérieure log-normale, donnant des estimations avec de longues queues. </p> <p>Les distributions postérieures des paramètres ont été inspectées pour vérifier la convergence et la covariance entre les paramètres. Le cas échéant, les paramètres ont été centrés et mis à l'échelle N (0, 1) pour faciliter la convergence des paramètres et la covariance de la suppression. Cela a été fait pour le paramètre du sexe, qui a été saisi comme la proportion de l'échantillon qui était féminine ; on a constaté qu'il variait avec les paramètres d'interception et de biais avant de recentrer et de mettre à l'échelle. Cependant, la covariance de la vaccination de routine et de la dose à la naissance a persisté même après le recadrage. Cela n'est pas surprenant car il y a eu quelques cas où la dose à la naissance a été administrée sans la vaccination de routine. Nous avons essayé ici de réduire cette interaction des termes en transformant les données relatives à la dose de naissance. Nous avons modélisé la dose de naissance en utilisant uniquement les données où la dose de naissance était supérieure à 60, 70, 80 & ; 90% respectivement, nous avons également modélisé la dose de naissance au carré, augmentant ainsi l'effet des doses de naissance élevées par rapport aux doses plus faibles. Le choix du modèle dépendait de celui qui réduisait la covariance entre les paramètres et donnait le score CIVD le plus bas. </p> <p>La validation du modèle a été réalisée en utilisant 90 % des données sélectionnées au hasard par rapport aux 10 % restants, et en comparant les estimations de la prévalence du modèle aux données observées (figure 3). La figure 4 montre la prévalence moyenne dans chaque pays à partir de toutes les études tracées par rapport à l'estimation du modèle. La figure 5 montre les distributions marginales et articulaires postérieures pour les paramètres ajustés. Le tableau 1 donne les valeurs estimées des paramètres avec les intervalles crédibles associés. <p>Au cours de l'exercice de validation (dans lequel les pays ont été consultés sur leurs estimations), il a été souligné que la Chine avait entrepris trois enquêtes sérologiques à très grande échelle dans la population afin d'établir la prévalence de base et les progrès vers l'élimination du VHB. Il y avait un grand nombre d'autres enquêtes en Chine, qui sont moins représentatives que ces trois enquêtes nationales. Nous avons effectué une analyse de sensibilité en limitant les données de la Chine aux trois enquêtes représentatives au niveau national. Cette modification des données d'entrée a eu pour effet de rendre l'effet de la vaccination plus distinct, mais les effets estimés sur l'âge (changement de la prévalence chez les enfants de moins de 5 ans, ou les jeunes (enfants de 5 à 15 ans)) n'étaient plus significativement différents de zéro (voir tableau 2 et figure 6). L'écart a été réduit de manière significative, ce qui suggère un modèle beaucoup plus adapté (tableau 2), bien que sur un ensemble de données quelque peu réduit.</p> |
NelMed
Translation changed |
<p>The data was modelled using a Bayesian logistic regression looking at the proportion of individuals that tested positive for HBsAg in each study, weighting each study by its size and using a conditional autoregressive (CAR) model accounting for spatial and economic correlations between similar countries. This model uses data from well sampled countries to estimate prevalence in more data poor countries with effects such as sex, age and vaccination status, these are also informed by the geographic and countries GDP proximity to other countries (CAR model). Under the assumption that countries that are close together economically and/or geographically will have more similar prevalence due to similar social structure and health care capabilities. </p>
<p>The response variable in the model was the prevalence of Hepatitis surface antigen (HBsAg) with the explanatory variables being age (three categories, under 5, juvenile (5-15) and adult (16+), split using the average age of participants in the study), sex (proportion female in the study), study bias (e.g. a high fraction of study participants from indigenous populations), 3 dose vaccine coverage, birth dose of the vaccine and country of study. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The WHO-UNICEF estimates are annual data for the country as a whole, and did not contain information on vaccine efficacy which was not used in the analysis as no data on this was obtained. The vaccine efficacy would be implicitly estimated in the analysis as we see vaccination having a variable effect across time and space across the studies. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. More explicitly, the model uses the ages and timing of the study to calculate the years across which the participants are born, so if the if there was an age group range of 10-15 in a study that was undertaken in 2015, the birth years would be from 2000-2005, we then average the vaccination coverage from the WHO-UNICEF estimates across those 5 years assuming that each age was evenly represented in that age group in the study. The same process was used for the 3 dose and birth dose vaccination. </p> <p> </p> <p>The general logistic model equation is described below, </p> <p>Yi ~Binomial (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p> <p> </p> <p>Where βj are the fixed effects of the explanatory variables xii. With the spatial random effects described by </p> <p>ui~ N(u−i,σ2u/ni)</p> <p> , </p> <p>where, </p> <p>u−i= ∑j ∈ neigh(i)wiuj/ni</p> <p>Where ni is the number of neighbours for country i and weights wi, are 1. </p> <p> </p> <p>The model was simulated in the Bayesian statistical package WinBUGS, and data manipulation and model initialisation run from R (3.3.1) using R2WinBUGS. The model considers the parameters of age, sex, study bias (e.g. a high fraction of study participants from indigenous populations), vaccine coverage, birth dose of the vaccine and country of study. </p> <p>The model uses the CAR-normal function, in WinBUGS, to model the spatial and economic autocorrelation related to neighbouring countries. For each country that had prevalence data, a weighted central position was calculated using the size and location of each study. For those countries with no data, we used the population centroid. In a novel approach, we considered 3 dimensions in the country adjacency matrix; we used the usual geographic dimensions, latitude and longitude and also combined these with the natural log of the country’s GDP per capita. This was to measure not only geographic but also the developmental proximity of countries. The adjacency matrix for the geo-economic distance gives a score between each country to every other country. Those countries which are close geographically and economically would have a low score and those further apart either geographically or economically would have a high score/distance. Therefore, those countries that are more alike will have a low score and those countries which are alike would have a high score. </p> <p>The way we proportioned the geographic and economic distance to produce the adjacency matrix was then explored, this is because geographic distance may be more or less important than economic similarities. Thus, by creating a number of different adjacency matrices (not definitive) we could select the most suitable matrix that explains reality best. We normalised the geographic and GDP distance and then calculated the distance between these two normalised figures. This creates a smoothed Gaussian surface that is dependent on both spatial proximity and GDP per-capita proximity. We compared ratios of, 1:0, 1:1, 2:1, 1:2 (Geographic:GDP). </p> <p>For each different adjacency matrix, we also had to select a neighbourhood distance, i.e. over what distance can a country be effected by another. Thus, we also varied the radius of distance from which to select neighbours for the neighbourhood network, we used the maximum minimum distance, twice the maximum minimum and three times the maximum minimum, thus varying the number of neighbours each country would have. </p> <p> </p> <p>Finally, to decide the magnitude of the effect one country has on another in the neighbourhood network we varied the weights of pairs of countries in the adjacency matrix, using either a neutral weighting of 1, so that each neighbour has an equal effect on each other (not dependent on the distance in the network), or decaying weights over distance with 1/distance, and 1/distance2, where the closer the country is the greater the effect it has on another country. The outcome of these 36 different combinations led to minimum DIC (Deviance Information Criterion) being found for a ratio of 1:2 (Geographic:GDP), the neighbourhood networks minimum distance being twice the maximum minimum distance and an even weighting of 1/distance for each adjacent country. </p> <p>This model structure produces estimates for all fixed effects and also individual country level risk, this provides information on which are significantly at greater or lower risk to the average risk. </p> <p>All parameters were given un-informative priors. Simulations were run with 3 MCMC chains with 50,000 burn in iterations and each parameter estimated from 1000 samples taken from a thinned 250,000 iterations to produce the posterior distribution. Convergence was attained, with r̂ values all very close to 1.000. Due to the Bayesian framework and WinBUGS software it was possible to gain estimates for countries where we had no data on prevalence, using their GDP and geographic proximity to inform this estimate. Those countries with the largest number of studies provided the estimates with the tightest confidence intervals and those with few or no data were less well defined, often producing a log normal distributed posterior distribution, giving estimates with long tails. </p> <p>Posterior distributions of parameters were inspected for convergence and to check for covariance between parameters. Where necessary parameters were centred and scaled to N (0, 1) to aid parameter convergence and remover covariance. This was done for the sex parameter, which was entered as the proportion of the sample that was female; this was seen to co-vary with the intercept and bias parameters before re-centring and scaling. However, the covariance of routine vaccination and birth dose persisted even after re-centring. This is in part unsurprising as there a few instances where birth dose is administered without the routine vaccination. Here we tried to reduce this interaction of the terms by transforming the birth dose data. We modelled birth dose using only data where the birth dose was greater than 60, 70, 80 & 90% respectively, we also modelled birth dose to the square, thus increasing the effect of high birth doses over smaller doses. Model selection dependent on which one both reduced the covariance between the parameters and returned the lowest DIC score. </p> <p>Model validation was conducted using 90% of randomly selected data against the remaining 10%, and by comparing model estimates of prevalence against observed data (Figure 3). Figure 4 shows the average prevalence in each country from all the studies plotted against the models estimate. Figure 5 shows the marginal and joint posterior distributions for the fitted parameters. Table 1 gives the estimated parameter values with associated credible intervals. </p> <p>During the validation exercise (in which countries were consulted over their estimates) it was pointed out that China had undertaken three very large-scale population-based serological surveys in order to establish baseline prevalence and progress towards HBV elimination. There were a large number of other surveys from China, that are less representative than these three nationwide surveys. We conducted a sensitivity analysis by restricting the data from China to the three nationally representative surveys. The effect of this change in input data was that the effect of vaccination was more distinct, but the estimated age effects (change in prevalence in children under 5, or juveniles (children 5-15 years)) were no longer significantly different from zero (see Table 2 and Figure 6). The deviance was significantly reduced, suggesting a much better fitting model (Table 2), albeit on a somewhat reduced dataset. </p>
<h1>Méthodologie</h1>
<h2>Méthode de calcul :</h2> <p>Les données ont été modélisées à l'aide d'une régression logistique bayésienne examinant la proportion d'individus testés positifs pour l'HBsAg dans chaque étude, en pondérant chaque étude par sa taille et en utilisant un modèle autorégressif conditionnel (CAR) tenant compte des corrélations spatiales et économiques entre des pays similaires. Ce modèle utilise des données provenant de pays bien échantillonnés pour estimer la prévalence dans des pays pauvres en données, avec des effets tels que le sexe, l'âge et le statut vaccinal, qui sont également informés par la proximité géographique et le PIB des pays par rapport aux autres pays (modèle CAR). En partant de l'hypothèse que les pays qui sont proches économiquement et/ou géographiquement, auront une prévalence plus similaire en raison de leur structure sociale et de leurs capacités en matière de soins de santé. </p> <p>La variable de réponse dans le modèle était la prévalence de l'antigène de surface de l'hépatite (HBsAg), les variables explicatives étant l'âge (trois catégories, moins de 5 ans, jeunes (5 à 15 ans) et adultes (16 et +), réparties en fonction de l'âge moyen des participants à l'étude), le sexe (proportion de femmes dans l'étude), le biais de l'étude (par exemple, une forte proportion de participants à l'étude issus de populations indigènes), la couverture vaccinale de 3 doses, la dose de naissance du vaccin et le pays de l'étude. La couverture de la vaccination de routine en 3 doses et de la vaccination à la naissance dans chaque étude, a été calculée en croisant l'année et l'âge des participants à chaque étude avec les estimations correspondantes de la couverture vaccinale de l'Organisation mondiale de la Santé (OMS) et de l <p>L'équation générale du modèle logistique est décrite ci-dessous, </p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAeEAAABRCAMAAADSKe79AAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAK1UExURf////T09NTU1Nzc3Pz8/O/v79DQ0Pr6+qampnh4eHR0dMLCwpGRkXp6em1tbc/Pz+Li4snJydfX11NTU4KCgt3d3erq6m9vb6Wlpby8vFZWVr6+vvHx8X19fZ+fn3Fxcf7+/uzs7K+vr+7u7l1dXZSUlP39/WdnZ9PT01VVVaenp4yMjJaWlre3t1RUVIiIiLCwsKKiouTk5J2dnWNjY+Pj4+vr6/j4+PX19YaGhoSEhPf399/f3/Dw8Pv7+4uLi2JiYl9fX6CgoNbW1pKSkpWVla2traysrHd3d66urvb29o+Pj0pKSktLS+jo6NXV1fn5+bGxsYODg2xsbGRkZOfn59jY2GlpaYmJicjIyGZmZmFhYY2NjZmZmXZ2duDg4Lm5uc3NzbKysk9PT25ubp6entHR0cDAwPPz81tbW1dXV6GhoWtra3BwcO3t7enp6YGBgbi4uJOTk7W1tVFRUXl5eX9/f+bm5tvb27+/v7Ozs7S0tM7Ozn5+ft7e3tra2uHh4cXFxfLy8nJycnV1daOjo5CQkJubm46OjsPDw8bGxk5OTqioqJeXl3x8fFJSUlBQUMzMzKqqql5eXlhYWMHBwWpqamBgYMrKyoWFhU1NTbq6utnZ2ampqZqamkxMTFxcXOXl5cvLy3Nzc4qKimVlZVlZWba2toCAgLu7u729vaSkpNLS0qurq5iYmIeHh8fHx1paWmhoaHt7e5ycnMTExLGtrfayso9ubvze3ptUVGhnZ/vc3MllZXFvb/3y8vivr/739//+/vvX17VXV3Vqav3r69pdXWtMTP/8/NiAgJhcXOfk5P79/fi6uvixse3q6v78/LN3d6g+PvGSkoBTU8u+vp5AQOy3t/rIyPWYmOLU1JKRkYBXV/WGhui0tJ6dncXExHRjY+GEhPWQkMGysgAAAH/C7rcA <p>Where βj sont les effets fixes des variables explicatives <em>x<sub>ii</sub></em>. Avec les effets aléatoires spatiaux décrits par </p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAJsAAAAuCAMAAAAIuJt4AAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAIfUExURf////r6+vLy8vHx8e/v7/X19f7+/r+/v319faenp7CwsIiIiIaGhuXl5fz8/ODg4KSkpMDAwLu7u/39/crKylhYWLKysp2dndHR0fv7+7y8vF1dXYuLi+np6dTU1FlZWaqqqoCAgPn5+WBgYJGRkcLCwmdnZ0pKSlZWVuvr62xsbExMTI6OjuHh4bW1tc7OztPT0/b29pubm15eXtXV1VtbW8vLy9LS0mpqaoeHh+rq6pKSkk5OTk1NTaysrPf395WVlV9fX1dXV5+fn6urq3p6eomJib29vWhoaLe3t35+fnNzc+7u7tra2mNjY4KCgnBwcPT09IyMjFVVVcjIyFxcXKOjo/j4+Nvb21RUVKKiomFhYePj4+zs7N3d3aCgoHh4eFNTU3t7e6WlpcnJyVpaWtzc3OTk5N/f3+bm5szMzJiYmOjo6PDw8MXFxY2NjWZmZuLi4tDQ0JeXl2VlZVFRUdfX166uroODg2JiYo+Pj3l5eXFxcWRkZJSUlN7e3r6+vufn57i4uIqKipCQkIWFhcbGxm1tbe3t7dnZ2bq6und3d8TExHZ2doGBgVBQUHx8fK+vr5mZmX9/f7a2tqmpqaGhofPz85OTk2lpaYSEhJaWlk9PT6ioqJ6enrOzs29vb8PDw3JyclJSUpycnMfHx7S0tM/Pz2tra9jY2EtLS7GxsZqams3Nza2trcHBwXR0dKamprm5udbW1gAAAPSlTP8AAAC1dFJOU/////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////// <p>où,</p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAPQAAABNCAMAAACmNLlxAAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAIlUExURf////7+/v39/bW1tZ6enujo6I+Pj0pKSktLS01NTdXV1e/v72xsbE5OTqWlpfT09Pf39/X19dHR0WBgYL+/v1paWl9fX6Ojo3Nzc+Hh4fHx8VxcXIqKin9/f+zs7IuLi+fn52tra1FRUaurq/n5+cDAwFdXV9fX18PDw2JiYmVlZc3Nzevr68XFxfj4+KqqqmZmZubm5oCAgIiIiPDw8HR0dFRUVK6urtPT08nJyVBQUOnp6e3t7UxMTJCQkO7u7sfHx7q6unp6eqKiol5eXuXl5ampqVJSUpeXl/r6+l1dXc/Pz6+vr9nZ2bS0tNLS0vz8/LGxsVZWVn5+foKCgtbW1ry8vPb29uPj43FxcaioqLm5ucrKyvv7+8bGxq2trbCwsLu7u8zMzM7OzuLi4o2NjU9PT2dnZ8jIyGNjY2RkZFlZWdTU1MTExPLy8m1tbZSUlODg4IWFhXV1dWhoaJWVlVhYWFVVVcHBwaGhoVtbW2FhYXd3d8LCwri4uIyMjKysrJGRkYSEhHx8fJaWloODg/Pz825ubnBwcIeHh6SkpH19fXZ2dp2dnXl5eVNTU5ycnN3d3W9vb4aGhtvb23h4eOrq6rOzs5mZmaamptDQ0Gpqat7e3t/f35iYmI6OjomJidjY2Kenp76+vre3t2lpaXt7e3JycuTk5JOTk7Kyspqampubm7a2tpKSktra2svLy6CgoIGBgb29vZ+fn9zc3AAAAEw+Zl4AAAC3dFJOU/////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////// <p>où <em>n<sub>i</sub></em> est le nombre de voisins pour le pays <em>i</em> et les poids <em>w<sub>i</sub></em>, sont 1. </p> <p>Le modèle a été simulé dans le progiciel statistique bayésien WinBUGS, et la manipulation des données et l'initialisation du modèle ont été effectuées à partir de R (3.3.1) en utilisant R2WinBUGS. Le modèle prend en compte les paramètres de l'âge, du sexe, du biais de l'étude (par exemple, une forte proportion de participants à l'étude issus de populations indigènes), de la couverture vaccinale, de la dose de naissance du vaccin et du pays d'étude. </p> <p>Le modèle utilise la fonction CAR-normale, dans WinBUGS, pour modéliser l'autocorrélation spatiale et économique liée aux pays voisins. Pour chaque pays disposant de données de prévalence, une position centrale pondérée a été calculée en utilisant la taille et la localisation de chaque étude. Pour les pays ne disposant pas de données, nous avons utilisé le centroïde de la population. Dans une nouvelle approche, nous avons pris en compte trois dimensions dans la matrice de contiguïté des pays ; nous avons utilisé les dimensions géographiques habituelles, la latitude et la longitude, et les avons également combinées avec le logarithme naturel du PIB par habitant du pays. Il s'agissait de mesurer non seulement la proximité géographique, mais aussi la proximité de développement des pays. La matrice de proximité pour la distance géo-économique donne un score entre chaque pays et chaque autre pays. Les pays qui sont proches géographiquement et économiquement ont un score faible et ceux qui sont plus éloignés géographiquement ou économiquement ont un score/distance élevé. Par conséquent, les pays qui se ressemblent le plus auront un score faible et les pays qui se ressemblent un score élevé. </p> <p>La façon dont nous avons proportionné la distance géographique et économique pour produire la matrice de contiguïté a ensuite été explorée, car la distance géographique peut être plus ou moins importante que les similitudes économiques. Ainsi, en créant un certain nombre de matrices de contiguïté différentes (non définitives), nous avons pu sélectionner la matrice la plus appropriée qui explique le mieux la réalité. Nous avons normalisé la distance géographique et la distance du PIB, puis nous avons calculé la distance entre ces deux chiffres normalisés. Cela crée une surface gaussienne lissée qui dépend à la fois de la proximité spatiale et de la proximité du PIB par habitant. Nous avons comparé les ratios de, 1:0, 1:1, 2:1, 1:2 (Géographique:PIB). </p> <p>Pour chaque matrice de proximité différente, nous avons également dû sélectionner une distance de voisinage, c'est-à-dire sur quelle distance un pays peut être affecté par un autre. Ainsi, nous avons également fait varier le rayon de la distance à partir de laquelle sélectionner les voisins pour le réseau de voisinage, nous avons utilisé la distance minimale maximale, deux fois la distance minimale maximale et trois fois la distance minimale maximale, faisant ainsi varier le nombre de voisins que chaque pays aurait. </p> <p>Enfin, pour décider de l'ampleur de l'effet d'un pays sur un autre dans le réseau de voisinage, nous avons fait varier les poids des paires de pays dans la matrice de contiguïté, en utilisant soit un poids neutre de 1, de sorte que chaque voisin a un effet égal sur l'autre (ne dépendant pas de la distance dans le réseau), soit des poids décroissants sur la distance avec 1/distance, et 1/distance2, où plus le pays est proche, plus l'effet qu'il a sur un autre pays est important. Le résultat de ces 36 combinaisons différentes a permis de trouver un DIC (Deviance Information Criterion) minimum pour un rapport de 1:2 (Géographie:PIB), la distance minimum des réseaux de voisinage étant le double de la distance minimum maximum et une pondération égale de 1/distance pour chaque pays adjacent. </p> <p>Cette structure de modèle produit des estimations pour tous les effets fixes et aussi pour le risque au niveau de chaque pays, ce qui fournit des informations sur ceux qui sont significativement plus ou moins exposés au risque moyen. </p> <p>Tous les paramètres ont été donnés des antécédents non informatifs. Des simulations ont été effectuées avec 3 chaînes MCMC avec 50 000 brûlures en itérations et chaque paramètre a été estimé à partir de 1000 échantillons prélevés sur 250 000 itérations diluées pour produire la distribution postérieure. La convergence a été atteinte, avec r̂ ; des valeurs toutes très proches de 1.000. Grâce au cadre bayésien et au logiciel WinBUGS, il a été possible d'obtenir des estimations pour les pays où nous ne disposions pas de données sur la prévalence, en utilisant leur PIB et leur proximité géographique pour étayer cette estimation. Les pays ayant réalisé le plus grand nombre d'études ont fourni les estimations avec les intervalles de confiance les plus étroits et ceux qui n'avaient que peu ou pas de données étaient moins bien définis, produisant souvent une distribution postérieure log-normale, donnant des estimations avec de longues queues. </p> <p>Les distributions postérieures des paramètres ont été inspectées pour vérifier la convergence et la covariance entre les paramètres. Le cas échéant, les paramètres ont été centrés et mis à l'échelle N (0, 1) pour faciliter la convergence des paramètres et la covariance de la suppression. Cela a été fait pour le paramètre du sexe, qui a été saisi comme la proportion de l'échantillon qui était féminine ; on a constaté qu'il variait avec les paramètres d'interception et de biais avant de recentrer et de mettre à l'échelle. Cependant, la covariance de la vaccination de routine et de la dose à la naissance a persisté même après le recadrage. Cela n'est pas surprenant car il y a eu quelques cas où la dose à la naissance a été administrée sans la vaccination de routine. Nous avons essayé ici de réduire cette interaction des termes en transformant les données relatives à la dose de naissance. Nous avons modélisé la dose de naissance en utilisant uniquement les données où la dose de naissance était supérieure à 60, 70, 80 & ; 90% respectivement, nous avons également modélisé la dose de naissance au carré, augmentant ainsi l'effet des doses de naissance élevées par rapport aux doses plus faibles. Le choix du modèle dépendait de celui qui réduisait la covariance entre les paramètres et donnait le score CIVD le plus bas. </p> <p>La validation du modèle a été réalisée en utilisant 90 % des données sélectionnées au hasard par rapport aux 10 % restants, et en comparant les estimations de la prévalence du modèle aux données observées (figure 3). La figure 4 montre la prévalence moyenne dans chaque pays à partir de toutes les études tracées par rapport à l'estimation du modèle. La figure 5 montre les distributions marginales et articulaires postérieures pour les paramètres ajustés. Le tableau 1 donne les valeurs estimées des paramètres avec les intervalles crédibles associés. <p>Au cours de l'exercice de validation (dans lequel les pays ont été consultés sur leurs estimations), il a été souligné que la Chine avait entrepris trois enquêtes sérologiques à très grande échelle dans la population afin d'établir la prévalence de base et les progrès vers l'élimination du VHB. Il y avait un grand nombre d'autres enquêtes en Chine, qui sont moins représentatives que ces trois enquêtes nationales. Nous avons effectué une analyse de sensibilité en limitant les données de la Chine aux trois enquêtes représentatives au niveau national. Cette modification des données d'entrée a eu pour effet de rendre l'effet de la vaccination plus distinct, mais les effets estimés sur l'âge (changement de la prévalence chez les enfants de moins de 5 ans, ou les jeunes (enfants de 5 à 15 ans)) n'étaient plus significativement différents de zéro (voir tableau 2 et figure 6). L'écart a été réduit de manière significative, ce qui suggère un modèle beaucoup plus adapté (tableau 2), bien que sur un ensemble de données quelque peu réduit.</p> |
NelMed
Translation changed |
<p>The data was modelled using a Bayesian logistic regression looking at the proportion of individuals that tested positive for HBsAg in each study, weighting each study by its size and using a conditional autoregressive (CAR) model accounting for spatial and economic correlations between similar countries. This model uses data from well sampled countries to estimate prevalence in more data poor countries with effects such as sex, age and vaccination status, these are also informed by the geographic and countries GDP proximity to other countries (CAR model). Under the assumption that countries that are close together economically and/or geographically will have more similar prevalence due to similar social structure and health care capabilities. </p>
<p>The response variable in the model was the prevalence of Hepatitis surface antigen (HBsAg) with the explanatory variables being age (three categories, under 5, juvenile (5-15) and adult (16+), split using the average age of participants in the study), sex (proportion female in the study), study bias (e.g. a high fraction of study participants from indigenous populations), 3 dose vaccine coverage, birth dose of the vaccine and country of study. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The WHO-UNICEF estimates are annual data for the country as a whole, and did not contain information on vaccine efficacy which was not used in the analysis as no data on this was obtained. The vaccine efficacy would be implicitly estimated in the analysis as we see vaccination having a variable effect across time and space across the studies. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. More explicitly, the model uses the ages and timing of the study to calculate the years across which the participants are born, so if the if there was an age group range of 10-15 in a study that was undertaken in 2015, the birth years would be from 2000-2005, we then average the vaccination coverage from the WHO-UNICEF estimates across those 5 years assuming that each age was evenly represented in that age group in the study. The same process was used for the 3 dose and birth dose vaccination. </p> <p> </p> <p>The general logistic model equation is described below, </p> <p>Yi ~Binomial (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p> <p> </p> <p>Where βj are the fixed effects of the explanatory variables xii. With the spatial random effects described by </p> <p>ui~ N(u−i,σ2u/ni)</p> <p> , </p> <p>where, </p> <p>u−i= ∑j ∈ neigh(i)wiuj/ni</p> <p>Where ni is the number of neighbours for country i and weights wi, are 1. </p> <p> </p> <p>The model was simulated in the Bayesian statistical package WinBUGS, and data manipulation and model initialisation run from R (3.3.1) using R2WinBUGS. The model considers the parameters of age, sex, study bias (e.g. a high fraction of study participants from indigenous populations), vaccine coverage, birth dose of the vaccine and country of study. </p> <p>The model uses the CAR-normal function, in WinBUGS, to model the spatial and economic autocorrelation related to neighbouring countries. For each country that had prevalence data, a weighted central position was calculated using the size and location of each study. For those countries with no data, we used the population centroid. In a novel approach, we considered 3 dimensions in the country adjacency matrix; we used the usual geographic dimensions, latitude and longitude and also combined these with the natural log of the country’s GDP per capita. This was to measure not only geographic but also the developmental proximity of countries. The adjacency matrix for the geo-economic distance gives a score between each country to every other country. Those countries which are close geographically and economically would have a low score and those further apart either geographically or economically would have a high score/distance. Therefore, those countries that are more alike will have a low score and those countries which are alike would have a high score. </p> <p>The way we proportioned the geographic and economic distance to produce the adjacency matrix was then explored, this is because geographic distance may be more or less important than economic similarities. Thus, by creating a number of different adjacency matrices (not definitive) we could select the most suitable matrix that explains reality best. We normalised the geographic and GDP distance and then calculated the distance between these two normalised figures. This creates a smoothed Gaussian surface that is dependent on both spatial proximity and GDP per-capita proximity. We compared ratios of, 1:0, 1:1, 2:1, 1:2 (Geographic:GDP). </p> <p>For each different adjacency matrix, we also had to select a neighbourhood distance, i.e. over what distance can a country be effected by another. Thus, we also varied the radius of distance from which to select neighbours for the neighbourhood network, we used the maximum minimum distance, twice the maximum minimum and three times the maximum minimum, thus varying the number of neighbours each country would have. </p> <p> </p> <p>Finally, to decide the magnitude of the effect one country has on another in the neighbourhood network we varied the weights of pairs of countries in the adjacency matrix, using either a neutral weighting of 1, so that each neighbour has an equal effect on each other (not dependent on the distance in the network), or decaying weights over distance with 1/distance, and 1/distance2, where the closer the country is the greater the effect it has on another country. The outcome of these 36 different combinations led to minimum DIC (Deviance Information Criterion) being found for a ratio of 1:2 (Geographic:GDP), the neighbourhood networks minimum distance being twice the maximum minimum distance and an even weighting of 1/distance for each adjacent country. </p> <p>This model structure produces estimates for all fixed effects and also individual country level risk, this provides information on which are significantly at greater or lower risk to the average risk. </p> <p>All parameters were given un-informative priors. Simulations were run with 3 MCMC chains with 50,000 burn in iterations and each parameter estimated from 1000 samples taken from a thinned 250,000 iterations to produce the posterior distribution. Convergence was attained, with r̂ values all very close to 1.000. Due to the Bayesian framework and WinBUGS software it was possible to gain estimates for countries where we had no data on prevalence, using their GDP and geographic proximity to inform this estimate. Those countries with the largest number of studies provided the estimates with the tightest confidence intervals and those with few or no data were less well defined, often producing a log normal distributed posterior distribution, giving estimates with long tails. </p> <p>Posterior distributions of parameters were inspected for convergence and to check for covariance between parameters. Where necessary parameters were centred and scaled to N (0, 1) to aid parameter convergence and remover covariance. This was done for the sex parameter, which was entered as the proportion of the sample that was female; this was seen to co-vary with the intercept and bias parameters before re-centring and scaling. However, the covariance of routine vaccination and birth dose persisted even after re-centring. This is in part unsurprising as there a few instances where birth dose is administered without the routine vaccination. Here we tried to reduce this interaction of the terms by transforming the birth dose data. We modelled birth dose using only data where the birth dose was greater than 60, 70, 80 & 90% respectively, we also modelled birth dose to the square, thus increasing the effect of high birth doses over smaller doses. Model selection dependent on which one both reduced the covariance between the parameters and returned the lowest DIC score. </p> <p>Model validation was conducted using 90% of randomly selected data against the remaining 10%, and by comparing model estimates of prevalence against observed data (Figure 3). Figure 4 shows the average prevalence in each country from all the studies plotted against the models estimate. Figure 5 shows the marginal and joint posterior distributions for the fitted parameters. Table 1 gives the estimated parameter values with associated credible intervals. </p> <p>During the validation exercise (in which countries were consulted over their estimates) it was pointed out that China had undertaken three very large-scale population-based serological surveys in order to establish baseline prevalence and progress towards HBV elimination. There were a large number of other surveys from China, that are less representative than these three nationwide surveys. We conducted a sensitivity analysis by restricting the data from China to the three nationally representative surveys. The effect of this change in input data was that the effect of vaccination was more distinct, but the estimated age effects (change in prevalence in children under 5, or juveniles (children 5-15 years)) were no longer significantly different from zero (see Table 2 and Figure 6). The deviance was significantly reduced, suggesting a much better fitting model (Table 2), albeit on a somewhat reduced dataset. </p>
<h1>Méthodologie</h1>
<h2>Méthode de calcul :</h2> <p>Les données ont été modélisées à l'aide d'une régression logistique bayésienne examinant la proportion d'individus testés positifs pour l'HBsAg dans chaque étude, en pondérant chaque étude par sa taille et en utilisant un modèle autorégressif conditionnel (CAR) tenant compte des corrélations spatiales et économiques entre des pays similaires. Ce modèle utilise des données provenant de pays bien échantillonnés pour estimer la prévalence dans des pays pauvres en données, avec des effets tels que le sexe, l'âge et le statut vaccinal, qui sont également informés par la proximité géographique et le PIB des pays par rapport aux autres pays (modèle CAR). En partant de l'hypothèse que les pays qui sont proches économiquement et/ou géographiquement, auront une prévalence plus similaire en raison de leur structure sociale et de leurs capacités en matière de soins de santé. </p> <p>La variable de réponse dans le modèle était la prévalence de l'antigène de surface de l'hépatite (HBsAg), les variables explicatives étant l'âge (trois catégories, moins de 5 ans, jeunes (5 <p>L'équation générale du modèle logistique est décrite ci-dessous, </p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAeEAAABRCAMAAADSKe79AAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAK1UExURf////T09NTU1Nzc3Pz8/O/v79DQ0Pr6+qampnh4eHR0dMLCwpGRkXp6em1tbc/Pz+Li4snJydfX11NTU4KCgt3d3erq6m9vb6Wlpby8vFZWVr6+vvHx8X19fZ+fn3Fxcf7+/uzs7K+vr+7u7l1dXZSUlP39/WdnZ9PT01VVVaenp4yMjJaWlre3t1RUVIiIiLCwsKKiouTk5J2dnWNjY+Pj4+vr6/j4+PX19YaGhoSEhPf399/f3/Dw8Pv7+4uLi2JiYl9fX6CgoNbW1pKSkpWVla2traysrHd3d66urvb29o+Pj0pKSktLS+jo6NXV1fn5+bGxsYODg2xsbGRkZOfn59jY2GlpaYmJicjIyGZmZmFhYY2NjZmZmXZ2duDg4Lm5uc3NzbKysk9PT25ubp6entHR0cDAwPPz81tbW1dXV6GhoWtra3BwcO3t7enp6YGBgbi4uJOTk7W1tVFRUXl5eX9/f+bm5tvb27+/v7Ozs7S0tM7Ozn5+ft7e3tra2uHh4cXFxfLy8nJycnV1daOjo5CQkJubm46OjsPDw8bGxk5OTqioqJeXl3x8fFJSUlBQUMzMzKqqql5eXlhYWMHBwWpqamBgYMrKyoWFhU1NTbq6utnZ2ampqZqamkxMTFxcXOXl5cvLy3Nzc4qKimVlZVlZWba2toCAgLu7u729vaSkpNLS0qurq5iYmIeHh8fHx1paWmhoaHt7e5ycnMTExLGtrfayso9ubvze3ptUVGhnZ/vc3MllZXFvb/3y8vivr/739//+/vvX17VXV3Vqav3r69pdXWtMTP/8/NiAgJhcXOfk5P79/fi6uvixse3q6v78/LN3d6g+PvGSkoBTU8u+vp5AQOy3t/rIyPWYmOLU1JKRkYBXV/WGhui0tJ6dncXExHRjY+GEhPWQkMGysgAAAH/C7rcA <p>Where βj sont les effets fixes des variables explicatives <em>x<sub>ii</sub></em>. Avec les effets aléatoires spatiaux décrits par </p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAJsAAAAuCAMAAAAIuJt4AAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAIfUExURf////r6+vLy8vHx8e/v7/X19f7+/r+/v319faenp7CwsIiIiIaGhuXl5fz8/ODg4KSkpMDAwLu7u/39/crKylhYWLKysp2dndHR0fv7+7y8vF1dXYuLi+np6dTU1FlZWaqqqoCAgPn5+WBgYJGRkcLCwmdnZ0pKSlZWVuvr62xsbExMTI6OjuHh4bW1tc7OztPT0/b29pubm15eXtXV1VtbW8vLy9LS0mpqaoeHh+rq6pKSkk5OTk1NTaysrPf395WVlV9fX1dXV5+fn6urq3p6eomJib29vWhoaLe3t35+fnNzc+7u7tra2mNjY4KCgnBwcPT09IyMjFVVVcjIyFxcXKOjo/j4+Nvb21RUVKKiomFhYePj4+zs7N3d3aCgoHh4eFNTU3t7e6WlpcnJyVpaWtzc3OTk5N/f3+bm5szMzJiYmOjo6PDw8MXFxY2NjWZmZuLi4tDQ0JeXl2VlZVFRUdfX166uroODg2JiYo+Pj3l5eXFxcWRkZJSUlN7e3r6+vufn57i4uIqKipCQkIWFhcbGxm1tbe3t7dnZ2bq6und3d8TExHZ2doGBgVBQUHx8fK+vr5mZmX9/f7a2tqmpqaGhofPz85OTk2lpaYSEhJaWlk9PT6ioqJ6enrOzs29vb8PDw3JyclJSUpycnMfHx7S0tM/Pz2tra9jY2EtLS7GxsZqams3Nza2trcHBwXR0dKamprm5udbW1gAAAPSlTP8AAAC1dFJOU/////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////// <p>où,</p> <p><img src="data :image/png ;base64,iVBORw0KGgoAAAANSUhEUgAAAPQAAABNCAMAAACmNLlxAAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAIlUExURf////7+/v39/bW1tZ6enujo6I+Pj0pKSktLS01NTdXV1e/v72xsbE5OTqWlpfT09Pf39/X19dHR0WBgYL+/v1paWl9fX6Ojo3Nzc+Hh4fHx8VxcXIqKin9/f+zs7IuLi+fn52tra1FRUaurq/n5+cDAwFdXV9fX18PDw2JiYmVlZc3Nzevr68XFxfj4+KqqqmZmZubm5oCAgIiIiPDw8HR0dFRUVK6urtPT08nJyVBQUOnp6e3t7UxMTJCQkO7u7sfHx7q6unp6eqKiol5eXuXl5ampqVJSUpeXl/r6+l1dXc/Pz6+vr9nZ2bS0tNLS0vz8/LGxsVZWVn5+foKCgtbW1ry8vPb29uPj43FxcaioqLm5ucrKyvv7+8bGxq2trbCwsLu7u8zMzM7OzuLi4o2NjU9PT2dnZ8jIyGNjY2RkZFlZWdTU1MTExPLy8m1tbZSUlODg4IWFhXV1dWhoaJWVlVhYWFVVVcHBwaGhoVtbW2FhYXd3d8LCwri4uIyMjKysrJGRkYSEhHx8fJaWloODg/Pz825ubnBwcIeHh6SkpH19fXZ2dp2dnXl5eVNTU5ycnN3d3W9vb4aGhtvb23h4eOrq6rOzs5mZmaamptDQ0Gpqat7e3t/f35iYmI6OjomJidjY2Kenp76+vre3t2lpaXt7e3JycuTk5JOTk7Kyspqampubm7a2tpKSktra2svLy6CgoIGBgb29vZ+fn9zc3AAAAEw+Zl4AAAC3dFJOU/////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////// <p>où <em>n<sub>i</sub></em> est le nombre de voisins pour le pays <em>i</em> et les poids <em>w<sub>i</sub></em>, sont 1. </p> <p>Le modèle a été simulé dans le progiciel statistique bayésien WinBUGS, et la manipulation des données et l'initialisation du modèle ont été effectuées à partir de R (3.3.1) en utilisant R2WinBUGS. Le modèle prend en compte les paramètres de l'âge, du sexe, du biais de l'étude (par exemple, une forte proportion de participants à l'étude issus de populations indigènes), de la couverture vaccinale, de la dose de naissance du vaccin et du pays d'étude. </p> <p>Le modèle utilise la fonction CAR-normale, dans WinBUGS, pour modéliser l'autocorrélation spatiale et économique liée aux pays voisins. Pour chaque pays disposant de données de prévalence, une position centrale pondérée a été calculée en utilisant la taille et la localisation de chaque étude. Pour les pays ne disposant pas de données, nous avons utilisé le centroïde de la population. Dans une nouvelle approche, nous avons pris en compte trois dimensions dans la matrice de contiguïté des pays ; nous avons utilisé les dimensions géographiques habituelles, la latitude et la longitude, et les avons également combinées avec le logarithme naturel du PIB par habitant du pays. Il s'agissait de mesurer non seulement la proximité géographique, mais aussi la proximité de développement des pays. La matrice de proximité pour la distance géo-économique donne un score entre chaque pays et chaque autre pays. Les pays qui sont proches géographiquement et économiquement ont un score faible et ceux qui sont plus éloignés géographiquement ou économiquement ont un score/distance élevé. Par conséquent, les pays qui se ressemblent le plus auront un score faible et les pays qui se ressemblent un score élevé. </p> <p>La façon dont nous avons proportionné la distance géographique et économique pour produire la matrice de contiguïté a ensuite été explorée, car la distance géographique peut être plus ou moins importante que les similitudes économiques. Ainsi, en créant un certain nombre de matrices de contiguïté différentes (non définitives), nous avons pu sélectionner la matrice la plus appropriée qui explique le mieux la réalité. Nous avons normalisé la distance géographique et la distance du PIB, puis nous avons calculé la distance entre ces deux chiffres normalisés. Cela crée une surface gaussienne lissée qui dépend à la fois de la proximité spatiale et de la proximité du PIB par habitant. Nous avons comparé les ratios de, 1:0, 1:1, 2:1, 1:2 (Géographique:PIB). </p> <p>Pour chaque matrice de proximité différente, nous avons également dû sélectionner une distance de voisinage, c'est-à-dire sur quelle distance un pays peut être affecté par un autre. Ainsi, nous avons également fait varier le rayon de la distance à partir de laquelle sélectionner les voisins pour le réseau de voisinage, nous avons utilisé la distance minimale maximale, deux fois la distance minimale maximale et trois fois la distance minimale maximale, faisant ainsi varier le nombre de voisins que chaque pays aurait. </p> <p>Enfin, pour décider de l'ampleur de l'effet d'un pays sur un autre dans le réseau de voisinage, nous avons fait varier les poids des paires de pays dans la matrice de contiguïté, en utilisant soit un poids neutre de 1, de sorte que chaque voisin a un effet égal sur l'autre (ne dépendant pas de la distance dans le réseau), soit des poids décroissants sur la distance avec 1/distance, et 1/distance2, où plus le pays est proche, plus l'effet qu'il a sur un autre pays est important. Le résultat de ces 36 combinaisons différentes a permis de trouver un DIC (Deviance Information Criterion) minimum pour un rapport de 1:2 (Géographie:PIB), la distance minimum des réseaux de voisinage étant le double de la distance minimum maximum et une pondération égale de 1/distance pour chaque pays adjacent. </p> <p>Cette structure de modèle produit des estimations pour tous les effets fixes et aussi pour le risque au niveau de chaque pays, ce qui fournit des informations sur ceux qui sont significativement plus ou moins exposés au risque moyen. </p> <p>Tous les paramètres ont été donnés des antécédents non informatifs. Des simulations ont été effectuées avec 3 chaînes MCMC avec 50 000 brûlures en itérations et chaque paramètre a été estimé à partir de 1000 échantillons prélevés sur 250 000 itérations diluées pour produire la distribution postérieure. La convergence a été atteinte, avec r̂ ; des valeurs toutes très proches de 1.000. Grâce au cadre bayésien et au logiciel WinBUGS, il a été possible d'obtenir des estimations pour les pays où nous ne disposions pas de données sur la prévalence, en utilisant leur PIB et leur proximité géographique pour étayer cette estimation. Les pays ayant réalisé le plus grand nombre d'études ont fourni les estimations avec les intervalles de confiance les plus étroits et ceux qui n'avaient que peu ou pas de données étaient moins bien définis, produisant souvent une distribution postérieure log-normale, donnant des estimations avec de longues queues. </p> <p>Les distributions postérieures des paramètres ont été inspectées pour vérifier la convergence et la covariance entre les paramètres. Le cas échéant, les paramètres ont été centrés et mis à l'échelle N (0, 1) pour faciliter la convergence des paramètres et la covariance de la suppression. Cela a été fait pour le paramètre du sexe, qui a été saisi comme la proportion de l'échantillon qui était féminine ; on a constaté qu'il variait avec les paramètres d'interception et de biais avant de recentrer et de mettre à l'échelle. Cependant, la covariance de la vaccination de routine et de la dose à la naissance a persisté même après le recadrage. Cela n'est pas surprenant car il y a eu quelques cas où la dose à la naissance a été administrée sans la vaccination de routine. Nous avons essayé ici de réduire cette interaction des termes en transformant les données relatives à la dose de naissance. Nous avons modélisé la dose de naissance en utilisant uniquement les données où la dose de naissance était supérieure à 60, 70, 80 & ; 90% respectivement, nous avons également modélisé la dose de naissance au carré, augmentant ainsi l'effet des doses de naissance élevées par rapport aux doses plus faibles. Le choix du modèle dépendait de celui qui réduisait la covariance entre les paramètres et donnait le score CIVD le plus bas. </p> <p>La validation du modèle a été réalisée en utilisant 90 % des données sélectionnées au hasard par rapport aux 10 % restants, et en comparant les estimations de la prévalence du modèle aux données observées (figure 3). La figure 4 montre la prévalence moyenne dans chaque pays à partir de toutes les études tracées par rapport à l'estimation du modèle. La figure 5 montre les distributions marginales et articulaires postérieures pour les paramètres ajustés. Le tableau 1 donne les valeurs estimées des paramètres avec les intervalles crédibles associés. <p>Au cours de l'exercice de validation (dans lequel les pays ont été consultés sur leurs estimations), il a été souligné que la Chine avait entrepris trois enquêtes sérologiques à très grande échelle dans la population afin d'établir la prévalence de base et les progrès vers l'élimination du VHB. Il y avait un grand nombre d'autres enquêtes en Chine, qui sont moins représentatives que ces trois enquêtes nationales. Nous avons effectué une analyse de sensibilité en limitant les données de la Chine aux trois enquêtes représentatives au niveau national. Cette modification des données d'entrée a eu pour effet de rendre l'effet de la vaccination plus distinct, mais les effets estimés sur l'âge (changement de la prévalence chez les enfants de moins de 5 ans, ou les jeunes (enfants de 5 à 15 ans)) n'étaient plus significativement différents de zéro (voir tableau 2 et figure 6). L'écart a été réduit de manière significative, ce qui suggère un modèle beaucoup plus adapté (tableau 2), bien que sur un ensemble de données quelque peu réduit.</p> |
Things to check
Key
DATA_COMPFlags
ignore-inconsistent
<p>The response variable in the model was the prevalence of Hepatitis surface antigen (HBsAg) with the explanatory variables being age (three categories, under 5, juvenile (5-15) and adult (16+), split using the average age of participants in the study), sex (proportion female in the study), study bias (e.g. a high fraction of study participants from indigenous populations), 3 dose vaccine coverage, birth dose of the vaccine and country of study. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The WHO-UNICEF estimates are annual data for the country as a whole, and did not contain information on vaccine efficacy which was not used in the analysis as no data on this was obtained. The vaccine efficacy would be implicitly estimated in the analysis as we see vaccination having a variable effect across time and space across the studies. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. The coverage of routine 3 dose vaccination and birth dose vaccination in each study was calculated by cross referencing the year of and age of participants in each study with the corresponding WHO-UNICEF vaccine coverage estimates for that country. More explicitly, the model uses the ages and timing of the study to calculate the years across which the participants are born, so if the if there was an age group range of 10-15 in a study that was undertaken in 2015, the birth years would be from 2000-2005, we then average the vaccination coverage from the WHO-UNICEF estimates across those 5 years assuming that each age was evenly represented in that age group in the study. The same process was used for the 3 dose and birth dose vaccination. </p>
<p> </p>
<p>The general logistic model equation is described below, </p>
<p>Yi ~Binomial (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p>
<p> </p>
<p>Where βj are the fixed effects of the explanatory variables xii. With the spatial random effects described by </p>
<p>ui~ N(u−i,σ2u/ni)</p>
<p> , </p>
<p>where, </p>
<p>u−i= ∑j ∈ neigh(i)wiuj/ni</p>
<p>Where ni is the number of neighbours for country i and weights wi, are 1. </p>
<p> </p>
<p>The model was simulated in the Bayesian statistical package WinBUGS, and data manipulation and model initialisation run from R (3.3.1) using R2WinBUGS. The model considers the parameters of age, sex, study bias (e.g. a high fraction of study participants from indigenous populations), vaccine coverage, birth dose of the vaccine and country of study. </p>
<p>The model uses the CAR-normal function, in WinBUGS, to model the spatial and economic autocorrelation related to neighbouring countries. For each country that had prevalence data, a weighted central position was calculated using the size and location of each study. For those countries with no data, we used the population centroid. In a novel approach, we considered 3 dimensions in the country adjacency matrix; we used the usual geographic dimensions, latitude and longitude and also combined these with the natural log of the country’s GDP per capita. This was to measure not only geographic but also the developmental proximity of countries. The adjacency matrix for the geo-economic distance gives a score between each country to every other country. Those countries which are close geographically and economically would have a low score and those further apart either geographically or economically would have a high score/distance. Therefore, those countries that are more alike will have a low score and those countries which are alike would have a high score. </p>
<p>The way we proportioned the geographic and economic distance to produce the adjacency matrix was then explored, this is because geographic distance may be more or less important than economic similarities. Thus, by creating a number of different adjacency matrices (not definitive) we could select the most suitable matrix that explains reality best. We normalised the geographic and GDP distance and then calculated the distance between these two normalised figures. This creates a smoothed Gaussian surface that is dependent on both spatial proximity and GDP per-capita proximity. We compared ratios of, 1:0, 1:1, 2:1, 1:2 (Geographic:GDP). </p>
<p>For each different adjacency matrix, we also had to select a neighbourhood distance, i.e. over what distance can a country be effected by another. Thus, we also varied the radius of distance from which to select neighbours for the neighbourhood network, we used the maximum minimum distance, twice the maximum minimum and three times the maximum minimum, thus varying the number of neighbours each country would have. </p>
<p> </p>
<p>Finally, to decide the magnitude of the effect one country has on another in the neighbourhood network we varied the weights of pairs of countries in the adjacency matrix, using either a neutral weighting of 1, so that each neighbour has an equal effect on each other (not dependent on the distance in the network), or decaying weights over distance with 1/distance, and 1/distance2, where the closer the country is the greater the effect it has on another country. The outcome of these 36 different combinations led to minimum DIC (Deviance Information Criterion) being found for a ratio of 1:2 (Geographic:GDP), the neighbourhood networks minimum distance being twice the maximum minimum distance and an even weighting of 1/distance for each adjacent country. </p>
<p>This model structure produces estimates for all fixed effects and also individual country level risk, this provides information on which are significantly at greater or lower risk to the average risk. </p>
<p>All parameters were given un-informative priors. Simulations were run with 3 MCMC chains with 50,000 burn in iterations and each parameter estimated from 1000 samples taken from a thinned 250,000 iterations to produce the posterior distribution. Convergence was attained, with r̂ values all very close to 1.000. Due to the Bayesian framework and WinBUGS software it was possible to gain estimates for countries where we had no data on prevalence, using their GDP and geographic proximity to inform this estimate. Those countries with the largest number of studies provided the estimates with the tightest confidence intervals and those with few or no data were less well defined, often producing a log normal distributed posterior distribution, giving estimates with long tails. </p>
<p>Posterior distributions of parameters were inspected for convergence and to check for covariance between parameters. Where necessary parameters were centred and scaled to N (0, 1) to aid parameter convergence and remover covariance. This was done for the sex parameter, which was entered as the proportion of the sample that was female; this was seen to co-vary with the intercept and bias parameters before re-centring and scaling. However, the covariance of routine vaccination and birth dose persisted even after re-centring. This is in part unsurprising as there a few instances where birth dose is administered without the routine vaccination. Here we tried to reduce this interaction of the terms by transforming the birth dose data. We modelled birth dose using only data where the birth dose was greater than 60, 70, 80 & 90% respectively, we also modelled birth dose to the square, thus increasing the effect of high birth doses over smaller doses. Model selection dependent on which one both reduced the covariance between the parameters and returned the lowest DIC score. </p>
<p>Model validation was conducted using 90% of randomly selected data against the remaining 10%, and by comparing model estimates of prevalence against observed data (Figure 3). Figure 4 shows the average prevalence in each country from all the studies plotted against the models estimate. Figure 5 shows the marginal and joint posterior distributions for the fitted parameters. Table 1 gives the estimated parameter values with associated credible intervals. </p>
<p>During the validation exercise (in which countries were consulted over their estimates) it was pointed out that China had undertaken three very large-scale population-based serological surveys in order to establish baseline prevalence and progress towards HBV elimination. There were a large number of other surveys from China, that are less representative than these three nationwide surveys. We conducted a sensitivity analysis by restricting the data from China to the three nationally representative surveys. The effect of this change in input data was that the effect of vaccination was more distinct, but the estimated age effects (change in prevalence in children under 5, or juveniles (children 5-15 years)) were no longer significantly different from zero (see Table 2 and Figure 6). The deviance was significantly reduced, suggesting a much better fitting model (Table 2), albeit on a somewhat reduced dataset. </p>
<p>La variable réponse du modèle était la prévalence de l'antigène de surface de l'hépatite (AgHBs), les variables explicatives étant l'âge (trois catégories, moins de 5 ans, mineur (5-15 ans) et adulte (16 ans ou plus), réparties en utilisant l'âge moyen des participants à l'étude), le sexe (proportion de femmes dans l'étude), le biais de l'étude (p
ar exemple. ex., une fraction élevée de participants à l'étude provenant de populations indigènes), la couverture vaccinale à 3 doses, la dose de vaccin à la naissance et le pays de l'étude. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations de couverture vaccinale correspondantes de l'OMS-UNICEF pour ce pays. Les estimations de l'OMS-UNICEF sont des données annuelles pour l'ensemble du pays et ne contiennent pas d'informations sur l'efficacité du vaccin, celle-ci n'a pas été utilisée dans l'analyse car aucune donnée à ce sujet n'a été obtenue. L'efficacité du vaccin serait implicitement estimée dans l'analyse car nous constatons que la vaccination a un effet variable dans le temps et l'espace dans les études. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations correspondantes de la couverture vaccinale de l'OMS-UNICEF pour ce pays. La couverture de la vaccination systématique à 3 doses et de la vaccination à la naissance dans chaque étude a été calculée en croisant l'année et l'âge des participants de chaque étude avec les estimations de couverture vaccinale de l'OMS-UNICEF correspondantes pour ce pays. Plus précisément, le modèle utilise les âges et le moment de l'étude pour calculer les années de naissance des participants. Ainsi, si une étude menée en 2015 portait sur une tranche d'âge de 10 à 15 ans, les années de naissance s'étendraient de 2000 à 2005, nous avons ensuite calculé la moyenne de la couverture vaccinale à partir des estimations de l'OMS-UNICEF sur ces 5 années en supposant que chaque âge était représenté de manière égale dans cette tranche d'âge dans l'étude. Le même processus a été utilisé pour la vaccination à 3 doses et la vaccination à la naissance. </p><p> </p>
<p>L'équation du modèle logistique général est décrite ci-dessous, </p>
<p>Yi ~Binôme (πi, Ni), logπi1−πi= β0+ ∑j=1pβjxij+ui </p>
<p> </p>
<p>où βj sont les effets fixes des variables explicatives xii. Avec les effets aléatoires spatiaux décrits par </p>
<p>ui~ N(u−i,σ2u/ni)</p>
<p>où </p>
<p>u−i= ∑j ∈ neigh(i)wiuj/ni</p>
<p>où ni est le nombre de voisins pour le pays i et les poids wi, valent 1. </p>
<p> </p>
<p>Le modèle a été simulé dans le module statistique bayésien WinBUGS, et la manipulation des données et l'initialisation du modèle exécutées à partir de R (3.3.1) en utilisant R2WinBUGS. Le modèle prend en compte les paramètres de l'âge, du sexe, du biais de l'étude (p
ar exemple. ex., une fraction élevée de participants à l'étude provenant de populations indigènes), de la couverture vaccinale, de la dose du vaccin à la naissance et du pays de l'étude. </p><p>Le modèle utilise la fonction CAR-normale, dans WinBUGS, pour modéliser l'autocorrélation géographique et économique liée aux pays voisins. Pour chaque pays disposant de données de prévalence, une position centrale pondérée a été calculée en utilisant la taille et la localisation de chaque étude. Pour les pays ne disposant pas de données, nous avons utilisé le centroïde de la population. Dans une approche novatrice, nous avons considéré 3 dimensions dans la matrice d'adjacence des pays; nous avons utilisé les dimensions géographiques habituelles, la latitude et la longitude, et nous les avons également combinées avec le log naturel du PIB par habitant du pays, ceci afin de mesurer non seulement la proximité géographique mais aussi la proximité de développement des pays. La matrice d'adjacence pour la distance géo-économique donne un score entre chaque pays et tous les autres pays. Les pays qui sont proches géographiquement et économiquement ont un score faible et ceux qui sont plus éloignés géographiquement ou économiquement ont un score/distance élevé. Par conséquent, les pays qui se ressemblent le plus auront un score faible et les pays qui sont moins semblables auront un score élevé. </p>
<p>On a ensuite exploré la façon dont nous avons proportionné la distance géographique et économique pour produire la matrice d'adjacence, ceci parce que la distance géographique peut être plus ou moins importante que les similitudes économiques. Ainsi, en créant un certain nombre de matrices d'adjacence différentes (non définitives), nous avons pu sélectionner la matrice la plus adaptée qui explique le mieux la réalité. Nous avons normalisé la distance géographique et la distance du PIB, puis nous avons calculé la distance entre ces deux chiffres normalisés. Cela crée une surface gaussienne lissée qui dépend à la fois de la proximité spatiale et de la proximité du PIB par habitant. Nous avons comparé des ratios de, 1:0, 1:1, 2:1, 1:2 (Géographie:PIB). </p>
<p>Pour chaque matrice d'adjacence différente, nous avons également dû choisir une distance de voisinage, c
'est.-à-dire. sur quelle distance un pays peut être affecté par un autre. Ainsi, nous avons également fait varier le rayon de distance à partir duquel sélectionner les voisins pour le réseau de voisinage, nous avons utilisé la distance minimale maximale, deux fois le minimum maximal et trois fois le minimum maximal, faisant ainsi varier le nombre de voisins que chaque pays aurait. </p><p> </p>
<p>Enfin, pour décider de l'ampleur de l'effet d'un pays sur un autre dans le réseau de voisinage, nous avons fait varier les poids des paires de pays dans la matrice d'adjacence, en utilisant soit une pondération neutre de 1, de sorte que chaque voisin a un effet égal sur les autres (ne dépendant pas de la distance dans le réseau), soit des poids décroissants sur la distance avec 1/distance, et 1/distance2, où plus le pays est proche, plus son effet sur un autre pays est important. Le résultat de ces 36 combinaisons différentes a conduit à trouver un DIC (Deviance Information Criterion) minimal pour un rapport de 1:2 (Géographie:PIB), la distance minimale des réseaux de voisinage étant deux fois la distance minimale maximale et une pondération égale de 1/distance pour chaque pays adjacent. </p>
<p>Cette structure de modèle produit des estimations pour tous les effets fixes et aussi pour le risque individuel au niveau du pays, cela fournit des informations sur ceux qui sont significativement plus à risque ou moins à risque par rapport au risque moyen. </p>
<p>Tous les paramètres étaient a priori non informatifs. Les simulations ont été effectuées avec 3 chaînes MCMC avec 50 000 essais par itération et chaque paramètre estimé à partir de 1 000 échantillons prélevés sur un nombre réduit de 250 000 itérations pour produire la distribution postérieure. La convergence a été atteinte, avec des valeurs r̂ toutes très proches de 1,000. Grâce au cadre bayésien et au logiciel WinBUGS, il a été possible d'obtenir des estimations pour les pays pour lesquels nous n'avions pas de données sur la prévalence, en utilisant leur PIB et leur proximité géographique pour informer cette estimation. Les pays avec le plus grand nombre d'études ont fourni les estimations avec les intervalles de confiance les plus serrés et ceux avec peu ou pas de données étaient moins bien définis, produisant souvent une distribution postérieure log normale, donnant des estimations avec de longues queues. </p>
<p>Les distributions postérieures des paramètres ont été inspectées pour vérifier la convergence et pour vérifier la covariance entre les paramètres. Si nécessaire, les paramètres ont été centrés et mis à l'échelle d'une loi N (0, 1) pour faciliter la convergence des paramètres et supprimer la covariance. C'est ce qui a été fait pour le paramètre de sexe, qui a été saisi comme la proportion de l'échantillon qui était féminine; on a constaté qu'il covarie avec les paramètres d'interception et de biais avant le recentrage et la mise à l'échelle. Cependant, la covariance de la vaccination systématique et de la dose à la naissance est restée même après recentrage. Ceci n'est en partie pas surprenant car il existe quelques cas où la dose à la naissance est administrée sans la vaccination systématique. Nous avons essayé de réduire cette interaction des termes en transformant les données sur la dose à la naissance. Nous avons modélisé celle-ci en utilisant uniquement les données où la dose à la naissance était supérieure à 60, 70, 80 et 90% respectivement, nous avons également modélisé la dose à la naissance au carré, augmentant ainsi l'effet des doses à la naissance élevées par rapport aux doses plus petites. La sélection du modèle dépendait de celui qui à la fois réduisait la covariance entre les paramètres et retournait le score DIC le plus bas. </p>
<p>La validation du modèle a été effectuée en utilisant 90% des données sélectionnées au hasard contre les 10% restants, et en comparant les estimations de prévalence du modèle aux données observées (figure 3). La figure 4 montre la prévalence moyenne dans chaque pays à partir de toutes les études tracées contre l'estimation du modèle. La figure 5 montre les distributions marginales et conjointes postérieures des paramètres ajustés. Le tableau 1 donne les valeurs estimées des paramètres avec les intervalles de confiance associés. </p>
<p>Lors de l'exercice de validation (au cours duquel les pays ont été consultés au sujet de leurs estimations), il a été souligné que la Chine avait entrepris trois enquêtes sérologiques en population de très grande envergure afin d'établir la prévalence de base et les progrès vers l'élimination du VHB. Il y avait un grand nombre d'autres enquêtes en Chine, qui sont moins représentatives que ces trois enquêtes nationales. Nous avons effectué une analyse de sensibilité en limitant les données de la Chine aux trois enquêtes représentatives au niveau national. Cette modification des données d'entrée a eu pour effet de rendre plus net l'effet de la vaccination, mais les effets estimés sur l'âge (changement de la prévalence chez les enfants de moins de 5 ans ou les jeunes (enfants de 5 à 15 ans)) n'étaient plus significativement différents de zéro (voir tableau 2 et figure 6). La déviance était significativement réduite, ce qui suggère un modèle beaucoup mieux ajusté (tableau 2), bien que sur un ensemble de données quelque peu réduit. </p>