En santé publique et en épidémiologie, la recherche de la réduction du biais dans les estimations est toujours un défi. Cette question se pose notamment lors d’études impliquant la participation de populations ne pouvant être accessibles par simple tirage au sort de la population générale et fréquentant des lieux spécifiques. Ainsi, il existe des méthodes d’échantillonnage permettant de limiter les biais inhérents à une sélection des lieux enquêtés et de se rapprocher au mieux d’un tirage aléatoire simple.
L’article paru ce mois-ci dans la revue Epidemiology and Infection décrit l’une de ces méthodes, à savoir l’échantillonnage lieux-moments (time-location sampling en anglais), mise en œuvre dans le cadre de l’enquête Prevagay. Un des objectifs de cette enquête, réalisée en 2015, dans 5 villes françaises (Lille, Lyon, Montpellier, Nice et Paris) était de déterminer la prévalence de l’infection par le VIH chez les hommes ayant des relations sexuelles avec des hommes (HSH) fréquentant les lieux de convivialité gays.
3 questions à Cécile Sommen, direction appui, traitements et analyse des données
Afin d’estimer la prévalence du VIH dans une population spécifique, il est important de réaliser un tirage au sort aléatoire. L’idéal est de posséder une base de données de toute la population et d’en extraire des individus au hasard afin de constituer un échantillon aléatoire. La prévalence estimée dans cet échantillon sera alors représentative de la prévalence dans la population ciblée.
Dans notre cas, il n’existe pas de base de données des HSH fréquentant les lieux de convivialité gays (bar, sauna, backroom). Il faut donc avoir recours à des méthodes d’échantillonnage probabiliste spécifiques et en tenir compte dans les analyses.
La méthode d’échantillonnage lieux-moments (time location sampling (TLS) en anglais) est bien adaptée à la population visée par notre étude. Elle suppose d’identifier au préalable l’ensemble des établissements de convivialités gays dans chacune des villes étudiées. Cet inventaire des établissements potentiellement participants dans chaque ville a été réalisé par les chargés de prévention régionaux de l’Équipe nationale d’intervention en prévention et santé pour les entreprises (Enipse).
L’échantillonnage se fait alors en deux étapes : dans un premier temps, des établissements sont tirés aléatoirement ainsi que des créneaux (jour et heure) pour la réalisation d’interviews. Plus un établissement est fréquenté, plus le nombre de créneaux à tirer au sort pour cet établissement est élevé ; dans un second temps, des personnes fréquentant ces lieux sont tirées au sort.
Dans les analyses, nous avons tenu compte de l’échantillonnage en spécifiant les poids de sondage(1). La fréquentation des établissements des sujets tirés au sort est également un facteur à prendre en compte : plus un individu fréquente les établissements enquêtés, plus il a de chances d’être interrogé. Ne pas en tenir compte pourrait biaiser les estimations, d’autant plus que, dans notre étude, cette fréquentation était liée au statut VIH.
L’utilisation de la méthode d’échantillonnage lieux-moments s’est aujourd’hui généralisée pour ce type d’enquête. Cependant, si les poids de sondage sont parfois utilisés dans les analyses, il est très rare de voir des études prenant en compte la fréquentation des lieux comme nous l’avons fait dans cette étude.
Cette enquête a permis de montrer que, à l’échelle d’un individu, la fréquentation des établissements avait un effet significatif sur le statut VIH à Paris, Lille et Nice. Plus la fréquentation était élevée, plus la probabilité d'être séropositif était élevée. D’où l’importance de tenir compte de la fréquentation des établissements des sujets tirés au sort pour l’estimation de la prévalence de l’infection par le VIH. À Montpellier et à Lyon, aucun effet significatif de la fréquentation des établissements sur le statut du VIH n’a été mis en évidence.
Nous avons comparé les résultats de prévalence VIH avec et sans l’utilisation des poids de sondage et de la fréquentation des lieux. Dans les trois villes où la fréquentation des établissements était positivement associée au statut sérologique, les estimations de prévalence du VIH obtenues sans tenir compte de l’échantillonnage et de la fréquentation étaient différentes de celles obtenues en tenant compte de ces deux facteurs. Par exemple, à Nice, la prévalence du VIH ainsi estimée était respectivement de 25 % et 17 %. Cette différence est moins marquée pour les deux autres villes.
De plus, la variance des estimations de la prévalence globale du VIH dans les 5 villes était inférieure lorsque l’échantillonnage et la fréquentation étaient pris en compte (environ 50 % plus faible). Ne pas tenir compte de ces paramètres peut donc conduire à conclure à tort qu'il existe des différences significatives dans la prévalence du VIH entre les villes.
Un des objectifs de ce papier était de fournir des informations précises sur la réalisation d’une enquête ciblant des populations difficiles d’accès fréquentant des établissements identifiables afin de donner des outils aux chercheurs qui réaliseraient des études de ce type. Ainsi, nous avons décrit la préparation du terrain (recueil des lieux et des informations nécessaires au tirage au sort), le recrutement des individus, les questions à poser pour estimer la fréquentation des lieux. Hormis la description de la méthodologie, nous avons estimé l’effet ‘plan’ de sondage. Cette information est très utile car elle permet à ceux qui ont recours à cette méthode de calculer la taille des échantillons lors la mise en place de plans de sondage similaires.
Finalement, cette méthodologie est applicable à toute enquête ciblant des personnes fréquentant des lieux identifiables. Elle a déjà été appliquée à Santé publique France sur la population des usagers de drogues.
On pourrait envisager de l’appliquer pour d’autres populations telles que les migrants fréquentant les centres d’accueil, les bénéficiaires d’aide alimentaire, ou les personnes sans-domiciles fixes fréquentant les hébergements d’urgence.
(1)Le poids de sondage d’un individu enquêté est égal à l’inverse de la probabilité qu’il soit tiré au sort compte tenu de l’échantillonnage.
Sommen C, Saboni L, Sauvage C, Alexandre A, Lot F, Barin F, Velter A (2018). Time location sampling in men who have sex with men in the HIV context: the importance of taking into account sampling weights and frequency of venue attendance. Epidemiology and Infection 1–7.
SUR L'ENQUÊTE PRÉVAGAY
Saboni L, Sauvage C, Trouiller-Gerfaux P, Sommen C, Vandentorren S, Silue Y, et al. Rapport Prevagay 2015, Paris. Enquête de séroprévalence du VIH menée auprès des hommes ayant des relations sexuelles avec des hommes fréquentant les lieux de convivialité gay. Saint-Maurice : Santé publique France, 2017. 58 p.
Saboni L, Sauvage C, Trouiller-Gerfaux P, Sommen C, Malfait P, Alexandre A, et al. Rapport Prevagay 2015, Nice. Enquête de séroprévalence du VIH menée auprès des hommes ayant des relations sexuelles avec des hommes fréquentant les lieux de convivialité gay. Saint-Maurice : Santé publique France, 2017. 61 p.
Trouiller-Gerfaux P, Saboni L, Sauvage C, Sommen C, Chaud P, Ndiaye B, et al. Rapport Prevagay 2015, Lille. Enquête de séroprévalence du VIH menée auprès des hommes ayant des relations sexuelles avec des hommes fréquentant les lieux de convivialité gay. Saint-Maurice : Santé publique France, 2017. 59 p.
Sauvage C, Saboni L, Trouiller-Gerfaux P, Sommen C, Saura C, Alexandre A, Lydié N, et al. Rapport Prevagay 2015, Lyon. Enquête de séroprévalence du VIH menée auprès des hommes ayant des relations sexuelles avec des hommes fréquentant les lieux de convivialité gay. Saint-Maurice : Santé publique France, 2017. 58 p.
Sauvage C, Saboni L, Trouiller-Gerfaux P, Sommen C, Rousseau C, Mouly D, et al. Rapport Prevagay 2015, Montpellier. Enquête de séroprévalence du VIH menée auprès des hommes ayant des relations sexuelles avec des hommes fréquentant les lieux de convivialité gay. Saint-Maurice : Santé publique France, 2017. 58 p.
SUR LA MÉTHODE TLS
Léon L, Jauffret-Roustide M and Le Strat Y (2015). Design-based inference in time-location sampling. Biostatistics (Oxford, England) 16, 565–579.
Deville J and Lavallée P (2006) Indirect sampling: the foundations of the generalized weight share method. Survey Methodology 32, 165–176.