Le «vrai» nombre de gens infectés par le coronavirus

BLOGUE / C'est la question à 1000 $ par les temps qui courent : combien y a-t-il réellement de personnes infectées par le coronavirus ? Pour vrai, là, pas seulement ce que disent les statistiques officielles, car il est absolument certain que c'est pas mal plus que les quelque 153 000 «cas confirmés en laboratoire» de l'OMS. Mais par combien, au juste ? Est-ce cinq fois plus que le nombre «officiel» ? Ou 10 fois plus ? Ou davantage encore ? Écoutez, un texte qui circule abondamment ces jours-ci sur le web avance même le chiffre atterrant de 27 fois plus !

La vérité, c'est qu'on n'en sait encore rien de manière définitive. On ne sera pas vraiment fixé avant d'avoir complété des études «sérologiques», qui regardent la présence ou non d'anticorps dans le sang d'un grand nombre de personnes. Mais des travaux comme ça prennent pas mal de temps à réaliser alors, en attendant, on en est réduit à se contenter d'estimés, de modèles mathématiques, parfois même de vulgaires règles de trois. Les résultats sont très variables et, comme c'est à peu près toujours le cas dans de ce genre de situation, ce sont les chiffres les plus spectaculaires — mais pas forcément les plus solides — qui ont le plus grand retentissement sur le web. Malheureusement...

Le plus bel exemple est sans doute ce texte qui est paru sur le site Medium la semaine dernière et qui a connu un succès littéralement planétaire, ayant été traduit dans 26 langues et comptant plus de 28 millions de «visites» (views) — sans compter d'innombrables mentions dans des médias, blogues et sites du monde entier. Une de ses principales conclusions, c'est que la véritable ampleur de l'épidémie, en termes de nombre de personnes infectées, serait 27 fois plus grande que ce que montrent les chiffres «officiels». Vingt-sept fois !

Son auteur, un certain Tomas Pueyo, a manifestement fait un sérieux effort de documentation et, de toute évidence, il sait jouer avec les chiffres. Le hic, c'est que ses compétences en la matière s'arrêtent là : il maîtrise les maths (ayant deux diplômes en génie) et il a fait beaucoup de lecture sur internet. Pour le reste, il ne connait pas particulièrement bien l'épidémiologie et ses conclusions diffèrent fortement d'analyses menées par des vrais experts — mais qui ne sont jamais devenues virales, j'y reviens tout de suite.

Son texte est un peu confus, au sens où il présente plusieurs approches différentes pour estimer le nombre réel de cas, et qu'il lance beaucoup de chiffres différents sans toujours expliquer quel chiffre a été obtenu avec quelle méthode. Mais en ce qui concerne le «fois 27», c'est assez clair. M. Pueyo est parti du cas de la ville de Wuhan, là où se trouvait le fameux marché public où sont apparus les premiers cas d'infection. Il a pris le 23 janvier (quand elle fut placée en quarantaine) comme date butoir, puis il a comparé deux stats : le nombre total de cas qui avaient été diagnostiqués avant le 23 janvier (444 cas) et le nombre de cas dont la date estimée d'infection était avant le 23 janvier (environ 12 000). Cela signifie donc qu'au 22 janvier, la Chine avait identifié 444 malades à Wuhan alors qu'en réalité, il y en avait 27 fois plus.

C'est une manière habile de procéder, qui ne méritait sans doute pas d'être qualifiée de «ramassis d'âneries» comme certains l'ont fait. Mais le problème est qu'elle ne sort pas des chiffres de cas confirmés, elle ne fait que comparer les cas confirmés comptés de deux façons différentes. D'une part, ce n'est pas ça qui nous intéresse, c'est le nombre réel qu'on veut savoir. D'autre part, c'est une méthode qui peut être biaisée pour la peine si l'effort de dépistage n'est pas constant — or justement la Chine a accru ses efforts avec le temps, ce qui a logiquement gonflé les résultats de M. Pueyo. Et puis celui-ci laisse entendre que son multiplicateur est applicable au reste de la planète, ce qui est très contestable parce que les mesures de surveillance varient d'un pays à l'autre (ce qu'il admet aussi par ailleurs).

Mais quoi qu'il en soit, si ce n'est pas 27 fois plus, alors c'est quoi ? Si je devais faire mes propres calculs de coin de table (et le reste de ce paragraphe n'est rien de plus que ça, je le souligne), je comparerais simplement le taux d'infections bénignes avec le taux d'infections graves/critiques. D'après des chiffres de la Santé publique chinoise, 81 % des gens atteints ne feraient pas grand-chose de plus qu'une grippe sans complication particulière (ni de raison d'aller consulter), mais la maladie dégénèrerait en pneumonie sévère dans 14 % des cas et mènerait le 5 % restant aux soins intensifs. C'est assez grossier, mais ça nous donne déjà ce que nos voisins du sud appellent un ballpark estimate : on peut raisonnablement supposer que la plupart des gens faisant une pneumonie sévère (ou pire) vont au moins consulter un médecin, et que ces cas-là ont une chance relativement mince de passer inaperçus. Il y en a certainement là-dedans qui échappent malgré tout aux statistiques de santé publique, mais a priori le nombre réel de malades ne devrait pas, en principe, être énormément plus élevé que ça : 20 % de cas graves, ça laisse entrevoir un taux de détection qui doit tourner autour de 1 sur 5.

Pour avoir un taux de 1 sur 27, il faudrait que la majorité des gens dans un état grave ou critique décident de ne pas aller voir de médecin et de se soigner tout seul chez eux. Cela ne me semble pas très vraisemblable.

Dans ce que j'ai pu trouver, il y a deux études sérieuses sur cette question qui ont été faites par de vrais épidémiologistes avec de vrais et solides modèles — et non des calculs de coin de table. L'une est disponible depuis ce matin sur le site de Science et elle estime qu'à Wuhan avant la quarantaine du 23 janvier, 1 cas sur 7 a été «documenté» et que les autres sont passés inaperçus. Ce ratio peut varier selon le degré de surveillance, mais de manière générale, ce serait un «scénario du pire» puisque pratiquement tous les gouvernements du monde sont en alerte depuis des semaines, voire des mois.

L'autre est disponible sur merRxiv, qui est un site de prépublication où des articles paraissent sans passer par la révision par les pairs. Ses résultats sont donc à prendre avec un certain grain de sel, mais mentionnons qu'une équipe de statisticiens l'a revue et jugée solide. Cette étude-là estime que les cas «officiels» représentaient le quart des cas totaux dans la province de Hubei au 11 février, donc un ratio 1 sur 4.

Ajoutons à cela que l'épidémiologiste Trevor Bedford du Centre Fred Hutchinson de recherche sur le cancer (Seattle) a évoqué des «taux de détection de grosso modo 1 cas sur 10» sur son compte Twitter. Encore une fois, on n'en saura rien avec certitude avant d'avoir fini une couple de grandes études sérologiques, mais tout cela nous donne une fourchette — entre 4 et 10 fois les cas officiels — qui est très, très probablement beaucoup plus proche de la réalité que le facteur de 27 qui fait tant jaser depuis la semaine dernière.

Pour être tout à fait juste, il faut préciser ici que M. Pueyo ne parle pas explicitement de taux de détection (les cas détectés vs les cas réels, sans égard au temps que cela prend pour les trouver), mais d'un ratio à un point précis dans le temps. Mettre tous ces résultats en parallèle comme je le fais ici a donc quelque chose d'un peu artificiel. Mais il faut dire que le texte de Medium n'est pas toujours clair à cet égard, et qu'il a été très largement interprété comme un taux de détection — c'est ce qui me semble le plus problématique.

* * * * *

Pour discuter de ce billet, rendez-vous sur ma page Facebook professionnelle.