Dez razões para duvidar dos dados da covid-19
Se for como eu, tem acompanhado os dados diários da pandemia do coronavírus à procura de sinais de esperança nas trajetórias: os infectados, os hospitalizados, os intubados, os mortos. Se é que existe a possibilidade de entender mais. Quanto mais olho para os números, mais falhas vejo. Aqui estão minhas 10 principais razões.
1- O número de infectados quase não faz sentido. Apenas as pessoas que fazem o teste podem ser contadas e ainda não há testes suficientes, nem perto disso e em nenhum país, exceto talvez na Islândia. O melhor que podemos fazer é estimar quantas pessoas estão doentes, adivinhando qual a percentagem dos infectados que pode efetuar um teste. Nos Estados Unidos, por exemplo, as evidências sugerem que as pessoas têm de estar doentes o suficiente para serem hospitalizadas. Cerca de 10% dos casos merecem hospitalização, portanto, o número real de infectados pode ser cerca de dez vezes maior do que o reportado.
2- Os testes não são precisos, e as imprecisões não são simétricas. Em particular, produzem muito mais falsos negativos do que falsos positivos, o que significa que tendem a indicar que as pessoas estão bem quando na verdade estão doentes. Algumas pesquisas sugerem que a taxa de falsos negativos pode exceder 30%. Tal significa que as estimativas do número real de infecções devem outra vez ser aumentadas.
3- O número de testes não é igual ao número de pessoas testadas. Como os testes são imprecisos, algumas pessoas são testadas duas vezes para ter maior certeza dos resultados. Isso significa que a fatia da população testada, comparada ao número de pessoas infectadas, mostra uma imagem mais positiva do que a realidade, o que oferece mais um motivo para acreditar que o número real de infectados é maior.
4- Os números não estão sincronizados. Às vezes, as pessoas morrem semanas após serem hospitalizadas e são hospitalizadas uma semana ou mais após testes positivos para o vírus. Portanto, a curva do "número de mortes" só mostrará achatamento muito tempo depois do que a curva do "número de casos". O lado positivo desse atraso é que, como leva mais tempo para se recuperar do que para morrer, a taxa de mortalidade diminui ao longo do tempo.
5- O significado da hospitalização está a mudar. As autoridades apresentaram recentemente um achatamento de internações hospitalares como um sinal positivo. Mas é preciso muito mais para levar alguém ao hospital hoje em dia. As linhas de emergência estão congestionadas, as ambulâncias são escassas, os padrões para quem é hospitalizado mudaram drasticamente e as pessoas têm evitado centros de saúde sobrecarregados. Desta forma, um menor número de hospitalizações não significa necessariamente que a situação esteja a melhorar.
6- As mortes não são informadas de forma imediata ou consistentemente. Vários problemas operacionais, como a apresentação de documentos e a notificação de parentes próximos, determinam quando uma morte é realmente registada. Isso pode ajudar a explicar por que a maioria das mortes é habitualmente divulgada às terças-feiras. Portanto, não fique muito animado com as boas notícias em um fim de semana. Pode ficar decepcionado no início da semana.
7- Mortes fora dos hospitais não estão a ser informadas. Quando as pessoas morrem em casa ou em lares, centros de dia ou prisões, nem sempre são contadas. Um dado relevante: quando a França começou a contabilizar mortes em lares, o número de mortes aumentou 40%. A Bélgica, que divulga muito bem as mortes em lares de idosos, descobriu que 40% dos óbitos ocorrem nesses locais.
8- A política de atribuição de mortes não é consistente. Depois do falecimento, vale a pena desperdiçar um teste valioso? Por isso, os médicos podem não mencionar a covid-19 como uma causa do óbito. É uma decisão pessoal, especialmente quando alguém já está doente. Isso pode ter um efeito muito grande nos dados em certos ambientes, como centros de reabilitação e lares.
9- Autoridades podem ter incentivos para ocultar casos de coronavírus. China, Indonésia e Irão estão a ser analisados minuciosamente devido às suas estatísticas. "Maquilhar dados" também não é inédito noutros contextos nos EUA. Portanto, não assuma que as autoridades estão acima da manipulação.
10- O que acontece num local, ou em média, pode não ser aplicável em todos os lugares. Alguns pequenos estudos sugerem que a taxa de mortalidade por Covid-19 é de cerca de 1% da população infectada. Mas isso não significa que será o mesmo nos EUA ou na cidade de Nova Iorque. Áreas específicas podem ter taxas de mortalidade muito piores, simplesmente porque os seus sistemas de saúde não são tão abrangentes ou as suas populações têm mais doenças crónicas. Os EUA têm muitas áreas poluídas que parecem tornar as pessoas mais vulneráveis ??à infecção e mais doentes quando adoecem. Como vimos nos últimos dias, essas disparidades está a afetar desproporcionalmente pessoas não brancas.
Por mais atraente que seja acompanhar a contagem, os números verdadeiros podem não ser conhecidos até muito tempo depois. Os testes têm de ser feitos sistematicamente, mesmo em pessoas assintomáticas. Para mortes, números precisos podem nunca aparecer. É possível estimar usando o número de mortes inesperadas em comparação com o ano anterior. Mas mesmo isso não é o ideal, porque os confinamentos podem suprimir outros tipos de mortes - acidentes de trânsito, por exemplo -, obrigando pessoas a ficar em casa.
Não me interpretem mal: acompanhar dados oficiais não é uma completa perda de tempo e atenção. Os números podem dar uma noção do que está a acontecer, desde que reconheçamos falhas.
Cathy O’Neil é matemática e trabalhou como professora, analista de hedge funds e cientista de dados. Fundou a ORCAA, uma empresa especializada em auditoria de algoritmos, e é autora de "Weapons of Math Destruction".
Esta coluna não reflete necessariamente a opinião da Bloomberg LP e de seus proprietários.