SOBRE

Kaiser Fung foi líder de ciência de dados em várias empresas, incluindo SiriusXM, Vimeo e American Express. Ele é o autor de Os números governam seu mundoe blogs em Junk Charts.

No estágio inicial de uma epidemia, o teste direcionado leva a um tradeoff desconfortável. Como ex-cientista de dados de grandes empresas, costumo pensar nisso em um contexto de negócios. No passado, desenvolvi estratégias de segmentação que permitem aos profissionais de marketing selecionar quais clientes receberão ofertas especiais, como "compre uma, ganhe uma de graça". Em vez de simplesmente oferecer o acordo a todos, identificamos um subconjunto de clientes que provavelmente consideravam mais dispendioso como resultado do desconto. O objetivo é enviar a oferta certa para as pessoas certas, na hora certa. Essa estratégia de segmentação reduz o volume de ofertas de marketing, levando a menos "alarmes falsos" ou promoções entregues a clientes que não precisam de motivação extra, resultando no péssimo paradoxo de vender mais e ganhar menos. Mas as ofertas direcionadas também custam as vendas perdidas. Nosso sistema preditivo - mesmo quando informado por décadas de dados - não é perfeito, e algumas das pessoas excluídas das ofertas os receberiam.

Mas, embora essa possa ser uma estratégia eficaz para as BOGOs, essa triagem não faz sentido para a saúde pública. Para ser franco, a triagem reduz o volume de testes e leva a menos "alarmes falsos" ou pessoas não infectadas, recomendadas para testes. Mas isso também ocorre às custas de aumentar a probabilidade de que as pessoas infectadas sejam ignoradas. Um alarme falso, ou alguém que não está infectado, mas é considerado de alto risco e solicitado a testar, não ocorre sem uma recomendação de teste. Se menos pessoas se qualificarem para o teste de coronavírus, menos não infectado fará o teste. Porém, mais exclusões também significam que um número maior de indivíduos infectados não será considerado elegível para teste. Quando o objetivo é conter as transmissões, um alarme falso é menos prejudicial do que sentir falta de alguém que está abrigando o vírus. Afinal, positivos perdidos são pessoas infectadas que foram informadas de que não precisam de testes e, portanto, podem espalhar o vírus sem saber.

O teste de triagem funciona - no sentido de administrar o teste certo às pessoas certas - apenas se o método subjacente usado para prever quem deve ser testado for altamente preciso. Dado o quanto ainda não sabemos sobre esse novo vírus e nossa incapacidade de rastrear sua propagação, não é possível fazer essas previsões com segurança. Em vez disso, a atual estratégia de segmentação cria uma falsa sensação de segurança. As pessoas que dizem que não precisam de um teste acreditam que não estão infectadas. Comunidades com baixa contagem de testes positivos são consideradas refúgios seguros quando, na realidade, testes de triagem ineficazes perdem pessoas infectadas. Essa falácia estatística às vezes é descrita como: "ausência de evidência não é evidência de ausência". Todos os modelos usados ​​para prever a propagação desta doença são treinados em dados históricos, as informações que reunimos sobre infecções até o momento. Esses modelos são atualizados continuamente à medida que novos dados chegam. No início de qualquer epidemia, esses dados são escassos e os modelos fracos. Mas a situação atual é pior que isso: não estamos realizando muitos testes, no geral, e os que estamos realizando - em subgrupos triados da população - entregam dados tendenciosos. Isso significa que os modelos iniciais usados ​​para decidir quem será testado são altamente imprecisos.

Leia toda a nossa cobertura de coronavírus aqui.

Pior ainda, as pessoas que são consideradas "seguras" pelo atual modelo preditivo - aquelas que não viajaram, não tiveram conhecimento de estar em contato direto com alguém que já teve um resultado positivo ou que não apresenta sintomas graves - não serão testadas e, portanto, eles continuarão a ser totalmente excluídos do conjunto de dados. Voltando ao exemplo comercial, se o profissional de marketing enviar ofertas apenas para clientes do sexo feminino, todas as novas entradas no banco de dados virão de mulheres, tornando praticamente impossível a seleção de homens para negócios futuros, mesmo que a empresa lance uma nova linha de moda masculina.

Quando apenas pessoas com sintomas graves são testadas, o modelo preditivo torna-se cego para aqueles que não apresentam sintomas leves ou leves. Mas, como aprendemos, não são necessários sintomas graves para a disseminação da comunidade do Covid-19. De fato, os médicos disseram que esse novo coronavírus se torna altamente contagioso no início do período de incubação, às vezes antes mesmo de o paciente apresentar algum sintoma. Também há ampla evidência de outros países, especialmente da Coréia do Sul, de que testes agressivos e extensivos permitem identificar grupos de casos, facilitando a disseminação para outras comunidades e mitigando a necessidade de bloqueios em todo o país. A distorção dos dados nos EUA só levará a mais erros de política.

Em outras palavras, o mundo enfrenta uma troca clássica de explorar versus explorar. Uma estratégia direcionada favorece a exploração: pressupõe confiança de que temos conhecimento suficiente para tomar ações decisivas agora. Um regime amplo de testes, por outro lado, enfatiza a exploração: é mais apropriado quando ainda estamos incertos sobre as informações que temos.

Nos meus trabalhos anteriores, meus colegas de marketing se preocupavam com o fato de nosso modelo preditivo ser muito seletivo, deixando muito dinheiro em cima da mesa. A única maneira de aliviar essa preocupação era enviar promoções para um pequeno grupo de clientes que nosso modelo de segmentação não recomendava. Poderíamos observar com facilidade se os clientes que receberam as ofertas fizeram uso dos descontos, mas não sabíamos se nosso modelo preditivo estava fazendo exclusões incorretas, já que aqueles excluídos não receberam a promoção. É impossível determinar quanto alguém teria comprado se tivéssemos lhe enviado um desconto - eles teriam comprado o mesmo ou mais? Da mesma forma, no caso de testes para o Covid-19, se nunca testarmos alguém, nunca saberemos se eles são portadores, a menos que, é claro, o indivíduo mais tarde fique muito doente. A ampliação do escopo dos testes permite que a comunidade médica produza os dados de controle, acompanhe o progresso e faça as correções do curso. Em uma operação em andamento, devemos ajustar o grau de exploração para reagir ao estado de nosso conhecimento. Com tanto desconhecido, explorar deve ser priorizado. Isso significa testes mais amplos.


Opinião WIRED publica artigos de colaboradores externos que representam uma ampla variedade de pontos de vista. Leia mais opiniões aqui. Envie um artigo para [email protected].


Mais do WIRED sobre Covid-19