UNO Julho 2020

Modelos preditivos em um mundo VUCA

A possibilidade de um evento catastrófico ou o resultado de umas eleições são paradigmas de como a gestão da volatilidade, a incerteza, a complexidade e a ambiguidade requer, hoje mais que nunca, uma tomada de decisões baseada em dados, na qual os modelos preditivos adquirem uma enorme relevância.

O furacão Sandy tocou terra em Nova Jersey, ao sul de Nova York, em 29 de outubro de 2012. Seu passo deixou mais de 50 vítimas mortais e ao redor de 19 bilhões de dólares em danos assegurados. O desafio dos modelos preditivos era, e segue sendo, enorme; não em vão, devem lidar com bases de dados imensas integradas com sistemas de informação geográfica. Essas bases de dados incluem as condições atmosféricas, temperatura do mar, elevação do terreno e cobertura vegetal e edificada.

“Para a campanha de reeleição de 2012, a equipe de Obama contou com um investimento de mais de 1 bilhão de dólares em ciência de dados”

Além de gerenciar toda essa informação, o processo deve ser executado em tempo praticamente real. O seguimento do furacão Sandy reflete a metodologia completa de um projeto de ciência de dados, tal e como o aplicamos hoje: estabelecimento das perguntas a responder (Impactará em zonas povoadas? Quando o fará? Com que intensidade? Quais são os riscos potenciais?), análise exploratória de dados (velocidade do vento, pressão atmosférica, trajetória seguida, temperatura atmosférica e do mar), estabelecimento dos modelos preditivos (que considerem não somente os dados anteriores mas milhares de simulações de trajetórias, considerando possíveis modificações nas variáveis, tanto
de forma combinada como de forma individual, assim como os obstáculos naturais e arquitetônicos que o furacão pode encontrar a seu passo, que poderiam afetar a sua intensidade e trajetória), interpretação dos resultados (em escalas de probabilidade, desde cenários pouco prováveis a quase seguros) e, algo essencial em todo projeto de ciência de dados, e mais ainda em um onde a vida das pessoas está em jogo, a comunicação dos resultados. Tão importante resulta este ponto que a NOAA e o NWS (os departamentos responsáveis do seguimento de furacões no Atlântico e do serviço meteorológico norte-americano) modificaram seus protocolos de alerta e contato, tanto internos como externos, segundo avançava o furacão. Se eliminaram as apresentações em PowerPoint e PDF e se substituíram por informações na intranet, em formato html. Da mesma maneira, o NWS se centrou na comunicação dos impactos: lugares e datas previsíveis, riscos envolvidos (ventos, incremento do nível das águas, precipitações), enquanto que a NOAA modificou todos seus protocolos de comunicação através de internet, criando páginas específicas que, durante o desenvolvimento do furacão, chegaram praticamente a alcançar os 1.300 milhões de acessos, enquanto utilizava massivamente Facebook e Twitter para informar dos acontecimentos.

Somente uma semana depois do Sandy, outro furacão tomava conta das manchetes na imprensa. No dia 6 de novembro, Barack Obama era reeleito como presidente dos EUA. Um comunicador nato que teve a profissionalidade e humildade de confiar sua reeleição a uma equipe que integrava tanto a comunicação tradicional como as novas técnicas surgidas da ciência de dados e da psicologia behaviorista.

Para a campanha de reeleição de 2012, a equipe de Obama contou com um investimento de mais de 1 bilhão de dólares em ciência de dados. Os quatro anos na Casa Blanca haviam suposto uma transformação tecnológica e cultural sem precedentes na sociedade norte-americana. Se em 2008 Facebook contava com 33 milhões de usuários nos EUA, e uns 135 milhões a nível mundial, em 2012 a cifra alcançava os 166 milhões, com mais de 900 milhões a nível mundial.

“Uma tarefa primordial: desenvolver métricas que permitissem um rigoroso conhecimento do comportamento do votante”

Ao mesmo tempo que Obama jurava seu primeiro mandato, o CND contratava a Dan Wagner como diretor de Analytics com uma tarefa primordial: desenvolver métricas que permitissem um rigoroso conhecimento do comportamento do votante. Nas midterms de novembro de 2010, Wagner não somente predisse a derrota, mas que a antecipou em cinco meses. A partir da confirmação de suas predições, os modelos preditivos de Wagner se converteram no “padrão ouro” do partido. Somente em televisão, o orçamento ascendia a 300 milhões de dólares. Desenvolveram um software, o Optimizador, que dividia o dia em 96 períodos de 15 minutos para, desse modo, lançar a mensagem que melhor se adaptava, não já ao segmento demográfico associado ao programa, mas à audiência concreta que estimavam em cada momento, conseguindo um retorno do investimento muito mais elevado que os métodos tradicionais.

Algo estava passando, e o pior de tudo, para o diretor da equipe de ciência de dados de Romney, Alexander Lundry, era não poder explicá-lo. De forma diferente na aproximação ao mercado publicitário era evidente: enquanto que o Partido Republicano gastava seu orçamento em redes de âmbito supra estatal, o Democrata o fazia em programas inesperados, em intervalos horários estranhos, rompendo os moldes estabelecidos, atuando out of the box. Eric Schmidt, que no momento era presidente do Google, declarou que se tratava “da campanha eleitoral melhor executada da história”.

Sirvam estes dois acontecimentos, extraídos de Alquimia (Deusto, 2019), para avançar duas questões fundamentais no sucesso em um cenário VUCA como o atual. Primeiro, o modelo preditivo é somente uma parte do projeto de ciência de dados, e, como tal, repousará sempre na correta definição das perguntas e a adequada qualidade dos dados. Segundo, é essencial uma correta combinação desses modelos com uma equipe humana versado na interpretação e a comunicação do conhecimento adquirido, os data translators. Junto com o imprescindível guia ético que nos acompanhará em todo o processo, o investimento conseguirá o fruto desejado.

 

Juanma Zafra
Co-diretor do Mestrado em Data Science para Finanças do CUNEF, do programa executivo de data science e transformação digital e do Mestrado de Data Science; também é Chief Data Officer e co-diretor do Analytics Lab do mesmo centro
Elaborou e orientou os programas de formação in company de Desenvolvimento Atuarial para a MAPFRE, de Ciência de Dados para os CATC de Lanzarote e de Transformação Digital para o Exército Rural. É autor de dois livros: Retorno al Patrón Oro (Deusto, 2014) e Alquimia (com Ricardo A. Queralt, Deusto, 2019), uma das referências atuais em espanhol sobre a importância que a ciência de dados, o big data e a analítica têm em todos os setores empresariais. [Espanha]

Artigos publicados na UNO

Queremos colaborar com você

Qual o seu desafio?

Quer fazer parte da nossa equipe?

Quer que a LLYC participe do seu próximo evento?