Problema de Data Science: Melhorar o pipeline de dados e os modelos de previsão para apoiar a priorização da resposta a incêndios florestais, aumentando a eficácia na tomada de decisão em tempo real e na organização de recursos
Os incêndios florestais representam um dos maiores desafios nacionais para Portugal, dada a sua imprevisibilidade e a multiplicidade de variáveis envolvidas. A investigação revela que, embora a maioria dos incêndios seja controlada na fase inicial, uma pequena percentagem que escapa ao primeiro ataque é a que provoca a maior parte dos danos.
Dados que escapam nas fases iniciais exigem que os bombeiros desloquem recursos e estratégias adicionais, aumentando assim a dificuldade de controlo e os impactos. A capacidade de prever estes cenários é crucial para apoiar a eficácia na organização de recursos. Com base nas fundação criada pelas equipas do hackathon de 2023, que já tinham desenvolvido uma aplicação que prediz quais os incêndios que serão prioridade utilizando um modelo de aprendizagem automática (XGBoost), o objetivo neste hackathon era ultrapassar algumas das limitações, nomeadamente a quantidade de dados, a qualidade do pipeline de tratamento de dados e a eficácia do modelo de previsão.
Este era um problema particularmente complexo, já que exigia o tratamento de três tipos de dados: os dados meteorológicos (dinâmicos), os dados geoespaciais (estáticos) e os registos de ocorrências de incêndios, sendo ainda preciso que o modelo pudesse ser atualizado automaticamente para se manter preciso. Neste Hackathon, a equipa ficou encarregue de acrescentar fontes de dados, de melhorar o pipeline de tratamento de dados para atualizações contínuas, e de desenvolver um modelo secundário que funcione sem a chegada de apoio externo.
O trabalho incluiu a criação de procedimentos automatizados para a atualização semanal de dados, a sua limpeza e tratamento, sendo o objetivo final a otimização de todo o pipeline — da recolha de dados até à aplicação. Uma vez que a época de incêndios em Portugal se inicia habitualmente em julho e se prolonga por 15 semanas, o modelo atualizado é atualizado anualmente, sendo sugerida uma nova atualização em maio.
Detalhes do Hackathon
- Parceiro: Autoridade Nacional de Emergência e Proteção Civil
- Domínio: Combate a Incêndios Florestais
- Ano: 2024
- Membros da Equipa: Diana Martins, Inês Schwartz, Maria Dolgaya, Sofia Rodrigues
- Orientadores ISA: Akli Benali, Ana Russo, Rui Figueira
- Orientadores Parceiro: Alexandre Penha, Carlos Mota, Mário Silvestre
- Github: https://github.com/isa-ulisboa/greends-hack2024-wildfire