Page 28 - newDATAmagazine® | 15>07>2022
P. 28
As alternativas existentes, como dados de entender e é facilmente transformado na tal
espiras, por exemplo, limitariam o uso do ideia subjetiva do que é “muito ou pouco”
indicador a zonas pré-definidas, cuja utilidade trânsito. Mas havia um problema – quando o
seria discutível. trânsito está parado, o atraso é reportado com
Para a recolha foi criado um serviço que, a o valor -1, indicando que o valor é
cada 5 minutos, recolhia dados do Waze indeterminado. A solução passou por
disponibilizados no portal de dados abertos da substituir por um valor que resulta da soma do
EMEL, e que a cada hora usava a API do IPMA valor máximo com N vezes o desvio padrão
para obter informações meteorológicas. (em que N representa o número de vezes que
Depois da sua análise e da frequência de se pretende aumentar o valor resultante em
refrescamento observada, foi decido usar relação ao seu máximo). Para avaliação,
como grão temporal 30 minutos, sendo os recorremos a métricas bem conhecidas como
2
dados agregados. Esta decisão está alinhada R , o erro absoluto médio, o erro quadrático
com o objetivo de usar o resultado deste médio e o erro médio percentual absoluto.
trabalho em produção. Como resultado deste Verificou-se que o aumento do N não reduzia o
trabalho obteve-se um conjunto de dados que erro de forma significativa, mas que
se encontra disponível de forma pública (DOI: transformava a distribuição dos dados. Por
10.13140/RG.2.2.22001.35689). isso foi decidido avançar com N=1.
Este estudo centrou-se em zonas
MODELO DE PREVISÃO consideradas mais críticas, nomeadamente os
Um dos aspetos inovadores da nossa acessos à cidade, como a ponte 25 de Abril e a
abordagem para resolver este desafio foi a Calçada de Carriche, por exemplo. O modelo de
escolha do parâmetro cujo valor vamos previsão foi construído com dados de 1
estimar. Sendo um modelo preditivo semana, 2 e 4 semanas. Os resultados
(regressão), o que obtemos como resultado da mostraram que o custo computacional foi
aprendizagem automática é a codificação das significativo, não se refletindo no desempenho
relações, muitas vezes não lineares, entre um e qualidade dos resultados obtidos quando
conjunto de variáveis, ditas independentes, e a consideramos registos de 4 semanas.
variável a estimar – dependente. Os trabalhos
existentes na literatura usam variáveis como o VISUALIZAÇÃO DO INDICADOR
nível de congestionamento (número que varia
entre 0 e 5) ou a dimensão da cauda da fila,
para estimar o tráfego numa determinada via.
No entanto, a perceção do nível de trânsito é
subjetiva; a perceção do trânsito em metros
(ou quilómetros, por vezes) também não ajuda
na perceção da fluidez.
Decidiu-se, por isso, usar a variável “atraso”,
medida em segundos. O tempo (sempre o
tempo...) gasto numa determinada zona do
percurso é algo que todos nós conseguimos Figura 1. Exemplo do dashboard de monitorização
de fluidez de tráfego
28 newDATAmagazine.com

