Escrito por Mirla Borges
Publicada em 28/03/2022 ·
419 visualizações
Você sabe o que são séries temporais? Sabia que lidamos o tempo todo com essas séries? E que, além disso, elas podem nos ajudar até a prever o futuro?
Não? Então relaxa, que nesse artigo vou explicar tudo sobre séries temporais.
De maneira bem simples, uma série temporal é qualquer conjunto de dados alocados de maneira sequencial durante um determinado período de tempo, ou seja, um dado que depende do fator tempo. Um exemplo bem comum de série temporal são os valores da temperatura de uma cidade coletados ao longo do tempo, como representado no gráfico de temperatura média ao longo de 10 dias da cidade de Delhi, na Índia:
Figura 01: Dados de temperatura média ao longo do tempo mostrados em tabela (à esquerda) e em gráfico de linha (à direita).
Além desse exemplo, existem várias aplicações bem comuns do nosso dia-a-dia, como as batidas do seu coração em um determinado período de tempo, contagem de infectados por COVID-19 ou influenza, dados de investimentos na bolsas de valores, consumo de energia elétrica de uma região, a variação do valor do real em comparação ao dólar e até o nível de crescimento de espigas de milho em uma fazenda também são classificados como séries temporais.
As séries temporais não se resumem apenas a esses conceitos, existem várias classificações e características presentes nas séries que são importantes de se conhecer.
É possível classificar as séries temporais em determinísticas, estocásticas e caóticas. Uma série determinística não contém aleatoriedade em sua estrutura, ela depende apenas do tempo e, por conta disso, seus valores futuros podem ser determinados. A série estocástica já contém um componente aleatório, o que a faz ter um certo comportamento inesperado e irregular com a presença de um ruído aleatório. Em alternativa, séries caóticas são como as séries estocásticas mas com a existência de uma influência não-linear entre as variáveis do sistema determinístico subjacente, elas são um tipo de série que é baseada a partir de uma equação matemática e por isso, é possível que sejam determinados seus componentes futuros.
As séries temporais também carregam propriedades estatísticas que podem ou não estarem contidas ou serem facilmente percebidas no estudo da série. Entre essas características, estão a tendência, a periodicidade, a sazonalidade, a autocorrelação e o componente aleatório. A tendência é definida como um crescimento ou um decrescimento ao longo de um período de tempo. A periodicidade indica que a série mantém períodos regulares definidos dentro de sua tendência. A sazonalidade são padrões regulares presentes no comportamento da série, ou seja, é uma variação que ocorre em uma frequência fixa. A autocorrelação indica o quanto duas observações em uma mesma série estão linearmente relacionadas. E o componente aleatório é o resíduo aleatório que a série pode conter.
Além de uma classificação de nível de aleatoriedade, temos também uma classificação por convergência, classificando as séries em estacionárias e não estacionárias. A série estacionária se caracteriza por ser uma série convergente, ela tem média constante durante o tempo e não existem tendências altas ou baixas. Já a série não estacionária é o contrário, ou seja, ela se caracteriza por ser uma série divergente e existem variações de tendências.
Em séries estacionárias, a tendência e a autocorrelação são constantes ao longo do tempo e em séries não estacionárias, essas propriedades variam. Dependendo da aplicação, as variações de uma série não estacionária são interessantes de existirem, no entanto, na modelagem preditiva é necessário verificar se essas propriedades estatísticas são constantes. Uma melhor explicação sobre os pontos acima explicados podem ser estudados no artigo Princípios básicos para criar previsões de Séries Temporais do Leandro Rabelo.
O estudo de séries temporais pode ser feito por várias ciências, mas a Ciência de Dados (Data Science) é uma das áreas que mais estuda e se utiliza de séries temporais. As aplicações vão desde o estudo do comportamento da série e quais as implicações que ela pode trazer, até a construção de modelos de Machine Learning que podem gerar várias conclusões e classificações.
Em Data Science, ao se iniciar os estudos de séries temporais, dois tipos de séries são utilizadas: séries temporais univariadas e séries temporais multivariadas. As séries temporais univariadas são séries com apenas uma variável em função do tempo, é o exemplo mostrado anteriormente da temperatura ao longo do tempo, que apenas uma variável (a temperatura) está em função do tempo.
Já as séries temporais multivariadas como pode ser esperado, tem mais de uma variável em função do tempo. Como exemplo, imagine o caso que além de temperatura média ao longo dos dias, existe também a velocidade do vento e um nível de umidade. Nesse caso, existem três variáveis em função do tempo na série temporal:
Figura 02: Dados de temperatura média, umidade e velocidade do vento ao longo do tempo mostrados em tabela (à esquerda) e em gráfico de linha (à direita).
As séries temporais podem ser utilizadas em aplicação de vários modelos de Machine Learning como classificação, clustering e o mais utilizado, previsão.
O modelo de classificação é um algoritmo que busca predizer a identificação de um determinado conjunto de dados. Séries temporais de exames como encefalograma são utilizadas para classificar o resultado para um laudo, a forma do sinal pode indicar problemas como epilepsia, doença do sono, edema cerebral, dentre outros problemas.
Figura 03: Gráfico de um exame de eletroencefalograma. Fonte: neurologie.
Outro exame também comumente utilizado para a classificação é o eletrocardiograma que o modelo pode identificar problemas como infarto no miocárdio, problemas nas válvulas do coração, dentre outros. Além desses exames, outras ondas sonoras, como sons de maquinários e animais, também são utilizadas em modelos de classificação.
O clustering é um tipo de modelo Machine Learning que agrupa os dados segundo características semelhantes. A séries temporais nesse caso, normalmente, são agrupadas em clusters pela características de suas ondas, como no exemplo abaixo, os tipos de clusters k-means agruparam as séries temporais em 3 grupos.
Figura 04: Clustering de ondas sonoras de motor de carro a depender do tipo de modelo para k-means. Fonte: tslearn
Essa técnica também é utilizada em séries temporais de músicas para promover o agrupamento.
A aplicação de séries temporais em previsão é bem mais comum que as aplicações apresentadas anteriormente. O método da previsão, como o nome já diz, permite prever os próximos passos de uma série. Essa aplicação é muito observada no mercado financeiro para prever as próximas tendências do mercado como a variação do dólar ou os investimentos na bolsa de valores. Um exemplo desse modelo em uma série temporal é a previsão da continuação da série a partir do ano de 1960.
Figura 05: Gráfico de uma série temporal de vendas com os dados reais e previstos.
Séries temporais são um conteúdo simples, principalmente por que ele já está incluído no nosso dia-a-dia. As características e classificações das séries permitem que elas sejam muito utilizadas em modelos de Machine Learning, como classificação, agrupamentos e previsão.
A análise de séries temporais permite que possamos prever e classificar dados úteis a partir dos padrões encontrados na rede. Existem outras várias formas de estudar séries temporais e suas aplicações de que podem ser encontradas em artigos, livros e plataformas de ensino que acredito que podem trazer muito conhecimento adicional.