Modelo Autorregressivo Periódico - Par(p)

o ajuste do modelo Par(p) para cada uma das usinas principais do Sistema Interligado Nacional (SIN) envolve uma série de passos mostrados na Fig..

../_images/ajuste-parp.jpg

Fig. 2 Fluxograma para ajuste do modelo Par(p)

A seguir estes passos serão explicados detalhadamente.

Cálculo das Estatísticas Históricas

Para a estimação do modelo Par(p) inicialmente definem-se as estatísticas históricas da série temporal.

Para uma série temporal \(Z_t\) podermos estimar os seguintes índices estatísticos:

Média Amostral:

(2)\[\mu = \frac{1}{T} \sum_{t=1}^{T}Z_{t}\]

O desvio padrão amostral mede o grau de dispersão da amostra em torno da média:

(3)\[\sigma = \sqrt{\frac{1}{T} \sum_{t=1}^{T}(Z_{t} - \mu)^2}\]

A assimetria mede o quanto a distribuição de probabilidade de uma variável aleatória se desvia da distribuição normal. Em outras palavras, ela indica se a distribuição é simétrica ou não.

A (4) descreve o cálculo da assimetria utilizando o Coeficiente de Assimetria de Pearson 1. Se o resultado for positivo, indica uma assimetria positiva (cauda direita), enquanto se for negativo, indica uma assimetria negativa (cauda esquerda). Se for zero, a distribuição é simétrica.

(4)\[\gamma_t = \frac{T}{(T-1)(T-2)} \sum_{t=1}^{T}(\frac{Z_{t} - \mu}{\sigma})^3\]

Se o resultado for positivo, indica uma assimetria positiva (cauda direita), enquanto se for negativo, indica uma assimetria negativa (cauda esquerda). Se for zero, a distribuição é simétrica.

A covariância mede a extensão da relação linear entre duas variáveis aleatórias separadas por um intervalo de tempo. No contexto hidrológico, a covariância de ordem um expressa a relação linear entre a vazão de um ano e a vazão do ano anterior, conforme indicado pela equação (5):

(5)\[cov(Z_t,Z_{t-1}) = \frac{1}{T} \sum_{t=2}^{T} (Z_t - \mu_m)(Z_{t-1} - \mu)\]

A covariância tem dimensões proporcionais ao quadrado da variável Z. Para uma avaliação mais direta, normaliza-se a covariância de ordem um pelos desvios padrão das variáveis, resultando na correlação de ordem um, conhecida como dependência serial anual:

(6)\[\rho(1) = \frac{cov(Z_t,Z_{t-1})}{\sigma^2}\]

Se o valor desta correlação for igual a 1, indica que a vazão de um ano é perfeitamente prevista pela vazão do ano anterior. Um valor de -1 sugere uma correlação perfeita, mas com a inversão da relação entre as variáveis. Um valor próximo de zero indica falta de dependência linear entre as variáveis.

Além disso, é possível medir a dependência espacial entre as vazões afluentes a duas usinas hidroelétricas através da correlação “cruzada” ou correlação espacial entre elas. Por exemplo, a correlação espacial anual entre as vazões afluentes às usinas hidroelétricas A e B é calculada pela seguinte equação:

(7)\[\rho_{(a,b)} = \frac{\frac{1}{T} \sum_{t=1}^{T} (Z_t^{(a)} - \mu^{(a)})(z_t^{(b)} - \mu^{(b)})}{\sigma^{(a)} \sigma^{(b)}}\]

Em geral, os processos físicos em escala mensal exibem comportamentos periódicos devido aos ciclos sazonais. Cada período possui características estatísticas próprias, como média, desvio padrão e estrutura de correlação sazonal.

A média amostral de cada mês é dada por (8).

(8)\[\mu_m = \frac{1}{N} \sum_{i=1}^{N} Z_{im}, m = 1,...12\]

De forma análoga o desvio padrão amostral de cada mês é dado por (9).

(9)\[\sigma_m = \sqrt{\frac{1}{N} \sum_{i=1}^{N} (Z_{im} - \mu_m)^2}, m = 1,...12\]

E a assimetria de cada mês é dada por (10).

(10)\[\gamma_m = \frac{N}{(N-1)(N-2)} \sum_{i=1}^{N}(\frac{Z_{im} - \mu_m}{\sigma_m})^3, m = 1,...12\]

Em processos mensais é comum definir um conjunto de valores que descreva a estrutura de correlação linear de um dado mês com os meses anteriores. Esses valores podem ser definidos pela correlação de ordem 1, que descreve a dependência linear da variável aleatória de um mês qualquer \(m\) com a variável aleatória do mês imediatamente anterior \(m-1\); correlação de ordem 2, que descreve a dependência linear da variável aleatória do mês \(m\) com a variável aleatória do mês \(m-2\); …; correlação de ordem \(k\), que descreve a dependência linear da variável aleatória do mês \(m\) com a variável aleatória do mês \(m-k\). A esse conjunto de valores dá-se o nome de função de autocorrelação do mês \(m\), também conhecida por dependência serial mensal.

Os valores amostrais desses índices estatísticos podem ser obtidos pela expressão (11).

(11)\[\rho_k^m = \frac{1}{N}\sum_{i=1}^{N}[(\frac{z_{im}-\mu_m}{\sigma_m})(\frac{{z_{i,{m-k}} - \mu_{m-k}}}{{\sigma_{m-k}}})] , m = 1,...12\]

Modelo Autorregressivo Periódico - Par(p)

Séries hidrológicas têm como característica o comportamento periódico das suas propriedades probabilísticas, como por exemplo a média, a variância, a assimetria e a estrutura de autocorrelação.

Essas séries costumam ser representadas por modelos autorregressivos periódicos, PAR(\(p_m\)), onde \(p_m\) é a ordem do modelo para o período sazonal \(m\), ou seja, é o número de termos autorregressivos do modelo para aquele período.

No caso de séries com sazonalidade mensal temos \(m = 1, ..., 12\) e o modelo PAR(\(p_m\)) pode ser descrito matematicamente pela expressão (12) 2.

(12)\[(\frac{{Z_t}-{\mu_m}}{\sigma_m})= {\phi_1}^m.(\frac{Z_{t-1}-\mu_{m-1}}{\sigma_{m-1}})+\dots+{\phi_{p_m}}^m.(\frac{Z_{t-{p_m}}-\mu_{m-{p_m}}}{\sigma_{m-{p_m}}})+{a_t}\]
Tabela 7 Termos do Modelo PAR(p)

Símbolo

Descrição

\(t\)

índice de tempo em função do ano \(i (i = 1, 2, ..., N)\) e do mês \(m\), totalizando T períodos

\(m\)

mês

N

número de anos

T

número total de períodos

\(Z_t\)

valor da série no período \(t\)

\(\mu_m\)

média de afluência no mês \(m\)

\(\sigma_m\)

desvio padrão no mês \(m\)

\(p_m\)

ordem do modelo autoregresivo no mês \({m}\)

\(\phi_{p_m}\)

operador autoregressivo de ordem \({p_m}\)

\(a_t\)

ruído independentes com média zero e variância \({\sigma_{a_m}}^2\)

A variância do resíduo (\(\sigma_{a_m}^2\)) é dada por (13).

(13)\[\sigma_{a_m}^2 = \sigma_{m}^2 (1 + \sum_{i=1}^{p_m} \rho_i^m)\]

Identificação da Ordem do Modelo

A identificação da ordem \(p\), em cada mês \(m\), para o modelo PAR(\(p_m\)) é realizada por meio da análise da função de autocorrelação parcial (PACF). Em um modelo PAR, a PACF possui valor significativo apenas para os primeiros \(p\) lags. Por exemplo, se a PACF mostra uma correlação significativa apenas no lag 1 e não em lags subsequentes, isso sugere que um modelo PAR de ordem 1 pode ser apropriado para modelar a série temporal.

Para determinar a PACF é, necessário estabelecer o número máximo de períodos de dependência. Quando aplicado a um modelo adaptado para a periodicidade mensal das afluências, esse limite máximo corresponde ao número de meses do ano menos 1, ou seja, 11.

Neste caso, obtém-se a autocorrelação (\(\rho_{m}(k)\)) para cada \(k = 1,\dots,11\). Para cada \(k\) verifica-se se o valor da autocorelação é significativo em relação a um intervalo de confiança estabelecido. No modelo PAR(p) do CEPEL é considerado um intervalo de confiança de 95% com um tamanho da amostra igual ao número de anos do histórico de afluências.

Uma vez identificado o maior valor significativo, o respectivo \(p_m\) é atribuído ao modelo e resolve-se as equações de Yule-Walker para a ordem máxima \(p_m\) de forma a definir os coeficientes \(\phi_{k}^{m}, k = 1,\dots,p_m\).

Cálculo dos coeficientes do modelo Par(p)

Inicialmente, dada a função de autocorrelação (ACF) (11), que calcula a correlação (\(\rho_{m}(k)\)) entre \(Z_t\) e \(Z_{t-k}\) e multiplicando-se ambos os da equação do modelo PAR (12) por \((\frac{{z_{i,{m-k}} - \mu_{m-k}}}{{\sigma_{m-k}}})\) tem-se a expressão (14).

(14)\[ \begin{align}\begin{aligned}E[(\frac{{z_{im} - \mu_m}}{{\sigma_m}})(\frac{{z_{i,{m-k}} - \mu_{m-k}}}{{\sigma_{m-k}}})] = E[(\frac{{z_{i,{m-1}} - \mu_{m-1}}}{{\sigma_{m-1}}})(\frac{{z_{i,{m-k}} - \mu_{m-k}}}{{\sigma_{m-k}}})] + \ldots +\\+ E[(\frac{{z_{i,{m-{p_m}}} - \mu_{m-{p_m}}}}{{\sigma_{m-{p_m}}}})(\frac{{z_{i,{m-k}} - \mu_{m-k}}}{{\sigma_{m-k}}})] + E[a_t(\frac{{z_{i,{m-k}} - \mu_{m-k}}}{{\sigma_{m-k}}})], m = 1,\ldots,12\end{aligned}\end{align} \]

Assim para \(k=1\) a expressão resultante é dada por (15).

(15)\[{\rho_1^m} = {\phi_1^m} + {\phi_2^m}{\rho_1^{m-1}} + {\phi_{p_m}^m}{\rho_{p_{m-1}}^{m-1}}\]

Fixando-se \(m\) e variando \(k\) de 1 a \(p_m\) obtemos um conjunto de equações conhecidas como equações de Yule-Walker. Para um mês \(m\) é dada por (16)

(16)\[\begin{split}\begin{bmatrix} 1 & {\rho_{1}^{m-1}} & {\rho_2^{m-1}} & \dots & {\rho_{(p_m-1)}^{m-1}} \\ {\rho_1^{m-1}} & 1 & {\rho_1^{m-2}} & \dots & {\rho_{(p_m-2)}^{m-2}} \\ {\rho_2^{m-1}} & {\rho_1^{m-2}} & 1 & \dots & {\rho_{(p_m-3)}^{m-3}} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ {\rho_{(p_{m}-1)}^{m-1}} & {\rho_{(p_{m}-2)}^{m-2}} & {\rho_{(p_{m}-3)}^{m-3}} & \dots & 1 \end{bmatrix} \cdot \begin{bmatrix} \phi_{1}^{m} \\ \phi_{2}^{m} \\ \phi_{3}^{m} \\ \vdots \\ \phi_{(p_{m})}^{m} \end{bmatrix}= \begin{bmatrix} \rho_{1}^{m} \\ \rho_{2}^{m} \\ \rho_{3}^{m} \\ \vdots \\ \rho_{(p_{m})}^{m} \end{bmatrix}\end{split}\]

Ao se resolver o sistema linear obtém-se os coeficientes lineares do modelo PAR(p) \(\phi_{k}^{m}, k = 1,\dots,p_m\). O sistema linear é resolvido utilizando-se a Decomposição de Cholesky.

Tratamento de coeficientes negativos

Um coeficiente autorregressivo negativo pode provocar a presença de um coeficiente positivo no corte de Benders (FCF) associado à variável de estado afluência passada.

Coeficientes positivos nos cortes de Benders têm origem nos coeficientes autorregressivos negativos do modelo estocástico de afluências.

Entretanto, a presença de coeficientes autorregressivos negativos não necessariamente implica coeficientes positivos nos cortes de Benders.

Para lidar com os coeficientes negativos o GEVAZP verifica primeiramente se o coeficiente de ordem 1 de um determinado mês é zero. Se for, o modelo é ajustado a ordem zero.

É preciso então verificar o coeficiente do mês que combina o coeficiente do modelo PAR(p) e modelo PAR(p)-A. Se este coeficiente combinado é menor que zero então reduz-se a ordem do modelo. Esta redução ocorre até que não se encontrem mais coeficientes negativos.

Ao reduzir a ordem do modelo, novos parâmetros devem ser estimados. Este procedimento deve ser repetido até que o conjunto de parâmetros de todos os meses não produza contribuição negativa em qualquer mês futuro.

Cálculo dos Resíduos Históricos

Tendo definido a ordem do modelo para o mês \(m\) via PACF e estimados os coeficientes por meio de (16), pode-se calcular os resíduos da série histórica a partir do registro histórico de vazões. Para isso, isola-se o resíduo \(a_t\) na (12), conforme (17).

(17)\[a_t = \frac{Z_t-\mu_m}{\sigma_m} - \sum_{i=1}^{p_m}{\phi_i^m}(\frac{Z_{t-i}-\mu_{m-i}}{\sigma_{m-i}})\]

Um problema comum com usinas hidrelétricas em cascata, onde vazões incrementais podem ser relativamente pequenas, é a geração de vazões negativas. De forma a obter valores positivos de \(Z_t\) é necessário que:

(18)\[Z_t = \mu_m + \sigma_m\sum_{i=1}^{p_m}{\phi_i^m}(\frac{Z_{t-i}-\mu_{m-i}}{\sigma_{m-i}}) + {\sigma_m}a_t \gt 0\]

ou

(19)\[a_t \gt \frac{Z_t-\mu_m}{\sigma_m} - \sum_{i=1}^{p_m}{\phi_i^m}(\frac{Z_{t-i}-\mu_{m-i}}{\sigma_{m-i}})\]

Muitos pesquisadores assumem que os resíduos \(a_t\) apresentam distribuição Normal e uma possível não normalidade pode ser corrigida pela transformação Box-Cox 3. Como as séries sintéticas produzidas serão utilizadas em modelos que calculam as estratégias ótimas de operação de um sistema multireservatórios, baseados em programação dinâmica dual estocástica, o modelo de geração de séries sintéticas deve ser aplicado diretamente à série temporal original e deve ser capaz de lidar com resíduos que apresentam um forte coeficiente de assimetria.

A solução adotada foi ajustar uma distribuição Lognormal com três parâmetros aos resíduos mensais \(a_t\) que será descrito na seção Distribuição Lognormal 3 parâmetros.

1

Karl Pearson. The Grammar of Science. Walter Scott Publishing, London, 1892.

2

M. E. Maceira and C. V. Bezerra. Stochastic streamflow model for hydroelectric systems. In 5th Int. Conf. on Probabilistic Methods Applied to Power Systems -PMAPS. 1997.

3

G.E.P. Box and D.R. Cox. An analysis of transformations. Journal of the Royal Statistical Society, A127:211–252, 1964.