Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return...

83
Primeiro tempo de retorno para processos β -mixing Erika Alejandra Rada Mora Tese apresentada ao Instituto de Matemática e Estatística da Universidade de São Paulo para obtenção do título de Doutor em Estatística Programa: Estatística Orientador: Prof. Dr. Miguel Natalio Abadi Durante o desenvolvimento deste trabalho o autor recebeu auxílio financeiro da CAPES/CNPq São Paulo, 23 maio de 2014

Transcript of Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return...

Page 1: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

Primeiro tempo de retorno paraprocessos β−mixing

Erika Alejandra Rada Mora

Tese apresentadaao

Instituto de Matemática e Estatísticada

Universidade de São Paulopara

obtenção do títulode

Doutor em Estatística

Programa: EstatísticaOrientador: Prof. Dr. Miguel Natalio Abadi

Durante o desenvolvimento deste trabalho o autor recebeu auxílio financeiro daCAPES/CNPq

São Paulo, 23 maio de 2014

Page 2: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode
Page 3: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

Primeiro Tempo de Retorno paraProcessos β−Mixing

Esta versão da tese contém as correções e alterações sugeridaspela Comissão Julgadora durante a defesa da versão original do trabalho,realizada em 23/05/2014. Uma cópia da versão original está disponível no

Instituto de Matemática e Estatística da Universidade de São Paulo.

Comissão Julgadora:

• Prof. Dr. Miguel Natalio Abadi (orientador) - IME-USP

• Prof. Dr. Anatoli Iambartsev - IME-USP

• Prof. Dr. Jesús Enrique Garcia - IMECC - UNICAMP

• Prof. Dr. Alexandro Giacomo Grimbert Galo - IM-UFRJ

• Prof. Dr. Yuri Suhov - University of Cambridge

Page 4: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode
Page 5: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

Dedicado aJavi

i

Page 6: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

ii

Page 7: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

Agradecimentos

Ao Professor Miguel Abadi pelo apoio durante o doutorado. Obrigada por me orientar,por suas indicações, por sua paciência infinita e por sua amizade. Sem ele este trabalho nãoteria sido possível. Aos membros da Comisão Julgadora pelas observações e sugestões feitasque ajudaram a melhorar esta tese.

À Cordinação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) e ao ConselhoNacional de Desenvolvimento Científico e Tecnológico (CNPq) pelo apoio financeiro duranteo desenvolvimento deste trabalho.

A Javi, aunque la palabra gracias se queda bastante corta. GRACIAS por querer compar-tir parte de su vida conmigo. Por ser mi novio, mi amigo, mi compañero. Por haber hechoun doctorado en paciencia al lado mio. Por su amor y dedicación. Su compañia durante estosaños ha sido fundamental. GRACIAS.

A mi familia em Medellín, gracias por haberme apoyado en mis estudios. Gracias porentender mi ausencia y darme fuerzas. A mi papá gracias porque sin él y su esfuerzo nohabría llegado tan lejos. Su partida me dió fuerza y espero que en su eterno reposo, sepa queesta tesis es para él. A mi mamá por su apoyo incondicional durante toda mi vida. A mihermano y amigo Andrés y a mi prima, hermana y amiga Sandra por cubrir mi ausencia.No saben cuanto me han ayudado. A mi hermano Eber por creer en mi. A mis tias Eugenia,Claudia, Lucia e Inés y a mi prima Johana gracias por ese cariño que sentí a pesar delos kilometros y a mi mamita Zoraida que rezaba por mi, porque sabía que yo no lo haría.A Nicolás, mi lindo ahijadito, por esperarme y recibirme en cada viaje con ese cariño tangrande.

A mis amigas Sandra, Lina, Oliva, Lenis y Kta, a las que tengo internadas en el alma ya las que simplemente amo, agradezco inmensamente por hacer que esa amistad que tenemosno se muera con la distancia. Me sostuvieron en momentos muy difíciles.

Aos meus queridos amigos em Brasil, Paula, Sandra Zapata, Cristian, Pablo, Naty, San-dro, Rodrigo, Nubia, Deissy, Isa, Jorge, Diane, Ander, Jaime, Enrique, Berna, Sebas, Alex H,Alex V, Susana, Mariana, Thiago, Álvaro, Priscila, John Castillo, Noely e Pedro, além dos

iii

Page 8: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

iv

meus queridos vizinhos Jonatan e Ana, muiiito obrigada pelos momentos compartilhados epela amizade. Vocês, de um jeito ou de outro, contribuíram no meu doutorado e sem vocêsteria sido muito mais complicado.

A meu amigo Elton pela correção do português da tese (os erros que ainda estão sãominha culpa). A Jorge, Daniel Azeredo e Kta por me ensinar a simular e a Liliam por meajudar com uns arquivos de matlab. Obrigradão.

Aos Professores Antonio Galves, Luis Renato Fontes, Fabio Machado e Viviana Giam-paoli por sua ajuda burocrática na universidade. Muito obrigada.

Aos funcionarios do Numec e da CPG, obrigada por facilitar com seu trabalho o meupasso pelo instituto.

Existem muitas pessoas que me ajudaram nestes anos de doutorado e que gostaria deagradecer aqui mas acho que falta muito espaço. Muitíssimo obrigada.

Page 9: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

Resumo

RADA, M. E. A. Primeiro Tempo de Retorno para Processos β−Mixing . 2014. 83 f.Tese - Instituto de Matemática e Estatística, Universidade de São Paulo, São Paulo, 2014.

Seja χ um alfabeto finito ou infinito enumerável, e considere χn como o conjunto de sequên-cias de tamanho n.

No presente trabalho, nós consideramos a função Tn, definida en χn e tomando valoresentre 1 e ∞. Tn será o primeiro tempo que demora sequência de tamanho n, digamos ω, emaparecer de novo sobre uma sequência infinita do processo que começa com ω. Este tempoé conhecido como o tempo de retorno. Seja Sn(ω) = n − Tn(ω) o nosso objeto de estudo,definido também em χn e tomando valores entre −∞ e n− 1.

A função Sn foi colocada em evidência, entre outros casos, na análise estatística da Re-corrência de Poincaré, e possui relação explícita com a entropia do processo.

Abadi e Lambert, [5] e [19] provaram a convergência da distribuição de Sn, quandoa sequência é escolhida de acordo com a medida produto de n variáveis aleatórias inde-pendentes e identicamente distribuídas no alfabeto χ e como consequência, mostraram aconvergência da esperança de Sn. Nosso trabalho consiste em generalizar o trabalho feitopor Abadi e Lambert para processos com uma condição de dependência β−Mixing.

Palavras-chave: β−Mixing, Tempo de retorno, Sobreposição, Convergência.

v

Page 10: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

vi RESUMO

Page 11: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

Abstract

RADA, M. E. A. First Return Time of the sequence under β−Mixing conditions.2014. 83 f. Tese - Instituto de Matemática e Estatística, Universidade de São Paulo, SãoPaulo, 2014.

We consider the set of finite sequences of length n over a finite or countable alphabet χ. Weconsider the function defined over χn, Sn = n−"the first return".

Abadi and Lambert, [5] and [19], computed the exact distribution and the limiting distri-bution of the Sn when the sequence is generated by independent and identically distributedrandom variables.

Our work consists in a generalization of the work done by Abadi and Lambert in [5] and[19], to processes that verify the β−Mixing condition and {Xn}n∈N takes values over finiteor countable alphabet.

Keywords: β−Mixing, Return times, Overlapping, Convergence.

vii

Page 12: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

viii ABSTRACT

Page 13: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

Sumário

Resumo v

Abstract vii

Lista de Figuras xi

Introdução xiii

1 Resultados preliminares 11.1 Notações e definições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.1.1 Tempo de Retorno . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.1.2 Função Sn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.1.3 Classificação periódica das palavras . . . . . . . . . . . . . . . . . . . 5

1.2 Resultados Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61.2.1 Distribuição limite de Sn . . . . . . . . . . . . . . . . . . . . . . . . . 71.2.2 Convergência de E(Sn) . . . . . . . . . . . . . . . . . . . . . . . . . . 91.2.3 E(Sn) e a entropia do processo Bernoulli . . . . . . . . . . . . . . . . 91.2.4 Não convergência em probabilidade . . . . . . . . . . . . . . . . . . . 9

2 Resultados obtidos 112.1 Distribuição limite de Sn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.1.1 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262.2 Limite da Esperança de Sn . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322.3 Limite do Segundo Momento Finito de Sn . . . . . . . . . . . . . . . . . . . 362.4 Resultados condicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

2.4.1 Probabilidade condicional . . . . . . . . . . . . . . . . . . . . . . . . 402.4.2 Esperança condicional . . . . . . . . . . . . . . . . . . . . . . . . . . 442.4.3 Esperança da esperança condicional . . . . . . . . . . . . . . . . . . . 47

2.5 Entropia vs E(Sn) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 482.6 Caso independente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

3 Conclusões e Problemas em aberto 57

ix

Page 14: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

x SUMÁRIO

A Artigo 59

Referências Bibliográficas 61

Índice Remissivo 63

Page 15: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

Lista de Figuras

1.1 Definição do processo β-mixing. . . . . . . . . . . . . . . . . . . . . . . . . . 21.2 Processo com Tn maior do que n. . . . . . . . . . . . . . . . . . . . . . . . . 41.3 Relação entre Sn e Tn com Tn < n. . . . . . . . . . . . . . . . . . . . . . . . 51.4 Relação entre Sn e Tn com Tn ≥ n. . . . . . . . . . . . . . . . . . . . . . . . 51.5 E(Sn) vs. Entropia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.1 Cadeia {Yn}n≥0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272.2 Convergência 1 de µ(Sn = −1). . . . . . . . . . . . . . . . . . . . . . . . . . 302.3 Convergência 2 de µ(Sn = −1). . . . . . . . . . . . . . . . . . . . . . . . . . 312.4 Convergência 3 de µ(Sn = −1). . . . . . . . . . . . . . . . . . . . . . . . . . 322.5 E(Sn) para o processo de Markov com gramática completa. . . . . . . . . . 492.6 Entropia para o processo de Markov com gramática completa. . . . . . . . . 492.7 E(Sn) para o processo de Markov com gramática completa . . . . . . . . . . 502.8 Entropia para o processo de Markov com gramática completa . . . . . . . . . 512.9 Limitantes superior e inferior para o limite de E(Sn). . . . . . . . . . . . . . 522.10 Limitantes superior e inferior para o limite do segundo momento de E(Sn). . 542.11 Limitantes superior e inferior para o limite da Variância de E(Sn). . . . . . . 56

xi

Page 16: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

xii LISTA DE FIGURAS 0.0

Page 17: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

Introdução

Considere um processo estocástico definido sobre o conjunto χ, finito ou infinito enumerável.Nós nos referiremos a este conjunto como o alfabeto. Para cada entero positivo n, considereo conjunto de todas sequências de tamanho n formada com elementos de este alfabeto, estoé χn. A estas sequências daremos o nome de palavras e denotaremos elas com a letra ω (ver1.1).

No presente trabalho, nós consideramos a função Sn, definida sobre χn e tomando valoresentre −∞ e n−1. Para cada palavra de tamanho n, essa função assume o valor do tamanhoda palavra menos o primeiro tempo de retorno dela, ou seja, Sn = n− primeiro tempo deretorno. O primeiro tempo de retorno de una palavra ω de tamanho n é o tempo que demoraa palavra em aparecer de novo sobre uma sequência infinita do processo que começa com ω.Vamos denotar Tn este tempo de retorno. Se Sn for maior que zero, a palavra apresenta umasobreposição com uma cópia dela mesma transladada, [19]. Se, pelo contrário Sn é negativo,o valor absoluto da função representa o tempo entre a palavra e sua nova aparição.

A relevância da função Tn (e portanto de Sn) foi colocada em evidência na análise es-tatística da Recorrência de Poincaré. Para provar a convergência do número de ocorrênciade palavras (digamos, de tamanho n) quando n diverge, para a distribuição de Poisson, énecessário que a palavra não se sobreponha com ela mesma [17]. Ou, pelo menos, que aproporção das palavras que se sobrepõem seja pequena com relação a n [7]. Se esse não foro caso, a distribuição limite tem lei Poisson composta [16]. Também temos na literaturaalgumas aproximaçoes para esse limite em [20], [21] e [22].

Tal relevância também aparece quando consideramos o tempo decorrido até a primeiraocorrência da palavra. Esse tempo é conhecido como o Tempo de Ocorrência ou Hittingtime (ver 1.8). É sabido que o tempo de ocorrência pode ser aproximado por uma lei ex-ponencial com parâmetro dado pela medida da palavra, no caso em que a palavra possuiuma sobreposição com ela mesma ou quando tal sobreposição é "pequena". Mas, quando apalavra apresenta sobreposição (que não seja "pequena") com ela mesma, o parametro deveser corrigido por um fator. Tal fator é a probabilidade da palavra não aparecer duas vezesconsecutivas. E essa probabilidade é dada pelas propriedades de sobreposição da palavra, [1]e [3].

xiii

Page 18: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

xiv INTRODUÇÃO 0.0

Uma situação similar acontece quando consideramos o tempo decorrido até a primeiraocorrência da palavra, colocando como condição inicial a ocorrência da própria palavra. Estetempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. Ésabido que o tempo de retorno também pode ser bem aproximado por uma lei exponencial.Mas quando a palavra apresenta sobreposição com ela mesma, essa lei deixa de ser expo-nencial, passando a ser uma combinação convexa de uma medida degenerada na origem euma exponencial [13]. Neste caso, o mesmo fator citado no paragrafo anterior, aparece nacombinação convexa e a lei exponencial.

Até onde sabemos, os primeiros a observarem que a medida de todas as palavras que pos-suem "grandes" sobreposições converge para zero foram Collet, Galves & Schmitt, em 1999[13]. Nesse trabalho, os autores provaram o decaimento exponencial dessa medida quando"grande" significa maior ou igual a n− n/3. Tal resultado vale para processos misturadorescom função ψ de decaimento exponencial. Mais tarde, o mesmo resultado foi generalizadoem [1] para processos misturadores com função φ de decaimento exponencial. No últimocaso, "grande" significa ser maior ou igual a n − cn, onde c é uma constante que dependeda cardinalidade do alfabeto.

A distribuição de Tn é desconhecida. Ou seja, não há uma forma explícita para

FTn := µ(Tn ≤ y).

Em 2002 usando a complexidade de Kolmogorov, Saussol, Troubetzkoy & Vaienti [25] pro-varam, para um processo ergódico com entropia positiva, cumprindo propriedade de especi-ficação [9], que

limn→∞

Tn

n= 1 q.c (1)

Esta expressão diz que, assintóticamente, Tn cresce na mesma velocidade que n. Isto sugereque a variável aleatória Tn apresenta um comportamento assintótico defectivo. Ou seja,temos então uma sequência de variáveis aleatórias não estocasticamente limitadas. Aí vemosa necessidade de definir convenientemente uma outra sequência de variáveis aleatórias quenos forneça informação sobre o Primeiro Tempo de Retorno. Neste trabalho, tal função seráSn.Em 2003, usando o Teorema de Shannon, McMillan & Breiman, Afraimovich, Chazottes eSaussol provaram que vale o mesmo resultado que se apresenta em 1, [9]. Este resultadotambém foi provado para uma clase de funções não uniformemente expandidas do intervalo[18] no contexto de sistemas dinâmicos.

O principio de grandes desvios para Tn tem sido e continua sendo motivo de estudo. Abadie Vaienti [7] encontraram a função de grandes desvios e relacionaram Tn com a entropia deRenyi do processo gerador de palavras. Abadi e Cardeño, [4] estudaram a entropia de Renyi

Page 19: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

0.0 xv

e a função de grandes desvios de Tn, para processos com condições de mistura. Haydne Vaienti [15] estudaram o mesmo principio e sua relação com a entropia de Renyi, masassumindo condições de decaimento exponencial. Logo o limite da função de grandes desviosesta relacionado com a entropia do processo. Então é natural perguntar pelas flutuações deTn. Ou seja, perguntar pela existência da distribuição limite re-escalada de Tn,

Tn − E(Tn)√(V ar(Tn))

,

incluindo o problema do comportamento asintótico de E(Tn) e de V ar(Tn).

Motivados pelo estudo da distribuição limite de Sn como uma fonte de informação paraencontrar propriedades interessantes anunciadas anteriormente de Tn, Lambert [19] Abadi &Lambert [5] encontraram a convêrgencia da distribuição de Sn para uma distribuição limitecuja cauda decai exponencialmente, quando n diverge. Esto foi provado considerando umprocesso independente e identicamente distribuído.Além disso, eles apresentaram um limite superior para a velocidade dessa convergência. Tallimite superior é não-uniforme, porêm permite obter como corolário a esperança e em geral,todos os momentos finitos de ordem polinomial.

O objetivo deste trabalho é generalizar estos resultados para processos com dependênciado tipo β-mixing para gerar as palavras (ver 1.2). Dessa maneira, definimos a função Sn eapresentamos o limite para µ(Sn ≥ k), com k inteiro não negativo, que quando o processotem gramática completa (ou seja, todas as possíveis combinações de símbolos do alfabeto têmprobabilidade positiva de ocorrência, ver 1.6) será a distribuição limite de Sn. Além disso,como consequência do anterior, apresentamos o limite para o valor esperado, o segundomomento finito e a variância de Sn com suas respectivas velocidades de convergência.

Estudamos também o caso independente trabalhado em [19] um pouco mais e apresenta-mos limitantes mais eficientes para o limite da esperança de Sn, o qual nos permitiu calcularlimitantes para o segundo momento finito e consequentemente, para a variância.

Page 20: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

xvi INTRODUÇÃO 0.0

Page 21: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

Capítulo 1

Resultados preliminares

1.1 Notações e definiçõesNeste trabalho vamos considerar processos estocásticos estacionários sobre um conjunto

χ finito ou infinito enumerável. Tal conjunto será chamado de alfabeto. Aqui consideraremossempre um alfabeto χ tal que o cardinal dele, |χ|, seja maior o igual a 2.

Definição 1.1. Diremos que uma palavra é uma sequência finita de símbolos do alfabetoχ. Formalmente,

xn1 = (x1x2 · · ·xn) xi ∈ χ, i = 1, 2, . . . , n.

onde os índices indicam onde começa e onde termina a palavra.

O conjunto de todas as palavras de tamanho n com símbolos no alfabeto χ será denotadopor χn.

Vamos denotar uma palavra xn1 também como ω ou ωn se quisermos especificar a palavra

com seu tamanho.

Consideraremos um processo estocástico para gerar as palavras com uma dependênciatipo β-mixing, cuja definição, extraída de [11], será dada a seguir.

Seja {Xn}n∈Z um processo estocástico estacionário assumindo valores no alfabeto χ. Ovalor de Xn é interpretado como o estado do processo no tempo n. Para −∞ ≤ J ≤ L ≤ ∞,definimos a σ-álgebra

FLJ := σ(Xk, J ≤ k ≤ L (k ∈ Z)).

Ou seja, FLJ é a σ-álgebra gerada pelas variáveis aleatórias Xk para k entre J e L.

Definição 1.2. Para quaisquer duas σ-álgebras FLJ e FN

M , definimos a medida de dependên-cia β−mixing como

β(FLJ ,FN

M ) := sup12

I∑i=1

K∑k=1

|µ(Ai ∩Bk)− µP (Ai)µ(Bk)| ,

onde o supremo é tomado sobre todos os pares de partições finitas {A1, . . . , AI} e {B1, . . . , BK}de χZ tais que Ai ∈ FL

J para cada i e Bk ∈ FNM para cada k.

Definição 1.3. Para n ≥ 1, definimos o coeficiente β-mixing por,

β(n) := supj∈Z

β(F j−∞,F∞

j+n).

1

Page 22: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

2 RESULTADOS PRELIMINARES 1.1

Na seguinte figura se mostra o conjunto A ∈ F j−∞ e o conjunto B ∈ F∞

j+n. O coeficienteβ destes dois conjuntos está baseado na distância que existe entre eles.

Figura 1.1: Definição do processo β-mixing.

Definição 1.4. Diremos que o processo {Xn}n∈Z é β-mixing se

limn→∞

β(n) = 0.

Uma característica da função β é que ela é não-crescente ou decrescente. Para provaristo, basta aplicar a definição observando que F∞

j+n+1 ⊆ F∞j+n.

A ideia por trás de um processo com dependência tipo mixing é garantir que a probabi-lidade de ocorrência simultânea de dois eventos converge ao produto das probabilidades,quando o tempo de ocorrência entre os eventos tende para infinito. Ou seja, a dependênciatipo β-mixing garante uma perda de memória do processo.

O coeficiente β-mixing foi introduzido por Kolmogorov e apareceu por primeira vez noartigo escrito por Wolkonski & Rozanov em 1959 [23]. Como exemplo de um processo β-mixing podemos apresentar as cadeias de Markov estritamente estacionárias, irredutíveis eaperiódicas [11].

Outra medida de dependência tipo mixing para processos estocásticos é a dependencia α-mixing. Nós será útil na prova de nosso teorema principal, porque se um processo estocásticoé β-mixing, então também é α-mixing [11].

Definição 1.5. Para quaisquer duas σ-álgebras FLJ e FN

M , definimos a medida de dependên-cia α-mixing como

α(FLJ ,FN

M) := sup |µ(A ∩B)− µ(A)µ(B)| , A ∈ FLJ , B ∈ FN

M .

Para n ≥ 1, definimos o coeficiente α-mixing por,

α(n) := supj∈Z

α(F j−∞,F∞

j+n).

Finalmente, diremos que o processo {Xn}n∈Z é α-mixing se

limn→∞

α(n) = 0.

Uma definição muito útil, é a definição de um processo com gramática completa, a qualserá dada a seguir.

Page 23: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

1.1 NOTAÇÕES E DEFINIÇÕES 3

Definição 1.6. Sejam {Xn}n∈N um processo estocástico definido sobre o alfabeto χ e µ umamedida de probabilidade do processo em χN. Diremos que o processo tem gramática completase para todo xn

1 ∈ χn, µ(xn1 ) > 0.

1.1.1 Tempo de Retorno

Agora, trataremos do tempo de retorno, que é uma definição essencial no presente tra-balho. Para isso, definimos o tempo de ocorrência. Em palavras: dizemos que o tempo deocorrência de uma palavra é o mínimo tempo que leva a palavra em aparecer numa sequênciainfinita dada.

Definição 1.7. Para uma palavra xn1 ∈ χn dada, o tempo de ocorrência de xn

1 em y∞0 ,denotado por τxn

1, é dado por

τxn1(y∞0 ) = inf{t ≥ 1 | yt+n−1

t = xn1}, (1.1)

e infinito se o conjunto for vazio.

Motivados pelos trabalhos [1], [2], [6] e [14], nós estudamos o primeiro tempo de retornode uma sequência de tamanho n.

Definição 1.8. O primeiro tempo de retorno de uma sequência xn1 é dado pelo ínfimo dos

tempos de ocorrência τxn1(y∞0 ) sobre todas as realizações possíveis y∞0 que começam com xn

1 .Isto é,

Tn(xn1 ) = inf

y∞0 : yn−10 =xn

1

τxn1(y∞0 ) (1.2)

Note que o tempo de retorno é uma variável aleatória. Este tempo tem uma versão usadaem Sistemas Dinâmicos. Considere x∞1 ∈ χN. Defina agora uma translação σ, transformaçãoshift, da seguinte maneira:

σ : χN → χN,

σ(x∞1 ) = x∞2 ,

onde σ retira da sequência o primeiro símbolo. Aplicando recursivamente σ, temos que para1 ≤ m:

σm(x∞1 ) = x∞m+1.

Então, finalmente, definimos Tn(ω) da seguinte maneira:

Definição 1.9.Tn(ω) = inf

y∈χN:yn−10 =xn

1

{m ≥ 1 : σm(y) = y},

onde o ínfimo acima é tomado entre todas as sequências y de tamanho infinito que tenhamos mesmos n primeiros símbolos de ω.

A diferença entre Tn e Tn está em que Tn está definido sobre χN e Tn sobre χn masse o processo que gera as palavras tem grámatica completa, y sempre pode ser tomado demaneira que 1 ≤ Tn(y) ≤ n, nessas condições, Tn e Tn são equivalentes.

Exemplo 1.10. Seja x61 = 010101 uma palavra de tamanho 6. O ínfimo de todas as possíveis

sequências o garante y∞0 = 0101010101... se este elemento pertence ao espaço amostral. Logo,

Page 24: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

4 RESULTADOS PRELIMINARES 1.1

se nós transladássemos a palavra dois passos à direita sobre y∞0 , encontraremos novamentex6

1. A seguinte figura representa gráficamente, as translaçoões dadas.

Início : 0 1 0 1 0 1

Passo 1 : 0 1 0 1 0 1

Passo 2 : 0

WW

1

WW

0

WW

1

WW

0 1

Como esta palavra retorna na segunda translação, o tempo de retorno T6(010101) = 2.

No seguinte exemplo mostramos que o tempo de retorno de uma palavra pode ser maiordo que o tamanho da palavra.

Exemplo 1.11. Considere uma cadeia de Markov em χ = {0, 1, 2} tal que

P=

0 1 2

0 1− q0 q0 01 1− q1 0 q12 1− q2 0 q2

onde 0 < qi < 1, para i = 0, 1, 2.

Figura 1.2: Processo com Tn maior do que n.

Seja x41 = 1012. Note que nenhuma palavra y∞0 que comece com 1012 vai repeti-la imediata-

mente pois p2,1 = 0. Logo, T4(1012) > 4.

1.1.2 Função Sn

Na presente seção, iremos construir uma nova variável aleatória relacionada à variávelTn, a qual é a estrela deste trabalho. Para palavras geradas por sequências de variáveisaleatórias independentes com marginais identicamente distribuídas, se provou em [19] e [5]que essa variável aleatória possui distribuição limite. Este resultado motivou esta tese e foigeneralizado no capítulo 2.

Para começar, construimos a função Sn : χn → Z por médio da seguinte equação:

Sn(xn1 ) = n− Tn(xn

1 ) (1.3)

A figura seguinte mostra graficamente a relação entre Sn e Tn, sendo ω uma palavrainfinita.

Page 25: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

1.1 NOTAÇÕES E DEFINIÇÕES 5

Figura 1.3: Relação entre Sn e Tn com Tn < n.

Figura 1.4: Relação entre Sn e Tn com Tn ≥ n.

Nas figuras anteriores, a palavra ω é transladada um número de passos à direita até elacomeçar de novo. Esse número de passos será nosso Tn se ele for o ínfimo entre todas asrealizações do processo. Nas figuras estamos supondo que ω garante o ínfimo. Na figura 1.3,Tn é menor que n, logo Sn representa o tamanho da máxima sobreposição que apresenta apalavra, ou seja, Sn é, neste caso, o tamanho máximo de uma subpalavra com a qual xn−1

0

começa e termina. Na figura 1.4, Tn é maior que n e o valor absoluto de Sn representa adistância entre a palavra xn−1

0 e sua nova aparição.

Exemplo 1.12. Consideremos a palavra x61 = 010101 do Exemplo 1.10. Neste exemplo se

mostra que T6(010101) = 2. Logo Sn(x61) = 4 e a palavra tem uma sobreposição de tamanho

4.

Exemplo 1.13. Usando o processo do Exemplo 1.11, consideremos a palavra x41 = 1012.

Se T4(1012) = 5, quer dizer que existe uma palavra ω no espaço amostral, que começa com101201012 e que garante o ínfimo. Então S4(1012) = −1 e seu valor absoluto representa adistância que existe entre a palavra e sua nova aparição.

1.1.3 Classificação periódica das palavras

Uma forma de entender melhor o problema do tempo de retorno é tentar identificaralgum comportamento periódico nas palavras. Note que, quando temos uma palavra formadapor "bloquinhos" que se repetem, temos um retorno iminente. A seguir, definiremos umaferramenta fundamental deste trabalho:

Definição 1.14. Seja 0 < k < n. Definimos Bn(k) como sendo o conjunto de todas aspalavras de χn que são k-periódicas. Ou seja:

Bn(k) = {xn1 ∈ χn : xn

1 = (x1, . . . , xk︸ ︷︷ ︸1

, x1, . . . , xk︸ ︷︷ ︸2

, . . . , x1, . . . , xk︸ ︷︷ ︸bn/kc

, x1, . . . , xr︸ ︷︷ ︸1

)}.

Page 26: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

6 RESULTADOS PRELIMINARES 1.2

Portanto, o conjunto Bn(k) pode ser visto como o conjunto de todas as palavras quepodem ser escritas como concatenação de bn/kc palavras xk

1 ∈ χk1 com uma palavra xr

1 ∈ χr1.

Aqui, sempre consideramos r < k, o resto da divisão de n por k. Note que o tamanhoda palavra não precisa necessariamente ser um múltiplo de k. Somente a palavra precisaapresentar certo "comportamento periódico". Falando de forma mais simples, a palavra éformada por "bloquinhos" de tamanho k, mais um bloquinho restante de tamanho 0 ≤ r < k.

Exemplo 1.15. Considere o conjunto de palavras de tamanho n = 3 do alfabeto χ = {0, 1}.Denotaremos esse conjunto por C3. Daí:

C3 = {000; 001; 010; 011; 100; 101; 110; 111}.

Além disso:

B3(1) = {000; 111}B3(2) = {000; 111; 101; 010}B3(3) = C3.

O seguinte lema, tomado de Abadi e Vaienti [7] e [8], será úteis na provas dos resultadosprincipais no próximo capítulo.

Lema 1.16. Sejam m e n inteiros positivos tais que m < n/2. Então,

m⋃j=1

Bn(j) =m⋃

j=dm2e

Bn(j), (1.4)

onde d·e é a função maior inteiro.

A prova desse lema, está baseada no fato que Bn(j) ⊆ Bn(mj) para m ∈ N. Definiremosagora os conjuntos Rn(k), que serão as palavras com uma sobreposição de tamanho k. Omotivo para essa mudança é mera conveniência

Definição 1.17. Definimos o conjunto Rn(k) como sendo o conjunto de palavras que temuma sobreposição de tamanho k. Ou seja:

Rn(k) = {xn1 ∈ χn : xk

1 = xnn−k+1}.

Observação 1.18. Note que vale a seguinte relação de dualidade:

Rn(k) = Bn(n− k). (1.5)

1.2 Resultados PreliminaresO nosso objetivo neste seção é apresentar os principais resultados, obtidos por Lambert

em [19] e por Abadi & Lambert em [5], que motivaram esta tese. Vamos expor os teoremase proposições que serão generalizados no Capítulo 2 e que foram nosso objeto de estudo.

Vamos considerar um processo independente com distribuições marginais identicamentedistribuídas no alfabeto χ. Nessas condições, em [19] e em [5] , os autores provaram a

Page 27: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

1.2 RESULTADOS PRELIMINARES 7

convergência em distribuição da função Sn e encontraram o limite para a velocidade deconvergência. Como consequência, obtiveram a convergência da esperança da função Sn.

Quando o processo que gera as palavras é independente e identicamente distribuído, Sn

tem uma interessante interpretação: para cada palavra, a função Sn assume o valor do maiortamanho possível de uma sobreposição que essa palavra pode ter com uma cópia dela mesmatransladada. Se não houver sobreposição, a função assume o valor de zero, pois neste caso, afunção Sn não toma valores negativos. Isto é porque o processo independente tem gramáticacompleta.

1.2.1 Distribuição limite de Sn

Vamos começar com o teorema apresentado em [9] e em [25]. Este teorema nos diz que,se o alfabeto for finito, o tempo de retorno Tn cresce na mesma velocidade que n quasecertamente.

Teorema 1.19. Seja µ uma medida ergódica com respeito à transformação shift no espaçoχN. Suponha também que o sistema tem entropia estritamente positiva com respeito a umapartição finita ou contável e que satisfaz a propriedade de especificação [9; 26]. Então,

limn→∞

Tn

n= 1 µ -q.c.

A propriedade de especificação ou sistema fracamente especificado é uma propriedadetopológica que nasce no desejo de aproximar simultaneamente (até ε) duas palavras poruma órbita periódica. Sem ela, limn→∞ Tn/n ≥ c µ -q.c, com c ≥ 1. Para maior informaçãosobre a propriedade de especificação, remitimos ao leitor a [9]. Se o alfabeto for finito oprocesso satisfaz a propriedade de especificação [26].

Observação 1.20. Seja Sn : χn → Z como foi construído no na seção 1.1.2. Se o processosatisfaz a propriedade de especificação, então

limn→∞

Sn

n= 0 µ− q.c. (1.6)

Logo, nós concluímos que Sn apresenta um comportamento assintótico melhor do que ocomportamento assintótico apresentado por Tn. Eis mais uma razão para estudar o tempode retorno através da função Sn.

Para entender melhor os próximos resultados, damos a seguinte notação: seja χ o alfabetodo processo. Para cada ai ∈ χ, sejam µ(ai) = pi, então denotamos porml a seguinte expressão

ml =

|χ|∑i=1

pli (1.7)

Finalmente, chegamos ao teorema principal deste capítulo que diz, essencialmente, queexiste uma distribuição limite para Sn e que é semelhante a uma distribuição geométricamais um termo de correção, e que a convergência para essa distribuição limite ocorre comtaxa exponencial.

Page 28: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

8 RESULTADOS PRELIMINARES 1.2

Teorema 1.21. Seja µ uma medida produto em χN com marginais identicamente distribuí-das. Então, para todo inteiro positivo k, temos que

limn→∞

µ(Sn ≥ k) = mk2 + ak,

onde ak =∑∞

i=k+1 µ(R2i(i) \

⋃i−1j=k R2i(j)

).

O termo ak seria a soma das medidas daquelas palavras duplas que têm uma sobreposiçãode tamanho igual à mitade da palavra mas não têm ninhuma sobreposição de tamanhomenor.

As seguintes proposições apresentam limitantes para o termo de correcção ak.

Proposição 1.22. Sob as condições do Teorema 1.21, temos que

ak ≤mk+1

2

1−m2

− mk4

1−m2

.

O limitante que dá a proposição anterior não estabelece qual termo entre mk2 e ak é maior,

mas a seguinte proposição, mostra que de fato ambas podem acontecer.

Proposição 1.23. Sob as condições do Teorema 1.21, temos que

ak ≥mk+1

2

1−m2

− mk4

1−m4

1 +m2

1−m2

.

Além disso,

a. Se m2 ≤ 1/2 então, mk2 > ak,

b. Se m2 > 1/2, então

i. a1 < m2

ii. Existe para algum k0 > 0, para o qual ak > mk2 para todo k > k0.

Exemplo 1.24. Considere a medida produto uniforme sobre o alfabeto finito χ = {1, 2, . . . , s}.Então, mi = 1/si−1. As desigualdades dadas nas Proposições 1.22 e 1.23 ficam

ak ≤s2k−1 − 1

s3k−1(s− 1)e

ak ≥1

sk(s− 1)− s+ 1

s− 1

1

s3k−2(s3 − 1)

e pela Proposição 1.23a. m2 é sempre o termo dominante.

Exemplo 1.25. Vamos considerar o caso Bernoulli com χ = {0, 1}. Sejam p1 = p e p0 =1− p. Logo mi = pi + (1− p)i, particularmente m2 = p2 + (1− p)2. Aplicando as fórmulasdadas nas Proposições 1.22 e 1.23 obtém-se que

ak = O

((p2 + (1− p)2)k+1

2p(1− p)

),

e se p 6= 1/2, então mk2 > 1/2 e pela parte b, item ii. da Proposição 1.23 existe k0 ∈ N para

o qual m2 < ak para todo k > k0.

Page 29: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

1.2 RESULTADOS PRELIMINARES 9

1.2.2 Convergência de E(Sn)

Vamos analisar agora o comportamento assintótico de E(Sn) quando o processo quegera as palavras é independente com distribuições marginais identicamente distribuídas. Adificuldade na abordagem do cálculo de E(Sn) radica no não conhecimento da distribuiçãoexplicíta de Sn. Por isso é preciso procurar limitantes como foi feito por Lambert em [19]cujos resultados daremos a seguir.

Começamos com um corolário do Teorema 1.21 onde se obtém a convergência da espe-rança de Sn para um valor Q.

Corolário 1.26. Seja Q = limn→∞ E(Sn). Então, existem C constante positiva e 0 < ε < 1,tal que

|E(Sn)−Q| ≤ Cεn.

O corolário anterior mostra uma convergência exponencialmente rápida ao valor desco-nhecido Q. No seguinte corolário vamos ver limitantes para este valor.

Corolário 1.27. Seja Q = limn→∞ E(Sn). Então,

m2

1−m2

≤ Q ≤ m2

(1−m2)2.

No Capítulo 2, nós calculamos limitantes mais eficientes para Q e também para Q2 =limn→∞ E(S2

n).

1.2.3 E(Sn) e a entropia do processo Bernoulli

Uma pergunta interessante é a relação entre a entropia do processo e E(Sn). Em [19] oautor conjectura que, de fato, esta relação existe no caso de um processo Bernoulli. Paraisso, o autor considerou o alfabeto com dois símbolos, χ = {0, 1} tal que p1 = p e p0 = 1−p.

Guilherme Ludwig, sob a orientação do professor Miguel Abadi, simulou amostras depalavras de tamanho 250. Em seguida calculou E(Sn) para cada caso. Foi usada a entropiade Shannon, H(p) = −(p ln p+(1−p) ln(1−p)), para a comparação nas simulações. O gráficoque eles obtiveram sugere que E(Sn) tem uma relação inversa com a entropia do processo.

Note que quando p se aproxima a 0 ou 1, a esperança de Sn é máxima e a entropia doprocesso tende a 0. Nesse caso o nível de complexidade do processo diminuiu e o tempo deretorno das sequências é pequeno. Isto se deve ao fato de um mesmo símbolo ocorrer comprobabilidade grande o que faz que a esperança cresça.

1.2.4 Não convergência em probabilidade

Abadi & Lambert [5] provaram que Sn não converge em probabilidade quando n tendea infinito. Para evitar casos triviais, os autores consideraram µ(ai) < 1, para todo ai ∈ χ.

Proposição 1.28. Sob as condiçoes do Teorema 1.21, não existe uma variável aleatória Sdefinida sobre χN tal que Sn converge a S em probabilidade.

Page 30: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

10 RESULTADOS PRELIMINARES 1.2

Figura 1.5: E(Sn) vs. Entropia

Embora a proposição esteja provada usando um processo independente, é valida paraprocessos mixing, em particular para β−mixing, porque se µ(xj

i ∩xmj+n) = µ(xj

i )µ(xmj+n) para

quaisquer i, j,m ∈ N, então β(n) = 0 para todo n. Ou seja, um processo independente é umprocesso β−mixing onde β(n) = 0 para todo n.

Page 31: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

Capítulo 2

Resultados obtidos

Neste capítulo vamos generalizar os resultados expostos no capítulo anterior. A genera-lização é feita enfraquecendo a hipótese de independência entre as variáveis geradoras doprocesso, as quais têm uma dependência do tipo β-mixing definida no Capítulo 1.

2.1 Distribuição limite de SnVamos começar apresentando o teorema principal desta seção. Este teorema diz, essen-

cialmente, que sob hipóteses convenientes para os coeficientes β-mixing, Sn converge endistribuição quando n diverge.

Teorema 2.1. Seja µ uma medida de probabilidade definida em χN para um processo β-mixing com gramática completa. Considere k ∈ N tal que n ≥ 4k. Então

|µ(Sn ≥ k)− E(µ(Xk1 ))− ak| ≤ Kρ

∞∑i=dn/8e

εβ(i) (2.1)

ondeρ = max

x∈χµ(x), (2.2)

Kρ é uma constante que só depende de ρ,

εβ(i) = inf1≤m<i

(ρm + βm(i)

), (2.3)

m ∈ N, βm(i) = 2βm(i) = 2β(bi/mc − 1), e

ak =∞∑

i=k+1

∑ω/∈∪i−1

j=kRi(j)

µ2(ω).

Se, além da hipótese anterior, o processo β-mixing é tal que ln iβ(i) é somável, então

limn→∞

∞∑i=dn/4e

εβ(i) = 0,

11

Page 32: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

12 RESULTADOS OBTIDOS 2.1

o que implica quelim

n→∞µ(Sn ≥ k) = E(µ(Xk

1 )) + ak. (2.4)

O teorema nós diz que o limite da probabilidade de Sn ≥ k, com k > 0 converge à espe-rança da medida das palavas de tamanho k mais um termo de correção ak. Este termo ak

depende da medida daquelas palavras que pertencem a Rn(j) com j > k mas não pertencema Rn(k), ou seja, são aquelas palavras que têm uma sobrepocisão de tamanho maior a k masnão têm uma sobrepocisão de tamanho k.

Vamos mostrar que o termo E(µ(Xk1 )) do Teorema anterior corresponde ao termo mk

2 doTeorema 1.21 no caso independente, mostrando assim, a generalização feita.

Observação 2.2. Se o processo que gera as palavras é independente, então

E(µ(Xk1 )) = mk

2

Demonstração. Pela definição de esperança de uma variável aleatória,

E(µ(Xk1 )) =

∑xk1∈χk

µ2(xk1)

=∑

x1x2...xk

µ2(x1)µ2(x2) . . . µ

2(xk)

=(∑

x∈χ

µ2(x))k

= mk2,

onde as últimas linhas foram obtidas pela independência do processo e pela definição de ml

dada em (1.7).

As seguintes proposições dão limitantes para o termo ak.

Proposição 2.3. Sob as hipóteses do Teorema 2.1, um limitante superior para ak é

ak ≤∞∑

i=k+1

E(µ(X i1))−

∞∑i=k+1

∑ω∈Ri(k)

µ2(ω).

Proposição 2.4. Sob as hipóteses do Teorema 2.1, um limite inferior para ak é

ak ≥∞∑

i=k+1

E(µ(X i1))−

∞∑i=k+1

i−1∑j=k

∑ω∈Ri(j)

µ2(ω).

As provas do Teorema 2.1, e as Proposições 2.3 e 2.4, serão desenvolvidas a partir de trêslemas, enunciados e provados a seguir.

Lema 2.5. Seja {Xn}n∈N um processo α−mixing definido em χN. Então,

µ(xn1 ) ≤ inf

1≤m<n

(ρm+1 +

α(bn/mc − 1)

1− ρ

), (2.5)

onde m ∈ N, b·c denota a função parte inteira e ρ como foi definido em (2.2).

Page 33: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

2.1 DISTRIBUIÇÃO LIMITE DE SN 13

Demonstração. Esta prova está baseada no Lema 1 de [14] e no Lema 18 de [2].Para qualquer 1 ≤ m < n, é válido que n = mb n

mc + rm, onde rm é o resto da divisão de n

por m.Para qualquer palavra de tamanho n, digamos xn

1 , temos que

µ(xn1 ) ≤ µ(X1 = x1, X

nbn/mc+1 = xn

bn/mc+1), (2.6)

onde a desigualdade foi obtida pela remoção do bloco xbn/mc2 de xn

1 . A propriedade α−mixingpermite afirmar que

µ(X1 = x1, Xnbn/mc+1 = xn

bn/mc+1) ≤ µ(x1)µ(xnbn/mc+1) + α(bn/mc − 1). (2.7)

Vamos remover agora o bloco x2bn/mcbn/mc+2 de xn

bn/mc+1 obtendo que

µ(xnbn/mc+1) ≤ µ(Xbn/mc+1 = xbn/mc+1, X

n2bn/mc+1 = xn

2bn/mc+1). (2.8)

e como o processo é α−mixing, temos que

µ(Xbn/mc+1 = xbn/mc+1, Xn2bn/mc+1 = xn

2bn/mc+1) ≤ µ(xbn/mc+1)µ(xn2bn/mc+1) + α(bn/mc − 1).

(2.9)Juntando as equações (2.6), (2.7), (2.8) e (2.9), concluímos que

µ(xn1 ) ≤ µ(x1)µ(xbn/mc+1)µ(xn

2bn/mc+1) + α(bn/mc − 1)(1 + µ(x1)). (2.10)

Repetindo iterativamente a propriedade α−mixing para as medidas µ(xnibn/mc+1) com i =

2, . . . ,m, obtemos que

µ(xn1 ) ≤

m∏i=0

µ(xibn/mc+1) + α(bn/mc − 1)m−1∑i=0

i∏k=0

µ(xkbn/mc+1).

Seja ρ = maxx∈χ µ(x). Assim,

µ(xn1 ) ≤ ρm+1 + α(bn/mc − 1)

m−1∑i=0

ρi

≤ ρm+1 +α(bn/mc − 1)

1− ρ. (2.11)

Isso finaliza nossa prova.

Lema 2.6. Seja µ uma medida de probabilidade definida em χN para um processo α−mixing.Então,

E(µ(Xn1 )) ≤ inf

1≤m<n

(ρm+1 +

α(bn/mc − 1)

1− ρ

), (2.12)

onde m ∈ N.

Page 34: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

14 RESULTADOS OBTIDOS 2.1

Demonstração. Pela definição de esperança de uma variável aleatória, temos que

E(µ(Xn1 )) =

∑w∈χn

µ2(w) (2.13)

≤ maxω∈χn

µ(ω).

Vamos denotar por pn = maxω∈χn µ(ω).

Podemos aplicar o Lema 2.5 em pn, porque o limitante superior que ele fornece nãodepende das palavras ω de tamanho n, logo, em particular, o lema vale para a palavra detamanho n com medida máxima. Assim,

pn ≤ inf1≤m<n

(ρm+1 +

α(bn/mc − 1)

1− ρ

). (2.14)

E substituindo esta última expressão na inequação (2.13), chegamos a nosso resultado.

Observação 2.7. Se o processo {Xn}n∈N é β−mixing então ele é também α−mixing, me-diante a inequação 2α(n) ≤ β(n) [11], e portanto

i. A expressão (2.5) do Lema 2.5 para processos β−mixing seria,

µ(xn1 ) ≤ inf

1≤m<n

(ρm+1 +

β(bn/mc − 1)

2(1− ρ)

). (2.15)

ii. A expressão (2.12) do Lema 2.6 para processos β−mixing é

E(µ(Xn1 )) ≤ inf

1≤m<n

(ρm+1 +

βm(n)

2(1− ρ)

). (2.16)

Lema 2.8. Sejam µ uma medida de probabilidade definida em χN para um processo β−mixinge 0 < c < 1 uma constante. Então,

µ

(bcnc⋃j=1

Bn(j)

)≤ Kc,ρ

bcnc∑j=bc′nc

inf1≤m<j

(ρm + βm(j)

), (2.17)

onde Kc,ρ é uma constante que depende de c e ρ e c′ = min{c/2, (1− c)/2}.

Demonstração. Começamos usando o Lema 1.16 para afirmar que

µ

(bcnc⋃j=1

Bn(j)

)= µ

( bcnc⋃j=dbcnc/2e

Bn(j)

)

≤bcnc∑

j=dbcnc/2e

µ(Bn(j)).

Vamos nos concentrar em µ(Bn(j)).

µ(Bn(j)) =∑

ω∈Bn(j)

µ(ω).

Page 35: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

2.1 DISTRIBUIÇÃO LIMITE DE SN 15

Se ω ∈ Bn(j), então ω esta formado pela concatenação de bn/jc blocos de tamanho j, maisum último bloco de tamanho r < j, o qual é o resto da divisão de n por j. Ou seja, dadoque n = jbn

jc+ r, podemos dividir ω em subpalavras xj

1 concatenadas assim,

ω = xj1x

j1 . . . x

j1︸ ︷︷ ︸

bnjc vezes

xr1.

Além do anterior, xj1 = xr

1xjr+1, ou seja, o bloco xr

1 é o começo de todos os blocos xj1. Assim,

quando nós conhecemos xj1, também conheceremos xr

1.

Dividiremos a prova em dois casos, quando 0 < c ≤ 1/2 e quando ocorre o contrário,1/2 < c < 1. Suponha que 0 < c ≤ 1/2. Nosso objetivo será aplicar, iterativamente, apropriedade β−mixing para limitar µ(ω). Para isso, começamos removendo de ω o blocox2j

j+1, resultando emµ(ω) ≤ µ(Xj

1 = xj1, X

n2j+1 = xn

2j+1). (2.18)

Vamos denotar β(j) = 2β(j). A propriedade β−mixing do processo diz que∑xj1,xn

2j+1

|µ(Xj1 = xj

1, Xn2j+1 = xn

2j+1)− µ(xj1)µ(xn

2j+1)| ≤ β(j).

Mas, a palavraxn

2j+1 = xj1x

j1 . . . x

j1︸ ︷︷ ︸

bnjc−2 vezes

xr1,

isso implica que nós só temos que somar com respeito a xj1, obtendo que∑

xj1

|µ(Xj1 = xj

1, Xn2j+1 = xn

2j+1)− µ(xj1)µ(xn

2j+1)|

≤∑

xj1,xn

2j+1

|µ(Xj1 = xj

1, Xn2j+1 = xn

2j+1)− µ(xj1)µ(xn

2j+1)|

≤ β(j)

O que nos leva a afirmar que,∑xj1

µ(Xj1 = xj

1, Xn2j+1 = xn

2j+1) ≤∑xj1

µ(xj1)µ(xn

2j+1) + β(j). (2.19)

Usando a equações (2.18) e (2.19) concluímos que∑xj1

µ(ω) ≤∑xj1

µ(xj1)µ(xn

2j+1) + β(j). (2.20)

Page 36: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

16 RESULTADOS OBTIDOS 2.1

Observe que µ(xj1) ≤ maxω∈χj µ(ω) = pj, logo,∑

xj1

µ(xj1)µ(xn

2j+1) ≤ maxω∈χj

µ(ω)∑xj1

µ(xn2j+1)

= pj

∑xj1

µ(xn2j+1), (2.21)

e portanto, substituindo (2.21) na desigualdade (2.20),∑xj1

µ(ω) ≤ pj

∑xj1

µ(xn2j+1) + β(j). (2.22)

Agora, removemos o bloco x4j3j+1 de xn

2j+1 e obtemos

µ(xn2j+1) ≤ µ(X3j

2j+1 = xj1, X

n4j+1 = xn

4j+1).

Segundo a propriedade β−mixing,∑xj1

|µ(X3j2j+1 = xj

1, Xn4j+1 = xn

4j+1)− µ(xj1)µ(xn

4j+1)|

≤∑

xj1,xn

4j+1

|µ(Xj1 = xj

1, Xn2j+1 = xn

4j+1)− µ(xj1)µ(xn

4j+1)|

≤ β(j).

Isso nós permite afirmar que,∑xj1

µ(X3j2j+1 = xj

1, Xn4j+1 = xn

4j+1) ≤∑xj1

µ(xj1)µ(xn

4j+1) + β(j).

Novamente, ∑xj1

µ(xj1)µ(xn

4j+1) ≤ maxω∈χj

µ(ω)∑xj1

µ(xn4j+1)

= pj

∑xj1

µ(xn4j+1), (2.23)

e substituindo a inequação (2.23) na inequação (2.22), resulta que∑xj1

µ(ω) ≤ p2j

∑xj1

µ(xn4j+1) + β(j)pj + β(j)

< p2j

∑xj1

µ(xn4j+1) + 2β(j).

Se continuarmos removendo, iterativamente, todos os blocos xij(i−1)j+1 com i par desde 6

até bnjc quando bn

jc for par e aplicando a propriedade β−mixing, também iterativamente,

Page 37: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

2.1 DISTRIBUIÇÃO LIMITE DE SN 17

teríamos que ∑xj1

µ(ω) < pk′n,j

j + (k′n,j − 1)β(j),

onde k′n,j = dbn/jc/2e. E se bn/jc for ímpar, removemos os blocos xij(i−1)j+1 com i par desde

6 até bnjc − 1 e usando repetidamente a propriedade β−mixing, obtemos∑

xj1

µ(ω) < pkn,j

j + (kn,j − 1)β(j),

onde kn,j = bbn/jc/2c. Em ambos casos,∑xj1

µ(ω) ≤ pkn,j

j + kn,jβ(j).

É importante ressaltar aqui que como foi suposto 0 < c ≤ 1/2, 1 ≤ kn,j ≤ b1/cc. Logo éverdade que,

µ(Bn(j)) < pj +

⌊1

c

⌋β(j). (2.24)

Agora, vamos limitar superiormente a quantidade pj. Usando a equação (2.15), pois o nossoprocesso por hipótese é β−mixing, fica que

pj ≤ inf1≤m<j

(ρm+1 +

βm(j)

2(1− ρ)

)= Cρ inf

1≤m<j(ρm + βm(j)), (2.25)

onde Cρ é uma constante que depende de ρ. Logo, substituindo a última desigualdade em(2.24), chegamos a

µ(Bn(j)) < Cρ inf1≤m<j

(ρm + βm(j)) +

⌊1

c

⌋β(j).

Como a função β é decrescente, β(j) ≤ βm(j) e βm(j) < βm(j) para todo m < j, e portanto

µ(Bn(j)) < Cc,ρ inf1≤m<j

(ρm + βm(j)),

onde Cc,ρ é uma constante que depende de c e ρ. Somando j desde dbcnc/2e até bcnc, temosque

bcnc∑j=dbcnc/2e

µ(Bn(j)) <

bcnc∑j=dbcnc/2e

inf1≤m<j

(ρm + βm(j)). (2.26)

Vamos estudar agora o segundo caso da prova, quando 1/2 < c < 1. Neste caso, podemospartir o somatório em dois, assim:

bcnc∑j=dbcnc/2e

µ(Bn(j)) =

bn/2c∑j=dbcnc/2e

µ(Bn(j)) +

bcnc∑j=bn/2c+1

µ(Bn(j)). (2.27)

Note que b1/cc = 1 porque c > 1/2, então pela desigualdade (2.24), o primeiro somatório

Page 38: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

18 RESULTADOS OBTIDOS 2.1

da equação anterior é

bn/2c∑j=dbcnc/2e

µ(Bn(j)) <

bn/2c∑j=dbcnc/2e

(pj + β(j)

).

Levando em consideração a inequação (2.25), temos que

bn/2c∑j=dbcnc/2e

µ(Bn(j)) ≤ Cρ inf1≤m<dbcnc/2e

bn/2c∑j=dbcnc/2e

(pm + βm(j)

)+

bn/2c∑j=dbcnc/2e

β(j).

E dado que a função β é decrescente, βm(j) ≥ β(j),

bn/2c∑j=dbcnc/2e

µ(Bn(j)) ≤ 2Cρ

bn/2c∑j=dbcnc/2e

inf1≤m<j

(pm + βm(j)

). (2.28)

Agora, vamos nos concentrar no segundo somatório à direita na inequação (2.27). Supo-nha que j > n/2. Logo, a palavra ω é composta pela concatenação de um bloco de tamanhoj, xj

1, e outro de tamanho r, xr1. Mas, lembremos que xr

1 esta determinado por xj1, pois

xj1 = xr

1xjr+1. A partir disso, temos que

ω = xj1x

r1 = xr

1xjr+1x

r1 = x

br/2c1 xj

br/2c+1xr1.

Como c < 1, n− j = r > 0, de fato r ≥ bn/4c. Removendo o bloco xjbr/2c+1 de ω, afirmamos

queµ(ω) ≤ µ(x

br/2c1 , xr

1). (2.29)

Usando a propriedade β−mixing∑xr1

|µ(xbr/2c1 , xr

1)− µ(xbr/2c1 )µ(xr

1)| ≤ β(j − br/2c).

Logo, ∑xr1

µ(xbr/2c1 , xr

1) ≤∑xr1

µ(xbr/2c1 )µ(xr

1) + β(j − br/2c),

o qual implica, pela expressão (2.29)∑xr1

µ(ω) ≤∑xr1

µ(xbr/2c1 )µ(xr

1) + β(j − br/2c),

ou seja que, ∑xj1

µ(ω) ≤ pbr/2c + β(j − br/2c), (2.30)

onde pbr/2c = maxµ(xbr/2c1 ). Usando a desigualdade (2.25), afirmamos que,

µ(Bn(j)) < Cρ inf1≤m<bn−j/2c

(ρm + βm

(n− j

2

))+ β(j − br/2c),

Page 39: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

2.1 DISTRIBUIÇÃO LIMITE DE SN 19

e somando j desde bn/2c+ 1 até bcnc, obtemos

bcnc∑j=bn/2c+1

µ(Bn(j)) < Cρ

bcnc∑j=bn/2c+1

inf1≤m<bn−j/2c

(ρm + βm

(n− j

2

))+ β(j − br/2c)

)

≤ Cρ

dn/4e∑j=bn(1−c)/2c

inf1≤m<j

(ρm + βm(j)

)+

cn∑j=bn/2c+1

β(j − br/2c). (2.31)

Como r < 1/2, j − br/2c ≥ j/2, portanto

bcnc∑j=bn/2c+1

β(j − br/2c) ≤bcnc∑

j=bn/2c+1

β(j/2)

≤bcnc/2∑

j=bn/4c

β(j).

Levando em conta que a função β é decrescente, βm(j) ≥ β(j) e que como bn(1 − c)/2c ≤bn/4c porque c > 1/2, a desigualdade (2.31) fica

bcnc∑j=bn/2c+1

µ(Bn(j)) < 2Cρ

bcnc/2∑j=bn(1−c)/2c

inf1≤m<j

(ρm + βm(j)

). (2.32)

Somamos as expressoes (2.28) e (2.32), lembrando que c > 1/2, obteremos

bcnc∑j=dbcnc/2e

µ(Bn(j)) < C∗ρ

bcnc∑j=bn(1−c)/2c

inf1≤m<j

(ρm + βm(j)

). (2.33)

Logo, segundo as inequações (2.26) e (2.33), é verdade que para qualquer constante c entrezero e um,

bcnc∑j=dbcnc/2e

µ(Bn(j)) < Kc,ρ

bcnc∑j=bc′nc

inf1≤m<j

(ρm + βm(j)

),

onde Kc,ρ é uma constante que depende de c e ρ e c′ = min{c/2, (1− c)/2}, acabando assim,a prova do lema.

Finalmente, vamos provar o teorema principal com ajuda dos lemas anteriores.

Demostração do Teorema 2.1Note que pela definição dos conjuntos Rn(j) e pelo processo ter gramática completa, temos

Page 40: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

20 RESULTADOS OBTIDOS 2.1

que

µ(Sn ≥ k) = µ

(n−1⋃i=k

Rn(i)

)

= µ

⌊n4

⌋⋃i=k

Rn(i)

+ µ

n−1⋃i=bn

4 c+1

Rn(i) \bn

4 c⋃j=k

Rn(j)

. (2.34)

Analisaremos o primeiro termo na equação (2.34)

µ

⌊n4

⌋⋃i=k

Rn(i)

= µ(Rn(k)) + µ(Rn(k + 1) \Rn(k)) + µ(Rn(k + 2) \Rn(k) ∪Rn(k + 1))

+ · · ·+ µ

Rn(⌊

n4

⌋) \

bn4 c−1⋃j=k

Rn(j)

= µ(Rn(k)) +

⌊n4

⌋∑i=k+1

µ

(Rn(i) \

i−1⋃j=k

Rn(j)

). (2.35)

Vamos estudar cada termo da equação (2.35) separadamente.Comecemos com o termo µ(Rn(k)). A idea é aplicar a propriedade β-mixing para limitaresta quantidade.

µ(Rn(k)) =∑

ω∈Rn(k)

µ(ω).

Se ω ∈ Rn(k), ω = xk1x

n−kk+1x

k1. Removemos o bloco do meio, xn−2k

k+1 , obtendo

µ(ω) ≤ µ(xk1, x

k1),

logo, ∑ω∈Rn(k)

µ(ω) ≤∑xk1

µ(xk1, x

k1).

Por outro lado, pela propriedade β-mixing que o processo nos fornece,∑xk1

|µ(xk1, x

k1)− µ2(xk

1)| ≤ β(n− 2k).

Portanto,

|µ(Rn(k))−∑xk1

µ2(xk1)| =

∣∣∣ ∑ω∈Rn(k)

µ(ω)−∑xk1

µ2(xk1)∣∣∣

≤∑xk1

|µ(xk1, x

k1)− µ2(xk

1)|

≤ β(n− 2k) (2.36)

Passamos agora ao somatório da equação (2.35). Se ω ∈ Rn(i), então ω = xi1x

n−2ii+1 x

i1. O

Page 41: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

2.1 DISTRIBUIÇÃO LIMITE DE SN 21

termo genérico do somatório é

µ

(Rn(i) \

i−1⋃j=k

Rn(j)

)=

∑ω/∈⋃i−1

j=k Rn(j)

µ(ω)

=∑

ω:xi1 /∈⋃i−1

j=k Ri(j)

µ(ω).

Com o objetivo de usar a propriedade β que o processo nos fornece, removemos o bloco xn−2ii+1

de ω obtendo queµ(xi

1xn−2ii+1 x

i1) ≤ µ(xi

1, xi1).

Portanto, ∑xi1 /∈⋃i−1

j=k Ri(j)

∣∣∣µ(xi1, x

i1)− µ2(xi

1)∣∣∣ ≤ β(n− 2i).

Isso nos permite afirmar que

∣∣∣µ(Rn(i) \i−1⋃j=k

Rn(j)

)−

∑xi1 /∈⋃i−1

j=k Ri(j)

µ2(xi1)∣∣∣ =

∣∣∣ ∑ω/∈⋃i−1

j=k Ri(j)

µ(ω)−∑

xi1 /∈⋃i−1

j=k Ri(j)

µ2(xi1)∣∣∣

≤∑

xi1 /∈⋃i−1

j=k Ri(j)

|µ(xi1, x

i1)− µ2(xi

1)|

≤ β(n− 2i)

Somando nos dois lados da desigualdade anterior, desde i = k + 1, até⌊

n4

⌋, temos que,∣∣∣∣∣∣∣

⌊n4

⌋∑i=k+1

µ

(Rn(i) \

i−1⋃j=k

Rn(j)

)−

⌊n4

⌋∑i=k+1

∑ω/∈∪i−1

j=kRi(j)

µ2(ω)

∣∣∣∣∣∣∣ ≤⌊

n4

⌋∑i=k+1

β(n− 2i)

≤n2 − (k + 1)∑

i=dn4e

β(2i). (2.37)

Analisaremos agora o segundo somando na equação (2.34). Observe que aplicando a relaçãode dualidade,

µ

n−1⋃i=bn

4 c+1

Rn(i) \bn

4 c⋃j=k

Rn(j)

≤ µ

n−1⋃i=bn

4 c+1

Rn(i)

≤ µ

b 3n4 c⋃

i=1

Bn(i)

.

Page 42: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

22 RESULTADOS OBTIDOS 2.1

Substituindo µ(Sn ≥ k) na seguinte expressão, temos que

|µ(Sn ≥ k)− E(µ(Xk1 ))− ak| ≤

|µ(Rn(k)) +

⌊n4

⌋∑i=k+1

µ

(Rn(i) \

i−1⋃j=k

Rn(j)

)+ µ

b 3n4 c⋃

i=1

Bn(i)

− E(µ(Xk1 ))− ak|.

Para facilitar a prova do teorema, denotemos por

ak,n =

⌊n4

⌋∑i=k+1

∑ω/∈∪i−1

j=kRi(j)

µ2(ω). (2.38)

Somando e subtraindo o termo ak,n chegamos a

|µ(Sn ≥ k)− E(µ(Xk1 ))− ak| ≤

|µ(Rn(k))−E(µ(Xk1 ))|+|

bn4 c∑

i=k+1

µ

(Rn(i) \

i−1⋃j=k

Rn(j)

)−ak,n|+|ak,n−ak|+µ

b 3n4 c⋃

i=1

Bn(i)

.

(2.39)

Agora, pelas equações (2.36) e (2.37), temos que

|µ(Rn(i))− E(µ(Xk1 ))|+ |

bn4 c∑

i=k+1

µ

(Rn(i) \

i−1⋃j=k

Rn(j)

)− ak,n| ≤

dn2 e−k∑

i=bn4 cβ(2i). (2.40)

A equação (2.16) garante que

|ak,n − ak| =∞∑

i=bn4 c+1

∑ω/∈∪i−1

j=kRi(j)

µ2(ω)

≤∞∑

i=bn4 c+1

E(µ(X i1))

≤∞∑

i=bn4 c+1

inf1≤m<i

(ρm+1 +

βm(i)

2(1− ρ)

). (2.41)

E, pelo Lema (2.8), com c = 3/4 temos que

µ

b 3n4 c⋃

i=1

Bn(i)

≤ K ′ρ

b 3n4 c∑

j=bn8 c

inf1≤m<j

(ρm + βm(j)

). (2.42)

Page 43: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

2.1 DISTRIBUIÇÃO LIMITE DE SN 23

Somando as equações (2.41) e (2.42), lembrando que βm(i) ≤ βm(i), obtemos que

∞∑i=bn

4 c+1

inf1≤m<i

(ρm+1+

βm(i)

2(1− ρ)

)+K ′

ρ

b 3n4 c∑

j=bn8 c

inf1≤m<j

(ρm+βm(j)

)≤ C ′

ρ

∞∑i=bn

8 cinf

1≤m<i

(ρm+βm(i)

).

(2.43)Substituindo as inequações (2.40) e (2.43), na desigualdade (2.39), chegamos a

|µ(Sn ≥ k)− E(µ(Xk1 ))− ak| ≤

dn2 e−k∑

i=bn4 cβ(2i) + C ′

ρ

∞∑i=bn

8 cinf

1≤m<i

(ρm + βm(i)

).

Lembremos que a nossa função β é decrescente, e portanto, βm(i) ≥ β(i) ≥ β(2i), chegandoassim ao resultado procurado na primeira parte do teorema,

|µ(Sn ≥ k)− E(µ(Xk1 ))− ak| ≤ Kρ

∞∑i=bn

8 cinf

1≤m<i

(ρm + βm(i)

),

onde Kρ é uma contante que depende de ρ.

Vamos provar agora a convergência que será provada em duas partes. Primeiro, a con-vergência do somatório com termos ρm e depois o somatório com termos βm(i). Para isso,tomemos m = logρ(1/f(i)), onde f(i) = i(ln i)1+ε para algum ε entre 0 e 1. Então,

∞∑i=bn

8 cinf

1≤m<i

(ρm + βm(i)

)≤

∞∑i=bn

8 c

(ρlogρ(1/f(i)) + βlogρ(1/f(i))(i)

)

=∞∑

i=bn8 c

( 1

f(i)+ β

(⌊ i

logρ(1/f(i))

⌋− 1))

=∞∑

i=bn8 c

1

f(i)+

∞∑i=bn

8 cβ(⌊ i

logρ(1/f(i))

⌋− 1). (2.44)

Queremos encontrar o limite da equação anterior quando n diverge. É claro que o limitedo primeiro somatório de termos 1/f(i) tem limite zero porque esta série é somável. Assim,voltaremos nossa atenção à soma com termos β. O limite que nós procuramos, é igual aolimite da expressão

∑∞i=bn

8 c β(biρ0/ ln ic), onde ρ0 = − ln ρ/2. Note que ρ0 > 0 porqueln ρ < 0. Vamos provar que este limite é zero. Comecemos afirmando que

i

logρ(1/f(i))=

i ln ρ

ln(1/f(i))=−i ln ρln f(i)

, (2.45)

Note que ln f(i) = ln i+ (1 + ε) ln(ln i). Além disso, ln i < i para todo i e como ε < 1, então

ln f(i) < 2 ln i.

i

ln f(i)>

i

2 ln i.

Page 44: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

24 RESULTADOS OBTIDOS 2.1

Nosso objetivo agora será contar, para i fixo, o número de inteiros h tais que

h

lnh∈[⌊ i

ln i

⌋,

⌊i

ln i

⌋+ 1). (2.46)

Para contar tais h, vamos estudar o incremento (i+1)/ ln(i+1)−i/ ln i. Para i suficientementegrande, temos que

i+ 1

ln(i+ 1)− i

ln i≥ 1

2 ln(i+ 1).

A quantidade de h que satisfaz (2.46) é menor ou igual à quantidade de h tal que⌊i

ln i

⌋+

h

ln(i+ 1)∈[⌊ i

ln i

⌋,

⌊i

ln i

⌋+ 1). (2.47)

Isto é porque no mesmo intervalo [bi/ ln ic, bi/ ln ic+ 1) estamos contando mais pontos. Daexpressão (2.47) obtemos que

h <2

ρ0

ln(i+ 1). (2.48)

Logo, como β é uma função decrescente,

∞∑i=bn/8c

β(⌊ iρ0

ln i

⌋)≤

∞∑i=⌊bn/8cρ0lnbn/8c

⌋2 ln(i+ 1)

ρ0

β(i) =2

ρ0

∞∑i=⌊bn/8cρ0lnbn/8c

⌋ ln(i+ 1)β(i)

E como por hipótese ln iβ(i) é somável, obtemos o limite zero que procurávamos, e com issotermina nossa prova.

Demostração da Proposição 2.3Para provar esta proposição, nós nos baseamos no fato de que o termo ak = limn→∞ ak,n paraak,n como foi definido em (2.38). Por isso, vamos nos concentrar nessa última expressão. Éclaro que

ak,n =

⌊n4

⌋∑i=k+1

µ

(Rn(i) \

i−1⋃j=k

Rn(j)

)=

⌊n4

⌋∑i=k+1

µ(Rn(i))−

⌊n4

⌋∑i=k+1

µ

(Rn(i) ∩

i−1⋃j=k

Rn(j)

)

Observe que µ(Rn(i) ∩

⋃i−1j=k Rn(j)

)≥ µ(Rn(i) ∩Rn(k)), logo,

⌊n4

⌋∑i=k+1

µ

(Rn(i) \

i−1⋃j=k

Rn(j)

)≤

⌊n4

⌋∑i=k+1

µ(Rn(i))−

⌊n4

⌋∑i=k+1

µ(Rn(i) ∩Rn(k)) (2.49)

Se ω ∈ Rn(i), ω = xi1x

n−2ii+1 x

i1. Removendo o bloco xn−2i

i+1 , obtemos que

µ(ω) ≤ µ(xi1, x

i1),

Page 45: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

2.1 DISTRIBUIÇÃO LIMITE DE SN 25

e, pela propriedade β-mixing do processo

|µ(Rn(i))− E(µ(X i1))| =

∣∣∣ ∑ω∈Rn(i)

µ(ω)−∑xi1

µ2(xi1)∣∣∣

≤∑xi1

|µ(xi1, x

i1)− µ2(xi

1)|

≤ β(n− 2i)

Logo,µ(Rn(i)) ≤ E(µ(X i

1)) + β(n− 2i). (2.50)

Por outro lado, temos que

µ(Rn(i) ∩Rn(k)) =∑

ω∈Rn(i)∩Rn(k)

µ(ω)

=∑

ω∈Rn(k)

µ(xi1x

n−2ii+1 x

i1).

Removendo o bloco xn−2ii+1 ,

µ(Rn(i) ∩Rn(k)) <∑

xi1∈Ri(k)

µ(xi1, x

i1).

Aplicando a propriedade β-mixing do processo chegamos a

|µ(Rn(i) ∩Rn(k))−∑

xi1∈Ri(k)

µ2(xi1)| =

∣∣∣ ∑xn1∈Rn(i)∩Rn(k)

µ(xn1 )−

∑xi1∈Ri(k)

µ2(xi1)∣∣∣

≤∑

xi1∈Ri(k)

|µ(xi1, x

i1)− µ2(xi

1)|

≤ β(n− 2i).

Portanto,µ(Rn(i) ∩Rn(k)) ≥

∑ω∈Ri(k)

µ2(ω)− β(n− 2i). (2.51)

Se somarmos em i desde k+ 1 até bn/4c e se levarmos em conta as equações (2.50) e (2.51),na equação (2.49), teremos que

⌊n4

⌋∑i=k+1

µ

(Rn(i) \

i−1⋃j=k

Rn(j)

)=

⌊n4

⌋∑i=k+1

µ(Rn(i))−

⌊n4

⌋∑i=k+1

µ(Rn(i) ∩Rn(k))

⌊n4

⌋∑i=k+1

E(µ(X i1))−

⌊n4

⌋∑i=k+1

∑ω∈Ri(k)

µ2(ω) + 2

⌊n4

⌋∑i=k+1

β(n− 2i)

=

⌊n4

⌋∑i=k+1

E(µ(X i1))−

⌊n4

⌋∑i=k+1

∑ω∈Ri(k)

µ2(ω) + 2

n2 − (k + 1)∑

i=dn4e

β(2i).

Como ln iβ(i) é somavel por hipótese, β(i) é somável também, ficando assim provada a nossa

Page 46: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

26 RESULTADOS OBTIDOS 2.1

proposição.

Demostração do Proposição 2.4Da mesma maneira que se começou a proposição anterior, temos que

ak,n =

⌊n4

⌋∑i=k+1

µ

(Rn(i) \

i−1⋃j=k

Rn(j)

)≥

⌊n4

⌋∑i=k+1

µ(Rn(i))−

⌊n4

⌋∑i=k+1

i−1∑j=k

µ(Rn(i) ∩ µ(Rn(j)).

Pelas equações (2.50) e (2.51),⌊

n4

⌋∑i=k+1

µ

(Rn(i) \

i−1⋃j=k

Rn(j)

)≥

⌊n4

⌋∑i=k+1

E(µ(X i1))−

⌊n4

⌋∑i=k+1

i−1∑j=k

∑ω∈Ri(k)

µ2(ω) +

⌊n2

⌋−k∑

i=⌊

n4

⌊n2

⌋−k∑

j=i

β(2i).

Vamos desenvolver o somatório∑⌊

n2

⌋−k

i=⌊

n4

⌋ ∑⌊n2

⌋−k

j=i β(2i).

⌊n2

⌋−k∑

i=⌊

n4

⌊n2

⌋−k∑

j=i

β(2i) =

⌊n2

⌋−k∑

j=⌊

n4

⌋ β(2i) +

⌊n2

⌋−k∑

j=⌊

n4

⌋+ 1

β(2i) + · · ·+ β(2(⌊

n2

⌋− k))

=

⌊n2

⌋−k∑

i=bn4 c

(i−⌊n

4

⌋)β(2i).

Usando a hipótese da somabilidade de i ln iβ(i) concluímos nossa proposição.

No seguinte exemplo, mostramos um processo que satisfaz as condições do Teorema 2.1

2.1.1 Exemplos

2.1.1.1 Exemplo 1

Este exemplo mostra um processo que cumpre as condições do Teorema 2.1.

Considere uma cadeia de Markov {Yn}n∈N, com espaço de estados {0, 1, 2, . . . }, e oscomponentes da matriz de transição QY dadas por:

QY (y, 0) = 1− qy

QY (y, y + 1) = qy,

para 0 < qy < 1 e 0 nos outros casos. A figura seguinte mostra graficamente tal processo.

Esse processo foi objeto de estudo de Fernández, Ferrari e Galves em [12]. A cadeia deMarkov define um processo de renovação. Sejam Y0 = 0,

T1 = inf{n ≥ 1 : Yn = 0} eTm = inf{n ≥ Tm−1 : Yn = 0}, para todo m ≥ 2.

As propriedades de Markov garantem que as variáveis aleatórias T1, T2 − T1, . . . , Tm −

Page 47: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

2.1 DISTRIBUIÇÃO LIMITE DE SN 27

Figura 2.1: Cadeia {Yn}n≥0

Tm−1, m ≥ 1 são independentes a cada duas e, que se denotarmos por Zm = Tm−Tm−1, m ≥2, as variáveis {Zm}m≥2, são identicamente distribuídas. Vamos calcular a distribuição deZm.

µ(Zm = k) =∞∑i=1

µ(Tm = k + i|Tm−1 = i)µ(Tm−1 = i)

=∞∑i=1

q0q1 . . . qk−2(1− qk−1)µ(Tm−1 = i)

= (1− qk−1)k−2∏i=0

qj para todo m ≥ 2.

Agora vejamos que o valor esperado de Zm não depende dem. Se maxj qj existe e maxj qj < 1,pode-se provar que, de fato, E(Zm) não depende de m. Por isso, vamos considerar o seguintecaso, um pouco mais interessante, pois limj→∞ qj = 1.Sejam q0 = 1 e qj =

(j

j+1

)s

, onde s ∈ R+. Nesse caso, temos que para m ≥ 2

E(Zm) =∞∑

k=2

k(1− qk−1)k−2∏i=0

qj

=∞∑

k=2

k(1− k − 1

k)

(1

k − 1

)s

=∞∑

k=2

(1

k − 1

)s

.

A última expressão converge quando s > 1.Vamos definir o processo que indica quando o {Yn}n≥0 é igual a zero, ie. definimos o processo{Xn}n≥0 no alfabeto {0, 1} tal que Xn = 1 quando Yn = 0, e Xn = 0 quando Yn assume umvalor diferente de zero. Isto é, Xn = G(yn), com

G : {0, 1, . . . } → {0, 1}

x 7→{

1 se y = 0,0 se y > 0.

A distribuição de {Xn}n≥0 é unicamente determinada pela distribuição de {Zn}n≥0. Paraconcluir se a sequência {Xn}n≥0 é β-mixing com coeficientes somáveis, vamos a aplicar oseguinte teorema extraído de [10]:

Page 48: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

28 RESULTADOS OBTIDOS 2.1

Teorema 2.9. Seja P uma distribuição de probabilidade sobre os números naturais e sejamZ ′

1, Z′2, ... variáveis aleatórias independentes com distribuição comum P tal que, o máximo

divisor comum, mdc{i : P (i) > 0} = 1. Suponha que o valor esperado de Z ′m existe para todo

m. Considere também o processo,

X ′n =

{1 se n = Z ′

1 + Z ′2 + · · ·+ Z ′

t para algum t0 caso contrário,

então, P tem r−ésimo momento finito, com r > 1 se e somente se∑

n≥1 nr−2β(n) < ∞

para o processo de renovação {X ′n}n≥0.

Para que o teorema anterior seja válido no nosso exemplo, falta verificar que se cumpremas hipóteses.

{i : µ(Zm = i) > 0} = {i :1

i(i− 1)s> 0},

logo mdc{i : µ(Zm = i) > 0} = 1. Agora, vamos provar que a distribuição do processo derenovação tem algum momento finito.

E(Zrm) =

∞∑k=2

kr(1− qk−1)k−2∏i=0

qj.

No caso onde maxj qj < 1, pode-se provar que existem todos os momentos finitos de ordemr ≥ 2. Mas no nosso caso, quando qj =

(j

j+1

)s

acontece o seguinte:

E(Zrm) =

∞∑k=2

kr(1− qk−1)k−2∏i=0

qj

=∞∑

k=2

kr(1− k − 1

k

)( 1

k − 1

)s

=∞∑

k=2

kr−1

(k − 1)s,

onde a última linha converge para r < s. Podemos concluir que o processo de renavação{Xn}n∈N é β-mixing com coeficientes ln jβ(j) somáveis se r for maior que dois, para o qualseria necessário que s seja maior do que três. Note que o processo {Xn}n∈N tem gramáticacompleta, pois qualquer sequência de zeros e uns tem probabilidade positiva de acontecer,então vale o Teorema 2.1 e, portanto, existe a distribuição limite para a variável aleatóriaSn.

No próximo exemplo, vamos ver um processo ergódico não β-mixing, com entropia posi-tiva para o qual não vale o Teorema 2.1.

2.1.1.2 Exemplo 2

Este exemplo mostra um processo que não é β−mixing com gramática completa e quenão cumpre o Teorema 2.1.

Seja {Xn}n≥0 um processo definido sobre o alfabeto {1, 2, 3, 4}. Considere as etiquetasA, para indicar quando o processo pertence a {1, 2} e B para indicar quando o processopertence a {3, 4}. Lança-se uma moeda não tendenciosa para indicar se X0 ∈ A ou X0 ∈ B

Page 49: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

2.1 DISTRIBUIÇÃO LIMITE DE SN 29

e considere ε > 0. Se X0 ∈ A, para n ≥ 1, temos

X2n ∈{A com probabilidade 1− ε,B com probabilidade ε,

eX2n+1 ∈

{B com probabilidade 1− ε,A com probabilidade ε.

Se X0 ∈ B, ocorrerá o contrário. Nos n pares, Xn terá probabilidade 1− ε de pertencer a Be probabilidade ε de pertencer a A. Para n ímpar, Xn terá probabilidade 1− ε de pertencera A e probabilidade ε de pertencer a B. Desta maneira, o processo gerado tem gramáticacompleta.

O processo descrito anteriormente não perde memória e, por isso, ele não é β-mixing.Para ilustrar isto, considere a seguinte situação para qualquer j ≥ 1 e n fixo.

µ(Xn = 1, Xn+j = 1) =1

2µ(Xn = 1, Xn+j = 1|X0 ∈ A) +

1

2µ(Xn = 1, Xn+j = 1|X0 ∈ B),

o qual implica que

µ(Xn = 1, Xj+n = 1) =

{18(ε2 + (1− ε)2) se j for par, ou,

14ε(1− ε) se n for ímpar.

Agora, sem importar se n é par ou ímpar,

µ(Xn = 1) =1

2µ(Xn = 1|X0 ∈ A) +

1

2µ(Xn = 1|X0 ∈ B)

=1

4.

Logo, o nosso processo não é β-mixing. Por outro lado, a função de sobreposição Sn, nãoconverge em distribuição. Intuitivamente isto é porque a função Sn, toma valores alternadosdependendo se n for par ou não. Comecemos analizando µ(S2n = 2k) para k < n usando ωj

para denotar uma palavra de tamanho j.

µ(S2n = 2k) ≤ µ(R2n(2k))

≤ 1

2µ(X2k

1 = ω2k, X2n2n−2k+1 = ω2k|X0 ∈ A) +

1

2µ(X2k

1 = ω2k, X2n2n−2k+1 = ω2k|X0 ∈ B)

= (ε2 + (1− ε)2)2k.

Portanto, µ(S2n = 2k + 1) > 1− (ε2 + (1− ε)2)2k. Agora,

µ(S2n+1 = 2k + 1) ≤ µ(R2n+1(2k + 1))

≤ 1

2µ(X2k+1

1 = ω2k+1, X2n+12n+1−2k = ω2k+1|X0 ∈ A)+

1

2µ(X2k+1

1 = ω2k+1, X2n+12n+1−2k = ω2k+1|X0 ∈ B)

= (ε2 + (1− ε)2)2k+1.

Isto implica que o comportamento da µ(Sn = k) se intercala dependendo do valor de n parou não, o que nós leva a afirmar que a variável Sn não converge em distribuição.

Page 50: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

30 RESULTADOS OBTIDOS 2.1

2.1.1.3 Exemplo 3

Nesta subseção vamos mostrar, usando simulação, dois exemplos onde a probabilidadede Sn = −1 converge. Primeiro consideremos a cadeia de Markov do Exemplo 1.11 a qualnão tem gramática completa mas é β-mixing. Esta cadeia assume valores no conjunto χ ={0, 1, 2} e tem as seguintes probabilidades de transição:

P=

0 1 2

0 1− q0 q0 01 1− q1 0 q12 1− q2 0 q2

onde 0 < qi < 1, para i = 0, 1, 2.

Note que Sn não pode ser menor que −1, pois basta, no máximo, um passo só para queuma palavra que não tenha sobreposição comece de novo. Para esta primeira simulação,tomamos q0 = 0.2, q1 = 0.3, q2 = 0.4 e depois q0 = 0.5, q1 = 0.7, q2 = 0.9. Em amboscasos calculamos µ(Sn = −1) para n desde 2 até 15. Os gráficos resultantes mostram aconvergência desta probabilidade.

Figura 2.2: Convergência 1 de µ(Sn = −1).

Page 51: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

2.1 DISTRIBUIÇÃO LIMITE DE SN 31

Figura 2.3: Convergência 2 de µ(Sn = −1).

No segundo exemplo, considere {Xn}n≥0 um processo estocástico assumindo valores noalfabeto χ = {0, 1}. Lança-se uma moeda não tendenciosa para determinar se X0 = 1 ouX0 = 0, e para n ≥ 1, as probabilidades de transição são dadas da seguinte maneira:

µ(Xn = 1|Xn−1 = 1) = µ(Xn = 0|Xn−1 = 1) =1

2.

Se Xn−1 = 0 então, devemos contar o número de zeros consecutivos no passado até o primeiro1. Suponhamos que esse primeiro 1 no passado é encontrado em ln, ou seja, Xln = 1. Alémdisso, Xn−1

ln+1 = 0n−1ln+1 onde 0n−1

ln+1 representa um bloco de zeros de tamanho n− ln − 1. Assim,

µ(Xn = 1|Xn−1ln+1 = 0n−1

ln+1) = µ(Xn = 0|Xn−1ln+1 = 0n−1

ln+1) =1

2,

se n− ln for ímpar. Com esta mesma notação em mente, se n− ln for par,

µ(Xn = 1|Xn−1ln−1 = 0n−1

ln−1) = 1.

Informalmente falando, se Xn−1 = 1 então Xn = 0 ou Xn = 1 com probabilidade igual a1/2 independentemente do que aconteceu no processo antes do tempo n − 1. Se Xn−1 = 0,então devemos contar o número de zeros consecutivos que antecederam o tempo n − 1 atéachar o primeiro 1. Se o número total de zeros (Xn−1 incluso) for ímpar, Xn = 1 ou Xn = 0com probabilidade igual a 1/2. Agora se esse número for par, o próximo estado do processo,em n, é obrigatoriamente 0. Isto implica que o processo não apresenta blocos de zeros detamanho par com probabilidade positiva, portanto, o processo não tem gramática completa.

A pergunta que nós fazemos é se µ(Sn = −1) converge quando não sabemos se esteprocesso é β-mixing. Para pesquisar a resposta, foram simuladas palavras de um processocom estas características. Os tamanhos das palavras variavam entre 2 e 20 e foi calculadapara cada uma a probabilidade de Sn = −1. Note que Sn não pode ser menor que −1, poisbasta no máximo, um passo só para que uma palavra que não tenha sobreposição comecede novo. Os resultados são representados no seguinte gráfico:

Page 52: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

32 RESULTADOS OBTIDOS 2.2

Figura 2.4: Convergência 3 de µ(Sn = −1).

Os exemplos anteriores mostraram que µ(Sn = k) pode convergir mesmo com k negativonum processo sem gramática completa.

2.2 Limite da Esperança de SnSeguindo a linha de trabalho proposta, vamos analisar o limite da esperança de Sn.

É claro que o fato de conhecer a forma explícita de tal distribuição talvez nos daria umresultado mais direto. Mas a dificuldade (e a beleza) desse problema se encontra justamenteno fato de Sn não possuir uma forma explícita simples de distribuição de probabilidade. Ouseja, não se conhece uma expressão FSn para a distribuição de Sn.Primeiro, vamos apresentar o enunciado do teorema, e logo, os lemas que sustentarão aprova.

Teorema 2.10. Seja µ uma medida de probabilidade definida em χN para um processo β-mixing com gramática completa. Então,∣∣∣E(Sn)−

∞∑k=1

(E(µ(Xk

1 )) + ak

)∣∣∣ ≤ K ′ρ

∞∑i=bn/8c

iεβ(i), (2.52)

onde K ′ρ é uma contante que depende só de ρ e εβ(i) e ak como foram definidos no Teorema

2.1. Se, além do anterior, o processo é tal que i ln iβ(i) é somável, então

limn→∞

∞∑i=dn/8e

iεβ(i) = 0,

o que implica que

limn→∞

E(Sn) =∞∑

k=1

(E(µ(Xk

1 )) + ak

). (2.53)

Para a prova do teorema vamos usar o seguinte lema.

Page 53: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

2.2 LIMITE DA ESPERANÇA DE SN 33

Lema 2.11. Sejam µ uma medida de probabilidade definida em χN para um processo β-mixing e 0 < b < 1 uma constante. Então,

n−1∑k=bbnc

µ(Sn ≥ k) ≤ nKb,ρ

dn(1−b)e∑i=bb′nc

inf1≤m<i

(ρm + βm(i)

),

onde Kρ,b é uma constante que depende de ρ e de b e b′ = min{b/2, (1− b)/2}.

Demonstração. Usando a relação de dualidade 1.18 e o fato do processo ter gramática com-pleta, temos que

µ(Sn ≥ k) = µ(n−1⋃

i=k

Rn(i))

= µ(n−k⋃

i=1

Bn(i)). (2.54)

Somando em i desde bbnc até n− 1, obtemos que,

n−1∑k=bbnc

µ(Sn ≥ k) =n−1∑

k=bbnc

µ(n−k⋃

i=1

Bn(i))

=

dn(1−b)e∑k=1

µ( k⋃

i=1

Bn(i)). (2.55)

Vamos limitar superiormente a desigualdade (2.55) usando a união maior, ou seja, µ(⋃dn(1−b)e

i=1 Bn(i)).

n−1∑k=bbnc

µ(Sn ≥ k) ≤ dn(1− b)eµ(dn(1−b)e⋃

i=1

Bn(i))

≤ dn(1− b)eCb,ρ

dn(1−b)e∑i=bb′nc

inf1≤m<i

(ρm + βm(i)

), (2.56)

onde a última linha foi obtida aplicando o Lema 2.8. Aqui b′ = min{b/2, (1 − b)/2}, como qual acaba a prova do lema, pois reescrevendo as constantes na expressão à direita nadesigualdade (2.56) chegamos ao nosso resultado.

Demostração do Teorema 2.10Dado que o nosso processo tem gramática completa, os valores assumidos pela variávelaleatória Sn estão entre 0 e n− 1, portanto, a esperança de Sn pode ser escrita da seguintemaneira,

E(Sn) =n−1∑k=1

µ(Sn ≥ k).

Page 54: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

34 RESULTADOS OBTIDOS 2.2

Dessa forma, podemos substituir esta expressão na seguinte equação, obtendo que

∣∣∣E(Sn)−∞∑

k=1

(E(µ(Xk

1 )) + ak

)∣∣∣ =∣∣∣n−1∑k=1

µ(Sn ≥ k)−∞∑

k=1

(E(µ(Xk

1 )) + ak

)∣∣∣≤

n−1∑k=1

∣∣∣µ(Sn ≥ k)− E(µ(Xk1 ))− ak

∣∣∣+ ∞∑k=n

(E(µ(Xk

1 )) + ak

).

(2.57)

Agora analisaremos cada somatório da desigualdade (2.57) separadamente. Começamos di-videndo o primeiro termo para usar a desigualdade triangular obtendo que

n−1∑k=1

∣∣∣µ(Sn ≥ k)−E(µ(Xk1 ))−ak

∣∣∣ ≤ bn/4c∑k=1

∣∣∣µ(Sn ≥ k)−E(µ(Xk1 ))−ak

∣∣∣+ n−1∑k=bn/4c+1

∣∣∣µ(Sn ≥ k)−E(µ(Xk1 ))−ak

∣∣∣.(2.58)

Nós concentraremos no primeiro somatório à direita na inequação (2.58). Pelo Teorema 2.1,

bn/4c∑k=1

∣∣∣µ(Sn ≥ k)− E(µ(Xk1 ))− ak

∣∣∣ ≤ Kρ

bn/4c∑k=1

∞∑i=bn/8c

inf1≤m<i

(ρm + βm(i)

)= Kρ

⌊n4

⌋ ∞∑i=bn/8c

inf1≤m<i

(ρm + βm(i)

)(2.59)

Passamos a analisar o segundo somatório da desigualdade (2.58). Pela desigualdade trian-gular, temos

n−1∑k=bn/4c+1

∣∣∣µ(Sn ≥ k)− E(µ(Xk1 ))− ak

∣∣∣ ≤ n−1∑k=bn/4c+1

µ(Sn ≥ k) +n−1∑

k=bn/4c+1

(E(µ(Xk1 )) + ak)

(2.60)

Vamos estudar separadamente cada somatório na inequação (2.60). Pelo Lema 2.11, tomandob = 1/4, afirmamos que

n−1∑k=bn/4c+1

µ(Sn ≥ k) ≤ nKρ

d3n/4e∑i=bn/8c

inf1≤m<i

(ρm + βm(i)

)(2.61)

Por outro lado, somamos o segundo somatório na desigualdade (2.57) com o segundo soma-tório da desigualdade (2.60) e afirmamos que

∞∑k=bn/4c+1

(E(µ(Xk1 )) + ak) ≤

∞∑k=bn/4c+1

∞∑i=k

E(µ(X i1)) (2.62)

Page 55: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

2.2 LIMITE DA ESPERANÇA DE SN 35

pois ak ≤∑∞

i=k+1 E(µ(X i1)). Vamos desenvolver o último somatório.

∞∑k=bn/4c+1

∞∑i=k

E(µ(X i1)) =

∞∑i=bn/4c+1

E(µ(X i1)) +

∞∑i=bn/4c+2

E(µ(X i1)) + · · ·+

∞∑i=n

E(µ(X i1)) + . . .

= E(µ(Xbn/4c+11 )) + 2E(µ(X

bn/4c+21 )) + · · ·+

⌈3n

4

⌉E(µ(Xn

1 )) + . . .

=∞∑

i=bn/4c+1

(i−⌊n

4

⌋)E(µ(X i

1))

<∞∑

i=bn/4c+1

iE(µ(X i1))

Acharemos agora um limitante superior para iE(µ(X i1)). Usando a expressão (2.16) temos

que,∞∑

i=bn/4c+1

iE(µ(X i1)) ≤

∞∑i=bn/4c+1

i inf1≤m<i

(ρm +

βm(i)

2(1− ρ)

). (2.63)

De forma a concluir a primeira parte do teorema, somamos as desigualdades (2.59), (2.61)e (2.63) e obtemos o resultado procurado.

Agora, vamos a provar a convergência. Para isso, tomamos m = logρ(1/f(i)), ondef(i) = i2(ln i)1+ε para algum ε > 0. Nós queremos encontrar

limn→∞

∞∑i=bn

8 cinf

1≤m<ii(ρm + βm(i)

)≤ lim

n→∞

∞∑i=bn

8 c

i

f(i)+ lim

n→∞

∞∑i=bn

8 ciβ(⌊ i

logρ(1/f(i))

⌋− 1).

(2.64)O primeiro limite à direita na desigualdade é igual a zero porque 1/i(ln i)1+ε é somável.Assim, voltaremos nossa atenção à soma com termos β. O limite que nós procuramos, éigual ao limite da expressão

∑∞i=bn

8 c β(biρ1/ ln ic), onde ρ1 = − ln ρ/3. Note que ρ1 > 0

porque ln ρ < 0. Vamos provar que este limite é zero. Comecemos afirmando que

ln f(i) < 3 ln i,

pois ln f(i) = 2 ln i+ (1 + ε) ln(ln i), ln i < i para todo i e ε < 1. Portanto,

i

ln f(i)>

i

3 ln i. (2.65)

Usando o mesmo procedimento feito para contar os inteiros h que satisfaziam a condição(2.46) na prova do Teorema 2.1 se obtém uma desigualdade similar à apresentada na expres-são (2.48), com ajuda das equações (2.65) e (2.45), concluindo que o número de inteiros hque satisfazem (2.46), neste caso é

h <3

ρ1

ln(i+ 1).

Page 56: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

36 RESULTADOS OBTIDOS 2.3

Como β é uma função decrescente,

∞∑i=bn/8c

iβ(⌊ iρ1

ln i

⌋)≤

∞∑i=⌊bn/8cρ1lnbn/8c

⌋3i ln(i+ 1)

ρ1

β(i) =3

ρ1

∞∑i=⌊bn/8cρ1lnbn/8c

⌋ i ln(i+ 1)β(i). (2.66)

E como por hipótese i ln iβ(i) é somável, obtemos o limite zero que procurávamos, com oqual finalizamos nossa prova.

2.3 Limite do Segundo Momento Finito de SnSeguindo a estrutura das seções anteriores, começamos enunciando o teorema principal,

o seu corolário e a seguir o lema que sustenta as provas.

Teorema 2.12. Seja µ uma medida de probabilidade definida em χN para um processo β-mixing com gramática completa. Então,∣∣∣E(S2

n)−∞∑

k=1

(2k − 1)(E(µ(Xk1 )) + ak)

∣∣∣ ≤ K ′′ρ

∞∑i=bn/8c

i2εβ(i),

onde K ′′ρ é uma constante que depende só de ρ e εβ(i) e ak como foram definidos no Teorema

2.1. Se, além do anterior, o processo é tal que i2 ln iβ(i) é somável, então

limn→∞

∞∑i=dn/8e

i2εβ(i) = 0,

o que implica que

limn→∞

E(S2n) =

∞∑k=1

(E(µ(Xk

1 )) + ak

). (2.67)

O interesse que tem a quantidade E(S2n) vem da possibilidade que este oferece no cálculo

da variância de Sn. Motivados por isso, damos o seguinte corolário.

Corolário 2.13. Sob as hipóteses do Teorema 2.12, temos que

limn→∞

V ar(Sn) =∞∑

k=1

(2k − 1)[E(µ(Xk

1 )) + ak

]−( ∞∑

k=1

(E(µ(Xk1 )) + ak)

)2

. (2.68)

As provas do teorema principal desta seção e do corolário serão baseadas no seguintelema.

Lema 2.14. Sejam µ uma medida de probabilidade definida em χN para um processo β-mixing e 0 < d < 1 uma constante. Então,

n−1∑k=bdnc

kµ(Sn ≥ k) ≤ n2Kρ,d

dn(1−d)e∑i=bd′nc

inf1≤m<i

(ρm + βm(i)

),

onde Kρ,d é uma constante que depende de ρ e de d, e d′ = min{d/2, (1− d)/2}.

Page 57: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

2.3 LIMITE DO SEGUNDO MOMENTO FINITO DE SN 37

Demonstração. Como nosso processo tem gramática completa, usando a equação (2.54)temos que,

n−1∑k=bdnc

kµ(Sn ≥ k) =n−1∑

k=bdnc

kµ(n−k⋃

i=1

Bn(i))

=

dn(1−d)e∑k=1

(n− k)µ( k⋃

i=1

Bn(i)). (2.69)

Vamos limitar a equação (2.69) usando a união maior, ou seja, µ(⋃dn(1−d)e

i=1 Bn(i)).

n−1∑k=bdnc

kµ(Sn ≥ k) < n

dn(1−d)e∑k=1

µ( k⋃

i=1

Bn(i))

≤ ndn(1− d)eµ(dn(1−d)e⋃

i=1

Bn(i))

≤ n2Cρ,d

dn(1−d)e∑i=bd′nc

inf1≤m<i

(ρm + βm(i)

),

onde a última linha foi obtida aplicando o Lema 2.8 e d′ = min{d/2, (1 − d)/2}, ficandoprovado nosso lema.

Demostração do Teorema 2.12Dado que o nosso processo tem gramática completa, o segundo momento finito de Sn podeser escrita como o somatório de k desde 1 até n− 1 da seguinte maneira,

E(Sn) =n−1∑k=1

k2µ(Sn = k)

=n−1∑k=1

(2k − 1)µ(Sn ≥ k). (2.70)

Dessa forma, podemos substituir a equação (2.70) na seguinte expressão:

∣∣∣E(S2n)−

∞∑k=1

(2k − 1)(E(µ(Xk1 )) + ak)

∣∣∣ =∣∣∣n−1∑k=1

(2k − 1)µ(Sn ≥ k)−∞∑

k=1

(2k − 1)(E(µ(Xk1 )) + ak)

∣∣∣≤

n−1∑k=1

(2k − 1)∣∣∣µ(Sn ≥ k)− E(µ(Xk

1 ))− ak

∣∣∣+

∞∑k=n

(2k − 1)(E(µ(Xk1 )) + ak). (2.71)

Agora analisaremos cada somatório da desigualdade (2.71) separadamente. Começamos di-

Page 58: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

38 RESULTADOS OBTIDOS 2.3

videndo o primeiro somatório com o objetivo de aplicar o Teorema 2.1. Portanto,

n−1∑k=1

(2k − 1)∣∣∣µ(Sn ≥ k)− E(µ(Xk

1 ))− ak

∣∣∣ ≤ bn/4c∑k=1

(2k − 1)∣∣∣µ(Sn ≥ k)− E(µ(Xk

1 ))− ak

∣∣∣+

n−1∑k=bn/4c+1

(2k − 1)∣∣∣µ(Sn ≥ k)− E(µ(Xk

1 ))− ak

∣∣∣. (2.72)

Nós concentraremos no primeiro somatório à direita na inequação (2.72). Aplicando o Teo-rema 2.1, obtemos que

bn/4c∑k=1

(2k − 1)∣∣∣µ(Sn ≥ k)− E(µ(Xk

1 ))− ak

∣∣∣ ≤ Kρ

bn/4c∑k=1

(2k − 1)∞∑

i=bn/8c

inf1≤m<i

(ρm + βm(i)

)≤ Kρ

⌊n4

⌋2∞∑

i=bn/8c

inf1≤m<i

(ρm + βm(i)

). (2.73)

Por outro lado, pela desigualdade triangular, temos que

n−1∑k=bn/4c+1

(2k − 1)∣∣∣µ(Sn ≥ k)− E(µ(Xk

1 ))− ak

∣∣∣ ≤ n−1∑k=bn/4c+1

(2k − 1)µ(Sn ≥ k)

+n−1∑

k=bn/4c+1

(2k − 1)(E(µ(Xk1 )) + ak). (2.74)

Vamos estudar separadamente cada somatório na inequação (2.74). Pelo Lema 2.14, tomandod = 1/4, afirmamos que

n−1∑k=bn/4c+1

(2k − 1)µ(Sn ≥ k) ≤ n2Kρ

d3n/4e∑i=bn/8c

inf1≤m<i

(ρm + βm(i)

). (2.75)

Por outro lado, somamos o segundo somatório na desigualdade (2.71) com o segundo soma-tório da desigualdade (2.74) e afirmamos que

∞∑k=bn/4c+1

(2k − 1)(E(µ(Xk1 )) + ak) ≤

∞∑k=bn/4c+1

(2k − 1)∞∑

i=k

E(µ(X i1))

pois ak ≤∑∞

i=k+1 E(µ(X i1)). Vamos desenvolver o último somatório.

∞∑k=bn/4c+1

(2k − 1)∞∑

i=k

E(µ(X i1)) =

(2⌊n

4

⌋+1) ∞∑

i=bn/4c+1

E(µ(X i1))+(2

⌊n4

⌋+3) ∞∑

i=bn/4c+2

E(µ(X i1))+· · ·+(2n−1)

∞∑i=n

E(µ(X i1))+. . .

Page 59: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

2.3 LIMITE DO SEGUNDO MOMENTO FINITO DE SN 39

Portanto,n−1∑

k=bn/4c+1

(2k − 1)∞∑

i=k

E(µ(X i1)) ≤

∞∑i=bn/4c+1

i2E(µ(X i1)).

Acharemos agora um limitante superior para i2E(µ(X i1)). Usando a equação (2.16), concluí-

mos que∞∑

i=bn/4c+1

i2E(µ(X i1)) ≤ Cρ

∞∑i=bn/4c+1

i2 inf1≤m<i

(ρm + βm(i)

)(2.76)

Para concluir a primeira parte do teorema, somamos as desigualdades (2.73), (2.75) e (2.76)e obtemos o resultado procurado.

Para provar a convergência, vamos tomar m = logρ(1/f(i)), onde f(i) = i3(ln i)1+ε paraalgum ε entre 0 e 1. Nós queremos encontrar

limn→∞

∞∑i=bn

8 cinf

1≤m<ii2(ρm + βm(i)

)≤ lim

n→∞

∞∑i=bn

8 c

i2

f(i)+ lim

n→∞

∞∑i=bn

8 ci2β(⌊ i

logρ(1/f(i))

⌋− 1).

(2.77)O primeiro limite à direita na desigualdade anterior é igual a zero porque 1/i(ln i)1+ε é so-mável. Assim, voltaremos nossa atenção à soma com termos β. O limite que nós procuramos,é igual ao limite da expressão

∑∞i=bn

8 c β(biρ2/ ln ic), onde ρ2 = − ln ρ/4. Note que ρ2 > 0

porque ln ρ < 0. Vamos provar que este limite é zero. Comecemos afirmando que

ln f(i) < 4 ln i.

pois ln f(i) = 3 ln i+ (1 + ε) ln(ln i), ln i < i para todo i e ε < 1. Portanto,

i

ln f(i)>

i

4 ln i. (2.78)

Usando o mesmo procedimento feito para contar os inteiros h que satisfaziam a condição(2.46) na prova do Teorema 2.1 se obtém uma desigualdade similar à apresentada na expres-são (2.48), com ajuda das equações (2.78) e (2.45), concluindo que o número de inteiros hque satisfazem (2.46), neste caso é

h <4

ρ1

ln(i+ 1).

Como β é uma função decrescente,

∞∑i=bn/8c

i2β(⌊ iρ2

ln i

⌋)≤

∞∑i=⌊bn/8cρ2lnbn/8c

⌋4i2 ln(i+ 1)

ρ2

β(i) =4

ρ2

∞∑i=⌊bn/8cρ2lnbn/8c

⌋ i2 ln(i+ 1)β(i). (2.79)

E como por hipótese i2 ln iβ(i) é somável, obtemos o limite zero que procurávamos, com oqual finalizamos nossa prova.

Demostração do Corolário 2.13. A prova desde corolário é imediata. Pois basta substituiros limites dados nos Teoremas 2.10 e 2.12 na muito conhecida equação V ar(Sn) = E(S2

n)−

Page 60: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

40 RESULTADOS OBTIDOS 2.4

(E(Sn))2.

2.4 Resultados condicionais

2.4.1 Probabilidade condicional

As variáveis aleatórias {Sn}n∈N são definidas comparando uma palavra no começo desequências infinitas e o lugar onde esta palavra aparece de novo. Se soubéssemos o começoda palavra iniciante, a distribuições de probabilidade de Sn deveriam ser, intuitivamente,independentes. E isto intui-se pelo fato do processo β−mixing perder memória com o passardo tempo. Nós, então, nos perguntamos pelo limite da distribuição de Sn dado que se conheceo processo até um tempo tn. Nos seguintes teoremas consideramos palavras atn

1 com medidapositiva.

Teorema 2.15. Seja µ uma medida de probabilidade definida sobre χN para um processoβ−mixing com gramática completa. Consideremos k, n, e tn ∈ N tal que 2k ≤ tn < n/2 paratodo n. Então,

|µ(Sn ≥ k|X tn1 = atn

1 )− µ(ak1)− αk| ≤

K1(ρ)

µ(atn1 )

∞∑i=c′n

inf1≤m<i

(ρm + βm(i)), (2.80)

onde K1(ρ) é uma constante que depende somente de ρ, c′n = min{btn/2c, b(n− tn)/2c} e

αk =∞∑

i=k+1

µ(ai1 : ai

1 /∈i−1⋃j=k

Rj(j)).

Se, além do anterior, o processo β-mixing é tal que ln iβ(i) é somável e tn/n tende a zeroquando n diverge, vale que

limn→∞

µ(Sn ≥ k|X tn1 = atn

1 ) = µ(ak1) + αk. (2.81)

Demonstração. Pela definição da probabilidade condicional e pela gramática completa doprocesso, temos que

µ(Sn ≥ k|X tn1 = atn

1 ) =µ(Sn ≥ k ∩X tn

1 = atn1 )

µ(atn1 )

=µ(⋃n−1

i=k Ri(i) ∩X tn1 = atn

1 )

µ(atn1 )

.

As equações (2.34) e (2.35) são válidas mesmo trocando bn/8c por tn, logo, afirmamos que,

µ(Sn ≥ k|X tn1 = atn

1 ) =

1

µ(atn1 )

[µ(Rn(k)∩X tn

1 = atn1 )+

tn∑i=k+1

µ(Rn(i)∩X tn

1 = atn1 \

i−1⋃j=k

Rn(j))+µ( n−1⋃

i=tn+1

Rn(i)∩X tn1 = atn

1

)].

(2.82)

Vamos denotar por

αk,n =tn∑

i=k+1

µ(ai1 : ai

1 /∈i−1⋃j=k

Rj(j)),

Page 61: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

2.4 RESULTADOS CONDICIONAIS 41

somando e substituindo αk,n, é verdade que

|µ(Sn ≥ k|X tn1 = atn

1 )− µ(ak1)− αk| = |µ(Sn ≥ k|X tn

1 = atn1 )− µ(ak

1)− αk + αk,n − αk,n|.

Desse modo, pela equação (2.82) e a desigualdade triangular,

|µ(Sn ≥ k|X tn1 = atn

1 )− µ(ak1)− αk| ≤ | 1

µ(atn1 )µ(Rn(k) ∩X tn

1 = atn1 )− µ(ak

1)| (2.83)

+∣∣∣ 1

µ(atn1 )

tn∑i=k+1

µ(Rn(i) ∩X tn1 = atn

1 \i−1⋃j=k

Rn(j))− αk,n

∣∣∣(2.84)

+ |αk − αk,n| (2.85)

+1

µ(atn1 )µ(

n−1⋃i=tn+1

Rn(i) ∩X tn1 = atn

1 ). (2.86)

Vamos limitar superiormente cada termo à direita na desigualdade anterior. Começamos coma equação (2.83). Se ω ∈ Rn(k) ∩ X tn

1 = atn1 , então ω = atn

1 xn−tn−ktn+1 ak

1, onde atn1 = ak

1atnk+1.

Desta maneira, se nós conhecemos atn1 , também conhecemos ak

1. Removamos o bloco xn−tn−ktn+1

de ω. Assim, temos queµ(ω) ≤ µ(atn

1 , ak1).

Mais ainda, como atn1 é conhecido, afirmamos que

µ(Rn(k) ∩X tn1 = atn

1 ) =∑

ω∈Rn(k)∩Xtn1 =atn

1

µ(ω) ≤ µ(atn1 , a

k1).

A propriedade β−mixing do processo nos diz que,∑atn1 ,ak

1

|µ(atn1 , a

k1)− µ(atn

1 )µ(ak1)| ≤ β(n− tn − k).

Portanto, particularmente para atn1 conhecido,

|µ(atn1 , a

k1)− µ(atn

1 )µ(ak1)| ≤ β(n− tn − k),

o que implica

|µ(Rn(k) ∩X tn1 = atn

1 )− µ(atn1 )µ(ak

1)| ≤ |µ(atn1 , a

k1)− µ(atn

1 )µ(ak1)|

≤ β(n− tn − k).

Ou seja, dividindo por µ(atn1 )∣∣∣ 1

µ(atn1 )µ(Rn(k) ∩X tn

1 = atn1 )− µ(ak

1)∣∣∣ ≤ β(n− tn − k)

µ(atn1 )

. (2.87)

Conseguimos o primeiro limitante superior que procurávamos. Passemos agora à equação(2.84). Se ω ∈ Rn(i) ∩ X tn

1 = atn1 , então ω = atn

1 xn−tn−itn+1 ai

1, onde atn1 = ai

1atni+1 e ω /∈

Page 62: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

42 RESULTADOS OBTIDOS 2.4

⋃i−1j=k Rn(j)). Note que ω /∈

⋃i−1j=k Rn(j) é equivalente a ai

1 /∈⋃i−1

j=k Ri(j). Logo,

µ(Rn(i) ∩X tn1 = atn

1 \i−1⋃j=k

Rn(j)) =∑

ω∈Rn(i)∩Xtn1 =atn

1

µ(ω : ω /∈i−1⋃j=k

Rn(j))

=∑

ω∈Rn(i)∩Xtn1 =atn

1

µ(ω : ai1 /∈

i−1⋃j=k

Ri(j)).

Removendo o bloco xn−tn−itn+1 de ω obteremos

µ(ω : ai1 /∈

i−1⋃j=k

Ri(j)) ≤ µ(atn1 , a

i1 : ai

1 /∈i−1⋃j=k

Ri(j)).

Mas, como atn1 é conhecido,

∑ω∈Rn(i)∩Xtn

1 =atn1

µ(ω : ai1 /∈

i−1⋃j=k

Ri(j)) ≤ µ(atn1 , a

i1 : ai

1 /∈i−1⋃j=k

Ri(j)).

Pela propriedade β−mixing que o processo nos fornece,∑atn1 ,ai

1

|µ(atn1 , a

i1)− µ(atn

1 )µ(ai1)| ≤ β(n− tn − i).

Portanto, particularmente para atn1 conhecido,

|µ(atn1 , a

i1 : ai

1 /∈i−1⋃j=k

Ri(j))− µ(atn1 )µ(ai

1ai1 /∈

i−1⋃j=k

Ri(j))| ≤ β(n− tn − i),

o que implica que

|µ(Rn(i) ∩X tn1 = atn

1 )− µ(atn1 )µ(ai

1 : ai1 /∈

i−1⋃j=k

Ri(j))|

≤ |µ(atn1 , a

i1 : ai

1 /∈i−1⋃j=k

Ri(j))− µ(atn1 )µ(ai

1 : ai1 /∈

i−1⋃j=k

Ri(j))|

≤ β(n− tn − i).

Dividindo a expressão anterior por µ(atn1 ),

∣∣∣ 1

µ(atn1 )µ(Rn(i) ∩X tn

1 = atn1 )− µ(ai

1 : ai1 /∈

i−1⋃j=k

Ri(j))∣∣∣ ≤ β(n− tn − i)

µ(atn1 )

,

Page 63: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

2.4 RESULTADOS CONDICIONAIS 43

e somando em i desde k + 1 até tn, obtemos

∣∣∣ tn∑i=k+1

( 1

µ(atn1 )µ(Rn(i) ∩X tn

1 = atn1 )− µ(ai

1 : ai1 /∈

i−1⋃j=k

Ri(j)))∣∣∣ ≤ 1

µ(atn1 )

tn∑i=k+1

β(n− tn − i)

<1

µ(atn1 )

n−tn−k−1∑i=n−2tn

β(i).

(2.88)

Tratemos agora a equação (2.85).

|αk − αk,n| =∞∑

i=k+1

µ(ai1 : ai

1 /∈i−1⋃j=k

Ri(j))−tn∑

i=k+1

µ(ai1 : ai

1 /∈i−1⋃j=k

Ri(j))

=∞∑

i=tn+1

µ(ai1 : ai

1 /∈i−1⋃j=k

Ri(j))

≤∞∑

i=tn+1

µ(ai1)

≤∞∑

i=tn+1

inf1≤m<i

(ρm +βm(i)

2(1− ρ)), (2.89)

onde a última linha foi obtida levando em consideração a desigualdade (2.15). Finalmente,limitaremos a equação (2.86). É claro que,

µ( n−1⋃

i=tn+1

Ri(i) ∩X tn1 = atn

1

)≤ µ

( n−1⋃i=tn+1

Ri(i)).

Pela Relação de dualidade 1.18, temos que

µ( n−1⋃

i=tn+1

Ri(i))

= µ(n−tn⋃

i=1

Bn(i)).

Vamos escrever cnn = n− tn, onde cn = 1− tn/n. Então, pelo Lema 1.16

µ(cnn⋃

i=1

Bn(i))≤ µ

( cnn⋃i=b cnn

2c

Bn(i))≤

cnn∑i=b cnn

2c

µ(Bn(i)).

Como, tn ≤ n/2 para n fixo, cn ≥ 1/2, assim podemos usar a equação (2.33), obtendo

cnn∑i=b cnn

2c

µ(Bn(i)) ≤ C1(ρ)n−tn∑i=c′n

inf1≤m<i

(ρm + βm(i)), (2.90)

onde c′n = min{btn/2c, b(n− tn)/2c} e C1(ρ) é uma constante que só depende de ρ. Logo,

1

µ(atn1 )µ( n−1⋃

i=tn+1

Ri(i) ∩X tn1 = atn

1

)≤ C1(ρ)

µ(atn1 )

n−tn∑i=c′n

inf1≤m<i

(ρm + βm(i)). (2.91)

Page 64: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

44 RESULTADOS OBTIDOS 2.4

Somando as inequações (2.87) e (2.88), obtemos que

∣∣∣ 1

µ(atn1 )µ(Rn(k)∩X tn

1 = atn1 )−µ(ak

1)∣∣∣+∣∣∣ tn∑

i=k+1

( 1

µ(atn1 )µ(Rn(i)∩X tn

1 = atn1 )−µ(ai

1 : ai1 /∈

i−1⋃j=k

Ri(j)))∣∣∣

≤ 1

µ(atn1 )

n−tn−k∑i=n−2tn

β(i), (2.92)

e somando as inequações (2.89) e (2.91), levando em conta que βm(i) < βm(i), chegamos a

|αk − αk,n|+1

µ(atn1 )µ( n−1⋃

i=tn+1

Ri(i) ∩X tn1 = atn

1

)≤ C2(ρ)

µ(atn1 )

∞∑i=c′n

inf1≤m<i

(ρm + βm(i)). (2.93)

E como β(i) < β(i) ≤ βm(i), pois β é uma função decrescente, e somando as expressoes(2.92) e (2.93), temos que

|µ(Sn ≥ k|X tn1 = atn

1 )− µ(ak1)− αk|

1

µ(atn1 )

n−tn−k∑i=n−2tn

β(i) +C2(ρ)

µ(atn1 )

∞∑i=c′nn

inf1≤m<i

(ρm + βm(i))

≤ K1(ρ)

µ(atn1 )

∞∑i=c′n

inf1≤m<i

(ρm + βm(i)),

para uma constante K1(ρ) > 1, finalizando a primera parte do teorema. Para a convergênciaa zero, lembremos que µ(atn

1 ) > 0 para todo atn1 ∈ χtn , então existe a > 0 ∈ R tal que

µ(atn1 ) ≥ a, para todo n, o que implica que

K1(ρ)

µ(atn1 )

∞∑i=c′n

inf1≤m<i

(ρm + βm(i)) ≤ K1(ρ)

a

∞∑i=c′n

inf1≤m<i

(ρm + βm(i)).

Do mesmo modo que se provou que

limn→∞

∞∑i=bn/8c

inf1≤m<i

(ρm + βm(i))

na convergência do Teorema 2.1, tomando m = logρ(1/f(i)), onde f(i) = i(ln i)1+ε, se provaque

limn→∞

∞∑i=c′n

inf1≤m<i

(ρm + βm(i)) = 0.

Assim, a convergência a zero que nós procuramos está garantida, pois tn/n diverge quandon cresce infinitamente.

2.4.2 Esperança condicional

Nesta subseção vamos obter o limite e a velocidade de convergência da esperança de Sn

quando n tende a infinito, dado que se conhece o processo até um tempo tn.

Page 65: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

2.4 RESULTADOS CONDICIONAIS 45

Teorema 2.16. Seja µ uma medida de probabilidade definida em χN para um processo β-mixing com gramática completa, tal que tn < n/2 para todo n. Então,∣∣∣E(Sn|X tn

1 = atn1 )−

∞∑k=1

µ(ak1) + αk

∣∣∣ ≤ K2(ρ)

µ(atn1 )

∞∑i=c′n

i inf1≤m<i

(ρm + βm(i)),

onde K2(ρ) é uma constante que só depende de ρ, c′n = min{btn/2c, b(n− tn)/2c} e αk comofoi definida no Teorema 2.15. Se, além do anterior, o processo β-mixing é tal que i ln iβ(i)é somável e tn/n tende a zero quando n diverge, vale que

limn→∞

E(Sn|X tn1 = atn

1 ) =∞∑

k=1

(µ(ak1) + αk). (2.94)

Demonstração. Pela definição de esperança condicional e pelo processo ter gramática com-pleta, afirmamos que

E(Sn|X tn1 = atn

1 ) =n−1∑k=1

(µ(Sn ≥ k|X tn1 = atn

1 )).

Dessa forma, podemos substituir a equação anterior na seguinte expressão:

∣∣∣E(Sn|X tn1 = atn

1 )−n−1∑k=1

(µ(ak1) + αk)

∣∣∣ ≤ ∣∣∣ tn∑k=1

µ(Sn ≥ k|X tn1 = atn

1 )−tn∑

k=1

(µ(ak1) + αk)

∣∣∣(2.95)

+∣∣∣ n−1∑k=tn+1

µ(Sn ≥ k|X tn1 = atn

1 )−∞∑

k=tn+1

µ(ak1) + αk

∣∣∣.(2.96)

Vamos aplicar o Teorema 2.15 na desigualdade (2.95), obtendo que

∣∣∣ tn∑k=1

µ(Sn ≥ k|X tn1 = atn

1 )−tn∑

k=1

(µ(ak1) + αk)

∣∣∣ ≤ tn∑k=1

∣∣∣µ(Sn ≥ k|X tn1 = atn

1 )− µ(ak1)− αk

∣∣∣≤ K1(ρ)

µ(atn1 )

tn∑k=1

∞∑i=c′n

inf1≤m<i

(ρm + βm(i))

=K1(ρ)tn

µ(atn1 )

∞∑i=c′n

inf1≤m<i

(ρm + βm(i)), (2.97)

onde c′n = min{btn/2c, b(n−tn)/2c} e K1(ρ) é uma constante que só depende de ρ. Passemosagora à equação (2.96). É verdade que

∣∣∣ n−1∑k=tn+1

µ(Sn ≥ k|X tn1 = atn

1 )−∞∑

k=tn+1

µ(ak1)+αk

∣∣∣ ≤ n−1∑k=tn+1

µ(Sn ≥ k|X tn1 = atn

1 )+∞∑

k=tn+1

µ(ak1)+αk.

(2.98)Vamos estudar separadamente cada equação à direita na desigualdade anterior. Começamos

Page 66: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

46 RESULTADOS OBTIDOS 2.4

afirmando que, por definição de probabilidade condicional,

µ(Sn ≥ k|X tn1 = atn

1 ) =1

µ(atn1 )µ(Sn ≥ k ∩X tn

1 = atn1 ))

≤ 1

µ(atn1 )µ(Sn ≥ k)

=1

µ(atn1 )µ(n−1⋃

i=k

Rn(i)),

onde a última linha foi obtida graças à gramática completa do processo. Agora, usando aRelação de dualidade 1.18, chegamos a

n−1∑k=tn+1

µ(Sn ≥ k|X tn1 = atn

1 ) =1

µ(atn1 )

n−1∑k=tn+1

µ(n−k⋃

i=1

Bn(i))

≤ n− tn

µ(atn1 )µ(n−tn−1⋃

i=1

Bn(i))

≤ (n− tn)C1(ρ)

µ(atn1 )

n−tn∑i=c′n

inf1≤m<i

(ρm + βm(i)), (2.99)

onde C1(ρ) é uma constante que só depende de ρ. Esta última linha foi obtida usando ainequação (2.90). Finalmente, vamos estudar o último somatório na desigualdade (2.98).

∞∑k=tn+1

(µ(ak1) + αk) ≤

∞∑k=tn+1

∞∑i=k

µ(ai1)

=∞∑

i=tn+1

µ(ai1) +

∞∑i=tn+2

µ(ai1) + · · ·+

∞∑i=n−1

µ(ai1) + . . .

= µ(atn+11 ) + 2µ(atn+2

1 ) + · · ·+ (n− tn)µ(an1 ) + . . .

≤∞∑

i=tn+1

iµ(ai1)

Pela inequação (2.15), temos que

∞∑k=tn+1

(µ(ak1) + αk) ≤

∞∑i=tn+1

i inf1≤m<i

(ρm +

βm(i)

2(1− ρ)

)(2.100)

Somando as desigualdades (2.97), (2.99) e (2.100) obtemos nosso resultado. Para a conver-gência a zero, lembremos que µ(atn

1 ) > 0 para todo atn1 ∈ χtn , então existe a > 0 ∈ R tal que

µ(atn1 ) ≥ a, para todo n, o que implica que

K2(ρ)

µ(atn1 )

∞∑i=b′n

inf1≤m<i

(ρm + βm(i)) ≤ K2(ρ)

a

∞∑i=b′n

inf1≤m<i

i(ρm + βm(i)).

Page 67: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

2.4 RESULTADOS CONDICIONAIS 47

Do mesmo modo que se provou que

limn→∞

∞∑i=bn/8c

inf1≤m<i

i(ρm + βm(i))

na convergência do Teorema 2.10, tomando m = logρ(1/f(i)), onde f(i) = i2(ln i)1+ε, ficaprovado que

limn→∞

∞∑i=c′n

inf1≤m<i

i(ρm + βm(i)) = 0.

Assim, a convergência a zero que nos procuramos está garantida, pois tn/n diverge quandon cresce infinitamente.

2.4.3 Esperança da esperança condicional

Agora vamos provar que a esperança do limite da esperança condicional é igual ao limiteda esperança da esperança condicional, que como é sabido, coincide com o limite da esperançade Sn.

Teorema 2.17. Seja µ uma medida de probabilidade definida em χN para um processo β-mixing com gramática completa tal que i ln iβ(i) seja somável. Suponha que tn é uma funçãoque satisfaz que tn/n→ 0 quando n→∞. Então,

limn→∞

E(E(Sn|X tn1 )) = E( lim

n→∞E(Sn|X tn

1 )). (2.101)

Demonstração. Para provar este teorema vamos a usar o teorema da convergência dominada[24]. Pelo Teorema 2.16 na equação (2.94), E(Sn|X tn

1 ) converge puntualmente. Agora, pelomesmo Teorema, temos que

E(Sn|X tn1 = atn

1 ) ≤n−1∑i=1

(µ(ai1) + αi) +

K2(ρ)

µ(atn1 )

∞∑i=b′n

i inf1≤m<i

(ρm + βm(i))

<

∞∑i=1

(µ(ai1) + αi) +

K2(ρ)

µ(atn1 )

∞∑i=1

i inf1≤m<i

(ρm + βm(i)). (2.102)

Analisaremos separadamente cada um dos somatórios anteriores. Como foi ilustrado na provado Teorema 2.16,

∞∑i=1

(µ(ai1) + αi) ≤

∞∑i=1

iµ(ai1) ≤

∞∑i=1

i inf1≤m<i

(ρm +

βm(i)

2(1− ρ)

),

onde a última desigualdade foi obtida pela expressão (2.15). Logo,

E(Sn|X tn1 = atn

1 ) <K3(ρ)

µ(atn1 )

∞∑i=1

i inf1≤m<i

(ρm + βm(i)). (2.103)

Page 68: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

48 RESULTADOS OBTIDOS 2.5

Se tomarmos m = logρ(1/f(i)), onde f(i) = i2(ln i)1+ε para um ε entre 0 e 1, temos que

E(Sn|X tn1 = atn

1 ) <K3(ρ)

µ(atn1 )

∞∑i=1

( 1

i(ln i)ε+ iβ

(⌊ −i ln ρ2i+ (1 + ε) ln i

⌋− 1)).

Como i(ln i)1+ε é somável, existe um número real M1, tal que

∞∑i=1

1

i(ln i)ε= M1. (2.104)

Por outro lado, como foi mostrado na prova do Teorema 2.10 na desigualdade (2.66),

∞∑i=1

iβ(⌊ −i ln ρ

2i+ (1 + ε) ln i

⌋− 1)≤ 3

ρ1

∞∑i=1

i ln(i+ 1)β(i),

onde ρ1 = − ln ρ/3. Por hipótese i ln iβ(i) é somável, portanto, existe um número real M2(ρ),que depende de ρ, tal que

∞∑i=1

iβ(⌊ i

logρ(1/f(i))

⌋− 1)

= M2(ρ). (2.105)

Das desigualdades (2.104) e (2.105), obtemos que

E(Sn|X tn1 = atn

1 ) < M1 +M2(ρ) = M(ρ).

Dado que E(M(ρ)) = M(ρ) porque M(ρ) ∈ R e pelo teorema da convergência dominada,obtemos nosso resultado.

2.5 Entropia vs E(Sn)

Na subseção 1.2.3, foi conjeturado que existia uma relação entre a entropia do processoindependente e identicamente distribuído e a esperança da variável Sn. Miguel Abadi, Ro-drigo Lambert & Guilherme Ludwig simularam esta relação para uma cadeia de Markov noconjunto de estados {0, 1} com matriz probabilidades de transição

P=( 0 1

0 p 1-p1 1-q q

)onde 0 < p, q < 1. Eles simularam palavras de tamanho 25 variando p e q com malha 0.05.Os gráficos da Esperança de Sn e da Entropia são mostrados nas figuras 2.5 e 2.6.

Page 69: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

2.5 ENTROPIA VS E(SN ) 49

Figura 2.5: E(Sn) para o processo de Markov com gramática completa.

Figura 2.6: Entropia para o processo de Markov com gramática completa.

Pode-se conjeturar, como no caso independente, que poderia existir uma relação inversaentre as quantidades entropia e esperança de Sn para um processo de Markov.Tanto como o processo independente quanto a cadeia de Markov simulada anteriormente têmgramática completa e são processos β−mixing. Quisemos comprovar se esta suposta relaçãoinversa se mantém para a seguinte cadeia de Markov com gramática completa. Esta cadeiaassume valores no conjunto χ = {0, 1, 2} e tem as seguintes probabilidades de transição:

Page 70: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

50 RESULTADOS OBTIDOS 2.5

P=

0 1 2

0 1− q0 q0/2 q0/21 (1− q1)/2 q1 (1− q1)/22 1/3 1/3 1/3

onde 0 < qi < 1, para i = 0, 1.Passemos agora a simular o contraste entre a E(Sn) e a entropia do processo. Nós simulamospalavras de tamanho 8, para q0 e q1 variando entre 0.01 e 0.99 com malha de 0.05. Os gráficosda esperança de Sn e da entropia são mostrados nas figuras seguintes:

Figura 2.7: E(Sn) para o processo de Markov com gramática completa

Page 71: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

2.6 CASO INDEPENDENTE 51

Figura 2.8: Entropia para o processo de Markov com gramática completa

2.6 Caso independenteNesta seção vamos apresentar limitantes mais eficientes para o limite da esperança de Sn

que os dados no Corolário 1.27. E como novidade também apresentamos limitantes para olimite do segundo momento finito e, consequentemente, para o limite da variância.

Teorema 2.18. Seja µ a medida produto sobre χN com marginais identicamente distribuidas.Considere Q = limn→∞ E(Sn). Então,

max{ m2

1−m2

,m2

(1−m2)2− m4

(1−m4)2

(1 +m2

1−m2

)}≤ Q ≤ m2

(1−m2)2− m4

(1−m4)(1−m2).

Demonstração. Nós temos que,

Q =∞∑

k=1

limn→∞

µ(Sn ≥ k) =∞∑

k=1

mk2 + ak.

Pela Proposição 1.22

Q ≤ m2

1−m2

+∞∑

k=1

mk+12

1−m2

− mk4

1−m2

≤ m2

1−m2

+m2

2

(1−m2)2− m4

(1−m4)(1−m2)

≤ m2

(1−m2)2− m4

(1−m4)(1−m2).

Page 72: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

52 RESULTADOS OBTIDOS 2.6

No outro sentido da desigualdade, pela Proposição 1.23, obtemos que

Q ≥ m2

1−m2

+∞∑

k=1

mk2

1−m2

− mk4

1−m2

(1 +m2

1−m4

)≥ m2

1−m2

+m2

2

(1−m2)2− m4

(1−m4)2

(1 +m2

1−m2

).

Para mostrar um exemplo gráfico do comportamento do limite da esperança de Sn, sejaχ = {0, 1}, p = µ(1) e 1− p = µ(0). Na figura 2.9, temos que

A =m2

1−m2

,

B =m2

(1−m2)2− m4

(1−m4)2

(1 +m2

1−m2

),

C =m2

(1−m2)2− m4

(1−m4)(1−m2).

Figura 2.9: Limitantes superior e inferior para o limite de E(Sn).

Portanto, o limite da esperança de Sn se encontra entre a linha azul e o máximo entre as linhasverde e vermelha. Os limitantes dados funcionan razoavelmente bem para 0.3 < p < 0.7. Nocaso em que p = 0.5, 1.5102 ≤ E(Sn) ≤ 1.8367.

Page 73: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

2.6 CASO INDEPENDENTE 53

O próximo teorema apresenta limitantes para o limite do segundo momento finito de Sn.

Teorema 2.19. Sejam χ um alfabeto e µ a medida produto sobre χN com marginais identi-camente distribuidas. Considere Q2 = limn→∞ E(S2

n). Então,

max{A,B} ≤ Q2 ≤m2 +m2

2

(1−m2)3− m4

(1−m4)2, (2.106)

onde

A =m2

1−m2

( 2

1−m2

− 1), e B =

m2 +m22

(1−m2)3− 2m4

(1−m4)3

( 1 +m2

(1−m2)− 1

2

).

Demonstração. Nós temos que

Q2 =∞∑

k=1

(2k − 1) limn→∞

µ(Sn ≥ k) =∞∑

k=1

(2k − 1)mk2 + ak

= 2∞∑

k=1

k(mk2 + ak)−

∞∑k=1

mk2 + ak.

Vamos calcular o primeiro termo da igualdade anterior, pois o segundo termo é dado peloTeorema 2.18. Aplicando de novo a Proposição 1.22, fica que

2∞∑

k=1

kmk2 +

∞∑k=1

kak ≤2m2

(1−m22)

+2

1−m2

( m22

(1−m22)− m4

(1−m24)

). (2.107)

Logo, aplicando o Teorema 2.18 e simplificando a expressão, o resultado é finalmente aprimeira desigualdade

Q2 ≤m2 +m2

2

(1−m2)3− m4

(1−m4)2.

No outro sentido da desigualdade, aplicando a Proposição 1.23, teremos

2∞∑

k=1

kmk2 +

∞∑k=1

kak ≥2m2

(1−m2)2+

2m22

(1−m2)3− 2m4

1−m2

( 1 +m2

(1−m4)2

).

Aplicando o Teorema 2.18 e simplificando a expressão, chegamos finalmente a desigualdade

Q2 ≥m2 +m2

2

(1−m2)3− 2m4

(1−m4)3

( 1 +m2

(1−m2)− 1

2

). (2.108)

O limite inferior mostrado na última inequação não funciona muito bem em certos valoresp, por isso, procuramos mais um limitante inferior e escolheremos o valor máximo entre odois. O limitante calculado é baseado no Corolário 1.27, assim

Q2 ≥∞∑

k=1

kmk2 −

∞∑k=1

mk2

=m2

(1−m2)2− m2

1−m2

=m2

1−m2

( 2

1−m2

− 1), (2.109)

Page 74: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

54 RESULTADOS OBTIDOS 2.6

chegando ao resultado desejado.

Continuando com nosso exemplo com distribuição Bernoulli, nós graficamos os limitantespara Q2 usando a letra C que representa o limite superior na equação (2.107). Na figura2.10, usamos

A =m2

1−m2

( 2

1−m2

− 1),

B =m2 +m2

2

(1−m2)3− 2m4

(1−m4)3

( 1 +m2

(1−m2)− 1

2

),

C =m2 +m2

2

(1−m2)3− m4

(1−m4)2.

O limite do segundo momento finito de Sn se encontra entre a linha azul e o máximo entre

Figura 2.10: Limitantes superior e inferior para o limite do segundo momento de E(Sn).

as linhas verde e vermelha da figura 2.10, onde se vê que os limitantes funcionam muito bempara 0.4 < p < 0.6. No caso em que p = 0.5, 3.9475 ≤ E(S2

n) ≤ 5.8750.

levando em conta os Teoremas 2.18 e 2.19 apresentamos os limitantes para o limite daVariância de Sn no seguinte teorema.

Teorema 2.20. Sejam χ um alfabeto e µ a medida produto sobre χN com marginais identi-

Page 75: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

2.6 CASO INDEPENDENTE 55

camente distribuidas. Considere V arQ = limn→∞ V ar(Sn). Então,

max{a, b} ≤ V arQ ≤ m2 −m22 −m3

2

(1−m2)4− m4

(1−m4)

( 1

1−m4

+m4

(1−m2)(1−m4)− 2m2

(1−m2)3

),

(2.110)onde

a =m2

1−m2

( 2

1−m2

− m2

(1−m2)3− 1)− m4

(1−m2)2(1−m4)

( m4

1−m4

− 2m2

1−m2

), e

b =m2 +m2

2

(1−m2)4− 2m4

(1−m2)(1−m4)

( 1 +m2

(1−m4)2+

m4

2(1−m2)(1−m4)− m2

(1−m2)2− 1

2

).

Demonstração. A prova é imediata aplicando os Teoremas 2.18 e 2.19 e simplificando asexpressoes resultantes.

No gráfico para o exemplo Bernoulli, a letra c representa o limite superior da V arQ doTeorema 2.20. O limite da variância de Sn se encontra entre a linha azul e o máximo entreas linhas verde e vermelha da figura 2.11. Lembramos que neste gráfico

a =m2

1−m2

( 2

1−m2

− m2

(1−m2)3− 1)− m4

(1−m2)2(1−m4)

( m4

1−m4

− 2m2

1−m2

),

b =m2 +m2

2

(1−m2)4− 2m4

(1−m2)(1−m4)

( 1 +m2

(1−m4)2+

m4

2(1−m2)(1−m4)− m2

(1−m2)2− 1

2

),

c =m2 −m2

2 −m32

(1−m2)4− m4

(1−m4)

( 1

1−m4

+m4

(1−m2)(1−m4)− 2m2

(1−m2)3

).

Aqui, os limitantes funcionam muito bem para 0.4 < p < 0.6. No caso em que p = 0.5,2.2274 ≤ V ar(Sn) ≤ 2.9388.

Page 76: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

56 RESULTADOS OBTIDOS 2.6

Figura 2.11: Limitantes superior e inferior para o limite da Variância de E(Sn).

Page 77: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

Capítulo 3

Conclusões e Problemas em aberto

Este trabalho teve como objetivo fundamental generalizar o trabalho feito por Lambert[19] e Abadi e Lambert [5]. Eles essencialmente provaram que existe a distribuição limiteda função Sn quando o processo que gera as variáveis é independente e identicamente dis-tribuído. Além disso, mostraram o limite explicitamente. Nossa generalização foi feita paraprocessos ergódicos com gramática completa, mas trocando a hipótese de independência poruma hipótese de dependência β−mixing. Chegamos a conclusão da existência da distribuiçãolimite da função Sn, da E(Sn) e da V ar(Sn). Além disso, obtivemos resultados condicionais.

Uma questão a responder é se os resultados obtidos nesta tese, são válidos para processossem gramática completa nos quais µ(Sn < 0) > 0.

Outra pergunta interessante, que ainda permanece sem resposta, é a relação que apre-sentam a entropia, h, do processo e a esperança de Sn. Será possível achar uma relação entreestas duas quantidades de tal forma que se possa calcular h por medio de E(Sn)?.

57

Page 78: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

58 CONCLUSÕES E PROBLEMAS EM ABERTO

Page 79: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

Apêndice A

Artigo

Durante o doutorado, eu fiz uma visita á Universidade do Sur da Califórnia (University ofSouthern California) para trabalhar sob a orientação do professor Nicolai Haydn. Nós, juntoa seus alunos Chimanya Gupta (estudante de pós-doutorado) e Milton Ko (estudante dedoutorado), discutimos temas relacionado à teoria ergódica. Essas discussões tiveram comoresultado um artigo em conjunto, o qual pode-se encontrar no arxiv.org com o seguinte linkarXiv:1306.4476. O título do artigo e o resumo, ambos em português, são:

Título: Tempos de entrada e Entropia de RényiResumo:Para sistemas ergódicos com partições geradoras, o resultado bem conhecido de Ornsteine Weiss mostra que a tasa de crescimento exponencial do tempo de recorrência é igual àentropia métrica quase certamente. Aqui nós estudamos a tasa de crescimento exponencialdo tempo de entrada, e mostramos que ele é igual à entropia, onde a convergência é emprobabilidade e usando a medida produto. Mas precisamos como hipótese que a distribuiçãolimite dos tempos de entrada exista quase certamente. Essa condição parece natural, sob aóptica de um exemplo feito por Shields no qual o lim sup da tasa de crescimento exponen-cial é infinito quase certamente excepto onde os tempos de entrada não existem. Nosotrosconsideramos também sistemas φ−mixing e provamos um resultado que conecta a entropiade Rényi com os tempos de entrada.

59

Page 80: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

60 APÊNDICE A

Page 81: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

Referências Bibliográficas

[1] M. Abadi, Exponential approximation for hitting times in mixing processes, Mathema-tical Physics Electronis Journal 7 (2001), no. 2. xiii, xiv, 3

[2] , Sharp error terms and neccessary conditions for exponential hitting times inmixing processes, The Annals of Probability 32 (2004), no. 1A, 243–264. 3, 13

[3] , Poisson approximations via chen-stein for non-markov processes., In and outof equilibrium. 2. Progress in Probability 60 (2008), no. 2, 1–19. xiii

[4] M. Abadi and L. Cardeño, Renyi entropies and large deviation for the overlappingfunction. xiv

[5] M. Abadi and R. Lambert, The distribution of the short-return function., Nonlinearity26 (2013), no. 5, 1143–1162. v, vii, xv, 4, 6, 9, 57

[6] M. Abadi and B. Saussol, Hitting and returning into rare events for all alpha-mixingprocesses, Stochastic process and theirs applications 121 (2010), no. 2, 314–323. 3

[7] M. Abadi and S. Vaienti, Large deviations for short recurrence, Discrete and ContinuousDynamical Systems - Series A (DCDS-A) 21 (2008), no. 3, 729 – 747. xiii, xiv, 6

[8] Liliam Cardeño Acero, Comportamentos globais e locais de tempos de entrada curtos,Ph.D. thesis, Universidade de São Paulo, Novembro 2007. 6

[9] V. Afraimovich, J. Chazottes, and B. Saussol, Pointwise dimensions for poincaré re-currence associated with maps and special flows, Discrete and Continuous DynamicalSystems 9 (2003), 263–280. xiv, 7

[10] H. Berbee, Convergence rates in the strong law for bounded mixing sequences, Probab.Th. Rel. Fields 74 (1987), 255–270. 27

[11] R. Bradley, Basic properties of strong mixing conditions. a survey and some open ques-tions, Probability Surveys 2 (2005), 107–144. 1, 2, 14

[12] Roberto Fernández, Pablo Ferrari, and Antonio Galves, Coupling, renewal and perfectsimulation of chains of infinite order, notas para o mini-curso presentado na vth escolabrasileira de probabilidade ed., http://www.ime.usp.br/ pablo/abstracts/vebp.html,2001. 26

[13] A. Galves, P. Collet, and B. Schmitt, Repetition times for gibbsian sourses, Nonlinearity12 (1999), 1225–1237. xiv

[14] A. Galves and B. Schmitt, Inequalities for hitting times in mixing dynamical systems,Random Comput. Dyn 5 (1997), 337–348. 3, 13

61

Page 82: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

62 REFERÊNCIAS BIBLIOGRÁFICAS

[15] N. Haydn and S. Vaienti, The compound poisson distribution and return times in dyna-mical systems, Prob. Theory Related Fields 144 (2009), no. 1, 159–179. xv

[16] , The renyi entropy function and the large deviation of short return times, Er-godic Theory and Dynamical Systems 30 (2010), 159–179. xiii

[17] M. Hirata, Poisson law for axiom a diffeomorphisms, Ergodic Theory and DynamicalSystems 13 (1993), no. 3, 533–556. xiii

[18] M. Hirata, B. Saussol, and S. Vaienti, Statistics of returns times: a general frameworkand new applications., Comm. Math. Phys. 206 (1999), no. 3, 33–55. xiv

[19] Rodrigo Lambert, Comportamento assentótico do primeiro retorno de uma sequênciagerada por variáveis aleátorias independentes e identicamente distribuídas., Master’sthesis, Instituto de Matemática, Estatística e Computção, Universidade Estadual deCampinas, Brasil, Julho 2010. v, vii, xiii, xv, 4, 6, 9, 57

[20] G. Reinert and S. Schbath, Compound poisson and poisson process approximations foroccurrences of multiple words in markov chains, Journal of Computational Biology 5(1998), 223–254. xiii

[21] , Compound poisson approximations for occurrences of multiple words, ErgodicTheory and Dynamical Systems 30 (2010), 159–179. xiii

[22] E. Roquain and S. Schbath, Improved compound poisson approximation for the numberof occurrences of multiple words in a stationary markov chain, Advances in AppliedProbability 39 (2007), 1–13. xiii

[23] Y. Rozanov and V. Wolkonski, Some limit theorems for random functions, part 1, The-ory Probab. Appl (1959), no. 4, 178–197. 2

[24] Walter Rudin, Real and complex analysis, 3th ed., 1987. 47

[25] B. Saussol, S. Troubetzkoy, and S. Vaienti, Recurrence, dimensions and lyapunov expo-nents, Journal of Statistical Physics 106 (2002), 623–634. xiv, 7

[26] K. Sigmund, On dynamical systems with the specification property, Trans. Amer. Math.Soc 190 (1974), 285–299. 7

Page 83: Primeiro tempo de retorno para processos β mixing · tempo é chamado de Tempo de Retorno (Return Time). Neste caso, acontece o mesmo. É sabido que o tempo de retorno também pode

Índice Remissivo

Alfabeto, 1

Coeficiente α-mixing , 2Coeficiente β-mixing , 1Conjunto Bn , 5Conjunto Rn , 6

Dependência tipo α-mixing , 2Dependência tipo β-mixing , 1

Função Sn, 4

Palavra, 1Primeiro Tempo de Retorno, Tn , 3Processo α-mixing , 2Processo β-mixing , 2Processo com gramática completa , 2

Tempo de Ocorrência , 3Tempo de retorno em sistemas dinâmicos , 3

63