Existem padrões na loteria e como procurá-los

A suspeita de que a loteria esconde um padrão secreto ocorre a todo mundo que olha com seriedade para o histórico de concursos. A dezena 17 saiu 14 vezes em setembro, enquanto o 3 não apareceu nenhuma vez. Três dezenas ímpares seguidas surgiram 6 vezes no ano. O par 12-23 aparece com frequência especial. Dá a impressão de que existe um algoritmo escondido em algum lugar — só que muito bem disfarçado. A resposta curta: numa loteria honesta não há algoritmo, mas o ruído do acaso realmente produz figuras que se parecem muito com um padrão. O site tem cinco ferramentas que testam, uma a uma, diferentes tipos de possíveis padrões, e todas chegam à mesma conclusão — com graus de certeza variados.

A resposta principal e por que o ruído parece um padrão

Numa loteria honesta, o resultado do próximo concurso é independente de todos os anteriores. Essa é a definição matemática de aleatoriedade, não uma afirmação filosófica. O globo não guarda memória da história: cada combinação tem uma chance igual ao inverso do número de combinações, e essa chance não muda com base no que saiu ontem.

Mas o acaso produz figuras. Se você jogar uma moeda 1000 vezes, em algum ponto do meio haverá inevitavelmente uma sequência de 7 caras seguidas — e isso é um fenômeno absolutamente normal, não "manipulação". A razão: numa sequência longa, todas as figuras curtas possíveis ocorrem na sua frequência esperada, e com uma amostra grande os eventos raros se tornam quase inevitáveis. O cérebro é bom em notar essas figuras e ruim em entender quão esperadas elas de fato são. Esse efeito se chama apofenia — a tendência de ver padrões onde não existe nenhum.

Daí a distinção prática: você sempre pode descrever um padrão depois do fato (qualquer sequência é descritível), mas não pode prevê-lo de antemão a menos que ele tenha uma estrutura causal. E o teste de "esse padrão tem estrutura causal" é exatamente o problema que a estatística resolve.

Como distinguir ruído de sinal: o valor-p e o intervalo de confiança

Todo teste estatístico de aleatoriedade funciona da mesma maneira. Primeiro, formula-se uma hipótese nula: "os dados são aleatórios". Depois calcula-se quão provável é o resultado observado sob essa suposição. Essa probabilidade se chama valor-p. Se o valor-p é muito pequeno (o limiar padrão é abaixo de 0,05), significa que os dados se ajustam mal à hipótese nula, e a hipótese pode ser rejeitada.

Na prática, o valor-p precisa ser interpretado com cuidado. Num limiar de 0,05, a cada vinte testes honestos um produzirá, por acaso, um falso resultado "significativo". Se você roda 1000 desses testes sobre diferentes combinações de dezenas, em 50 deles um "padrão" aparecerá sozinho — não porque ele exista, mas porque você olhou 1000 vezes. Isso se chama problema das comparações múltiplas, e é a principal fonte de conclusões falsas sobre padrões na loteria.

Então um teste de verdade não é "achei algo com p < 0,05", mas "achei algo com um valor-p corrigido para o número de testes". E é aqui que fica interessante: as cinco ferramentas do site são construídas justamente levando essa correção em conta. Para mais sobre os princípios dos testes múltiplos, veja o artigo sobre os 20 métodos de análise.

Autocorrelação: um concurso depende do anterior?

O teste mais direto para a existência de um "algoritmo de sorteio de dezenas". A seção de autocorrelação calcula a correlação entre concursos vizinhos: se o concurso de hoje tem um vínculo causal com o de ontem, isso aparecerá como um desvio persistente da função de autocorrelação em relação a zero.

O que os dados reais mostram. Na Mega-Sena (6 de 60), com milhares de concursos, a autocorrelação flutua em torno de zero dentro do intervalo de confiança — é ruidosa, como deve ser um processo aleatório. Nenhum lag (defasagem) dá um sinal persistente. Se existisse um "algoritmo de sorteio" do tipo "depois do 17, o 23 sai com mais frequência", nós o veríamos aqui como um pico no lag 1. Não há esse pico.

Na Quina, que tem concurso quase todo dia e um histórico enorme, a autocorrelação também flutua em torno de zero, mas o intervalo de confiança é mais estreito — poderíamos detectar efeitos fracos. E não detectamos. Esse é um dos resultados mais convincentes, porque com tal volume de dados até um padrão minúsculo seria visível.

Teste de corridas (runs test): a aleatoriedade da alternância

A autocorrelação olha para as próprias dezenas, enquanto o teste de corridas olha para as figuras da sua distribuição. Por exemplo: quão longas ficam as corridas de dezenas pares (ou ímpares) no histórico? Quão longas ficam as corridas de "altas" e "baixas"? Na aleatoriedade honesta existe uma distribuição teórica dos comprimentos de corrida — e um desvio dela indica que a independência está rompida em algum ponto.

O resultado nas principais loterias de dezenas é o mesmo da autocorrelação: os desvios permanecem dentro do intervalo de confiança. Corridas de 5-6 dezenas da mesma paridade ocorrem exatamente o número de vezes que o acaso preveria. O mesmo vale para "corridas de dezenas adjacentes" e "corridas da mesma faixa".

O teste de corridas é especialmente bom em flagrar duas coisas. Primeiro, a regularidade artificial: se um globo fosse programado para "evitar" repetições, as corridas longas ocorreriam com menos frequência que o esperado. Segundo, um artefato de equipamento: um defeito físico no globo criaria um "agrupamento" que aumenta as corridas longas além do esperado. Nenhum dos dois é visível nos nossos históricos.

Lei de Benford: ela funciona para dezenas de loteria?

O mais exótico dos cinco métodos. A lei de Benford afirma: em dados numéricos "naturais" o primeiro dígito se distribui de forma desigual. O dígito 1 aparece em cerca de 30% dos casos, o 2 em 17%, o 9 em 5%. A lei funciona lindamente para rendas, comprimentos de rios, preços de ações — em qualquer lugar onde os números cobrem várias ordens de magnitude.

Para dezenas de loteria de 1 a 60 ou de 1 a 80, a lei a rigor não deveria funcionar. A faixa é curta demais, e os dígitos "1-9" não cobrem uma ordem de magnitude. Mas uma comparação gráfica da distribuição real com a teórica ainda é útil — ela mostra como leis estatísticas se comportam em faixas limitadas e onde elas se quebram.

Na Mega-Sena o primeiro dígito de uma dezena se distribui de modo quase uniforme (1, 2, 3, 4, 5 com cerca de 18% cada, e o resto repartido entre 6-9). É exatamente o que "a aleatoriedade honesta dentro de uma faixa limitada" prevê. Não há mágica — mas é interessante ver como uma regra geral se adapta ao seu contexto.

Cadeias de Markov: a transição de dezena para dezena

O mais complexo dos testes do ponto de vista matemático, o mais intuitivo em conceito. As cadeias de Markov constroem uma matriz de transição: se a dezena 12 saiu num concurso, com que probabilidade a 25 sairá no concurso seguinte? Para cada par (i, j) dentre os 60×60 = 3600 pares, essa probabilidade é calculada.

Numa loteria honesta, todas as 3600 probabilidades deveriam ser iguais ao valor teórico (cerca de 6/60 = 0,1 para a Mega-Sena — a probabilidade de uma dezena específica aparecer num concurso, independente do passado). A análise de Markov constrói essa distribuição e verifica se ela é uniforme.

O resultado é previsivelmente entediante: a matriz é uniforme, todas as probabilidades estão próximas do valor teórico, e os desvios permanecem dentro do intervalo de confiança. Mas o método em si é útil não para "achar padrões", e sim para visualizar como o acaso se parece em grande escala. Quando você olha para um mapa de calor 60×60 com um fundo uniforme, a sensação intuitiva de que "há um algoritmo escondido aqui em algum lugar" se desfaz. O histórico realmente parece aleatório.

Os cinco métodos acima cobrem cinco tipos diferentes de possíveis padrões. Se até mesmo um deles mostrasse um sinal persistente com um valor-p corrigido para comparações múltiplas, isso seria uma séria pretensão de descoberta. Mas, em todos os grandes históricos, os cinco retornam "aleatoriedade", o que se resume a uma única tabela:

Teste

Que padrão procura

O que mostraria se estivesse presente

Resultado real

Autocorrelação

Dependência de um concurso em relação aos anteriores (lags 1, 2, 3 e além)

Um pico persistente em um dos lags

Flutuações dentro do intervalo de confiança

Teste de corridas

Regularidade das corridas (par/ímpar, alta/baixa)

Corridas regulares demais ou longas demais

Corridas distribuídas como na aleatoriedade honesta

Lei de Benford

Distorções estruturais na distribuição dos primeiros dígitos

Um forte desvio do modelo de Benford

Uma distribuição uniforme, como esperado dentro de uma faixa limitada

Teste qui-quadrado de Pearson

Conformidade das frequências com uma distribuição uniforme

Um valor de qui-quadrado alto e p < 0,05 após as correções

As frequências convergem para a uniforme em históricos grandes

Cadeias de Markov

Dependências nas transições par a par (i → j)

Uma matriz de transição não uniforme

A matriz é uniforme, todas as transições igualmente prováveis

Cinco métodos independentes, cinco "recortes" diferentes da ideia de padrão, uma única e mesma conclusão. Isso não é uma coincidência de resultados parecidos — é uma propriedade dos dados.

A conclusão honesta: por que a loteria resiste à "quebra"

A lógica é simples e, curiosamente, econômica. Um operador de loteria ganha na diferença entre a venda de volantes e o pagamento dos prêmios. Se existisse na loteria um padrão extraível, mais cedo ou mais tarde ele seria encontrado — por cientistas, analistas, algoritmos. Alguns jogadores bem-sucedidos ficariam ricos, e o valor esperado da loteria para o operador ficaria negativo. A loteria fecharia rapidamente porque teria se tornado deficitária.

O fato de as grandes loterias funcionarem por décadas e se manterem consistentemente lucrativas é uma evidência indireta, porém poderosa, da ausência de padrões exploráveis. Os globos são inspecionados e substituídos com regularidade, os algoritmos de geração de números nas loterias digitais são certificados segundo normas, e os históricos ficam abertos a análises independentes. Tudo isso funciona justamente porque a "quebra" é impossível.

Mas daí não se segue que a estatística seja inútil para o jogador. Ela é útil de outra forma: ajuda a filtrar a escolha. Se não há padrões, então qualquer escolha de dezenas é equivalente às demais em chance de prêmio máximo, mas algumas abordagens são mais sistemáticas, disciplinam o orçamento e reduzem a chance de dividir um prêmio com a multidão. Para mais sobre abordagens sensatas, veja o artigo sobre estratégias de jogo.

E uma última coisa. Se em algum lugar na internet você vir um "algoritmo para prever a loteria", preste atenção em como ele é testado. Um teste honesto prevê concursos futuros, não um ajuste ao histórico já sorteado. Encontrar um algoritmo no histórico e depois aplicá-lo são tarefas completamente diferentes. Em dados já sorteados você pode "explicar" qualquer sequência, até uma aleatória — isso se chama sobreajuste (overfitting) e é comum entre muitas "IAs de loteria", como discutido em detalhe no artigo sobre a rede neural para a loteria.

O resumo

  1. Não há padrões numa loteria honesta. Isso decorre da definição de aleatoriedade e é confirmado por todos os cinco testes sobre o histórico.

  2. O ruído do acaso produz figuras que visualmente lembram padrões. A apofenia é a tendência do cérebro de notá-las e exagerá-las.

  3. O valor-p precisa ser corrigido pelo número de testes. Com 1000 verificações, 50 "significativas" serão encontradas puramente por acaso se nenhuma correção for aplicada.

  4. Cinco ferramentas (autocorrelação, teste de corridas, Benford, Pearson, cadeias de Markov) testam diferentes tipos de padrões e retornam consistentemente "aleatoriedade" em todos os históricos de dezenas do site.

  5. As loterias são economicamente resilientes: se um padrão existisse, o operador iria à falência. Isso funciona como evidência indireta.

  6. A estatística não prevê dezenas, mas ajuda a disciplinar a escolha e a descartar rituais que se passam por estratégias.

  7. Testar um algoritmo no histórico é sempre um ajuste. O único teste honesto é prever o futuro, e nesse formato todo "algoritmo" se comporta como um palpite aleatório.