Schemi nella lotteria: esistono e come testarli

Il sospetto che una lotteria nasconda uno schema segreto viene a chiunque studi seriamente l'archivio delle estrazioni. Il numero 17 è uscito 14 volte a settembre, mentre il 3 non è apparso affatto. Tre numeri dispari di fila si sono presentati 6 volte nell'arco dell'anno. La coppia 12-23 esce con particolare frequenza. Sembra che da qualche parte si nasconda un algoritmo, solo accuratamente mascherato. La risposta breve: in una lotteria onesta non c'è alcun algoritmo, ma il rumore della casualità produce davvero figure che assomigliano moltissimo a uno schema. Il sito mette a disposizione cinque strumenti che testano uno per uno diversi tipi di possibili schemi, e tutti arrivano alla stessa conclusione, con vari gradi di certezza.

La risposta principale e perché il rumore sembra uno schema

In una lotteria onesta l'esito della prossima estrazione è indipendente da tutte quelle precedenti. Questa è la definizione matematica di casualità, non un'affermazione filosofica. Il lototrone non ha memoria della propria storia: ogni combinazione ha una probabilità pari al reciproco del numero di combinazioni, e questa probabilità non cambia in base a ciò che è uscito ieri. Nel SuperEnalotto, ad esempio, ognuna delle 622.614.630 sestine di 6 numeri su 90 — cioè C(90,6) = 622.614.630 — ha esattamente la stessa probabilità: una su 622.614.630.

Ma la casualità genera forme. Se lanci una moneta 1000 volte, da qualche parte in mezzo ci sarà inevitabilmente una serie di 7 teste consecutive: è un fenomeno assolutamente normale, non un "trucco". Il motivo: in una sequenza lunga tutte le possibili forme brevi si presentano alla loro frequenza attesa, e con un campione grande gli eventi rari diventano quasi inevitabili. Il cervello è bravo a individuare queste forme e pessimo nel capire quanto siano in realtà attese. Questo effetto si chiama apofenia: la tendenza a vedere schemi dove non ce ne sono.

Da qui la distinzione pratica: si può sempre descrivere uno schema a posteriori (qualsiasi sequenza è descrivibile), ma non lo si può prevedere in anticipo a meno che non abbia una struttura causale. E il test di "questo schema ha una struttura causale" è esattamente il problema che la statistica risolve.

Come distinguere il rumore dal segnale: p-value e intervallo di confidenza

Ogni test statistico di casualità funziona allo stesso modo. Prima si formula un'ipotesi nulla: "i dati sono casuali". Poi si calcola quanto sia probabile il risultato osservato sotto quell'assunzione. Questa probabilità si chiama p-value. Se il p-value è molto piccolo (la soglia standard è sotto 0,05), significa che i dati si adattano male all'ipotesi nulla, e l'ipotesi può essere rifiutata.

In pratica, il p-value va interpretato con cautela. Con una soglia di 0,05, ogni ventesimo test onesto produrrà per puro caso un falso risultato "significativo". Se esegui 1000 test di questo tipo su diverse combinazioni di numeri, in 50 di essi comparirà da solo uno "schema": non perché esista, ma perché hai guardato 1000 volte. Questo si chiama problema dei confronti multipli, ed è la principale fonte di conclusioni errate sugli schemi nella lotteria.

Quindi un test vero non è "ho trovato qualcosa con p < 0,05", ma "ho trovato qualcosa con un p-value corretto per il numero di test". Ed è qui che diventa interessante: tutti e cinque gli strumenti del sito sono costruiti proprio tenendo conto di questa correzione. Per approfondire i principi dei test multipli, vedi l'articolo sui 20 metodi di analisi.

Autocorrelazione: un'estrazione dipende dalla precedente?

Il test più diretto sull'esistenza di un "algoritmo di estrazione dei numeri". La sezione autocorrelazione calcola la correlazione tra estrazioni adiacenti: se l'estrazione di oggi avesse un legame causale con quella di ieri, ciò si manifesterebbe come una deviazione persistente della funzione di autocorrelazione dallo zero.

Cosa mostrano i dati reali. Nel SuperEnalotto (6 di 90), con migliaia di estrazioni, l'autocorrelazione oscilla intorno allo zero all'interno dell'intervallo di confidenza: è rumorosa, come dovrebbe essere un processo casuale. Nessun lag (ritardo) fornisce un segnale persistente. Se esistesse un "algoritmo di estrazione" come "dopo il 17 esce più spesso il 23", lo vedremmo qui come un picco al lag 1. Quel picco non c'è.

Nel 10 e Lotto, la versione italiana del keno, dove le estrazioni avvengono ogni cinque minuti e l'archivio è enorme (20 numeri estratti su 90), l'autocorrelazione oscilla anch'essa intorno allo zero, ma l'intervallo di confidenza è più stretto: potremmo rilevare effetti deboli. E non ne troviamo. È uno dei risultati più convincenti, perché con un simile volume di dati persino uno schema minuscolo sarebbe visibile.

Il test delle sequenze (runs test): casualità dell'alternanza

L'autocorrelazione guarda ai numeri stessi, mentre il runs test guarda alle forme della loro distribuzione. Per esempio: quanto si allungano nell'archivio le sequenze di numeri pari (o dispari)? Quanto si allungano le sequenze di numeri "alti" e "bassi"? Nella casualità onesta esiste una distribuzione teorica delle lunghezze delle sequenze, e una deviazione da essa indica che da qualche parte l'indipendenza è violata.

Il risultato sulle principali lotterie a numeri è lo stesso dell'autocorrelazione: le deviazioni restano dentro l'intervallo di confidenza. Le sequenze di 5-6 numeri della stessa parità si verificano esattamente quante volte la casualità prevedrebbe. Lo stesso vale per le "sequenze di numeri adiacenti" e le "sequenze dallo stesso range".

Il runs test è particolarmente abile nello scovare due cose. Primo, la regolarità artificiale: se un lototrone fosse programmato per "evitare" le ripetizioni, le sequenze lunghe si verificherebbero meno spesso del previsto. Secondo, un difetto dell'attrezzatura: un difetto fisico del lototrone creerebbe un "raggruppamento" che gonfia le sequenze lunghe oltre l'attesa. Né l'uno né l'altro sono visibili nei nostri archivi.

La legge di Benford: vale per i numeri della lotteria?

Il più esotico dei cinque metodi. La legge di Benford afferma: nei dati numerici "naturali" la prima cifra è distribuita in modo disuguale. La cifra 1 compare in circa il 30% dei casi, il 2 nel 17%, il 9 nel 5%. La legge funziona magnificamente per i redditi, le lunghezze dei fiumi, i prezzi delle azioni: ovunque i numeri spazino su diversi ordini di grandezza.

Per i numeri della lotteria da 1 a 90, la legge in senso stretto non dovrebbe funzionare. Il range è troppo corto, e le cifre "1-9" non coprono un ordine di grandezza. Ma un confronto grafico tra la distribuzione reale e quella teorica resta comunque utile: mostra come le leggi statistiche si comportano su range limitati e dove vengono meno.

Nel SuperEnalotto la prima cifra di un numero è distribuita in modo quasi uniforme (1, 2, 3, 4, 5, 6, 7, 8 ciascuna intorno all'11%, con il 9 leggermente sottorappresentato perché l'unico numero a iniziare con 9 è il 90). È esattamente ciò che la "casualità onesta entro un range limitato" prevede. Non c'è alcuna magia, ma è interessante vedere come una regola generale si adatti al proprio contesto.

Catene di Markov: il passaggio da numero a numero

Il più complesso dei test sul piano matematico, il più intuitivo nel concetto. Le catene di Markov costruiscono una matrice di transizione: se il numero 12 è uscito in un'estrazione, con quale probabilità uscirà il 25 nell'estrazione successiva? Per ciascuna coppia (i, j) tra le 90×90 = 8100 coppie, questa probabilità viene calcolata.

In una lotteria onesta tutte le 8100 probabilità dovrebbero essere pari al valore teorico (all'incirca 6/90 ≈ 0,067 per il SuperEnalotto: la probabilità che un numero specifico compaia in un'estrazione, indipendentemente dal passato). L'analisi di Markov costruisce questa distribuzione e verifica se sia uniforme.

Il risultato è prevedibilmente noioso: la matrice è uniforme, tutte le probabilità sono vicine al valore teorico e le deviazioni restano dentro l'intervallo di confidenza. Ma il metodo in sé è utile non per "trovare schemi" bensì per visualizzare l'aspetto della casualità su larga scala. Quando guardi una heatmap 90×90 con uno sfondo uniforme, la sensazione intuitiva che "qui da qualche parte si nasconde un algoritmo" svanisce. L'archivio appare davvero casuale.

I cinque metodi sopra coprono cinque diversi tipi di possibili schemi. Se anche solo uno di essi mostrasse un segnale persistente con un p-value corretto per i confronti multipli, sarebbe una pretesa seria a una scoperta. Ma su tutti i grandi archivi tutti e cinque restituiscono "casualità", il che si riassume in un'unica tabella:

Test	Quale schema cerca	Cosa mostrerebbe se presente	Risultato effettivo
Autocorrelazione	Dipendenza di un'estrazione dalle precedenti (lag 1, 2, 3 e oltre)	Un picco persistente a uno dei lag	Oscillazioni dentro l'intervallo di confidenza
Runs test	Regolarità delle sequenze (pari/dispari, alti/bassi)	Sequenze troppo regolari o troppo lunghe	Sequenze distribuite come nella casualità onesta
Legge di Benford	Distorsioni strutturali nella distribuzione delle prime cifre	Una forte deviazione dal modello di Benford	Una distribuzione uniforme, come atteso entro un range limitato
Test del chi-quadro di Pearson	Conformità delle frequenze a una distribuzione uniforme	Un valore del chi-quadro elevato e p < 0,05 dopo le correzioni	Le frequenze convergono all'uniforme sui grandi archivi
Catene di Markov	Dipendenze nelle transizioni a coppie (i → j)	Una matrice di transizione non uniforme	La matrice è uniforme, tutte le transizioni ugualmente probabili

Cinque metodi indipendenti, cinque diversi "tagli" dell'idea di schema, una sola e identica conclusione. Non è una coincidenza di risultati combacianti: è una proprietà dei dati.

La conclusione onesta: perché la lotteria resiste all'"hackeraggio"

La logica è semplice e, per quanto strano, economica. Un operatore di lotteria guadagna sulla differenza tra la vendita dei biglietti e il pagamento dei premi. Se nella lotteria esistesse uno schema sfruttabile, prima o poi verrebbe trovato — da scienziati, analisti, algoritmi. Alcuni giocatori fortunati diventerebbero ricchi, e il valore atteso della lotteria per l'operatore diventerebbe negativo. La lotteria chiuderebbe in fretta perché divenuta non redditizia.

Il fatto che le grandi lotterie operino da decenni restando costantemente redditizie è una prova indiretta ma potente dell'assenza di schemi sfruttabili. I lototroni vengono regolarmente ispezionati e sostituiti, gli algoritmi RNG nelle lotterie digitali sono certificati secondo standard, e gli archivi sono aperti all'analisi indipendente. Tutto questo funziona proprio perché l'"hackeraggio" è impossibile.

Ma da ciò non consegue che la statistica sia inutile per un giocatore. È utile in modo diverso: aiuta a filtrare la scelta. Se non ci sono schemi, allora qualsiasi scelta di numeri equivale alle altre quanto a probabilità di jackpot, ma alcuni approcci sono più sistematici, disciplinano il budget e riducono la probabilità di dividere un premio con la folla. Per approfondire gli approcci sensati, vedi l'articolo sulle strategie di gioco.

E un'ultima cosa. Se da qualche parte online vedi un "algoritmo per prevedere la lotteria", presta attenzione a come viene testato. Un test onesto prevede le estrazioni future, non un adattamento alla storia già giocata. Trovare un algoritmo sull'archivio e poi applicarlo sono compiti completamente diversi. Sui dati già giocati si può "spiegare" qualsiasi sequenza, anche una casuale: questo si chiama overfitting ed è comune tra molte "intelligenze artificiali da lotteria", come discusso in dettaglio nell'articolo sulla rete neurale per la lotteria.

In sintesi

In una lotteria onesta non ci sono schemi. Discende dalla definizione di casualità ed è confermato da tutti e cinque i test sull'archivio.
Il rumore della casualità produce forme che visivamente assomigliano a schemi. L'apofenia è la tendenza del cervello a notarle ed esagerarle.
Il p-value va corretto per il numero di test. Con 1000 verifiche, 50 "significative" si troveranno per puro caso se non si applica alcuna correzione.
Cinque strumenti (autocorrelazione, runs test, Benford, Pearson, catene di Markov) testano diversi tipi di schemi e restituiscono coerentemente "casualità" su tutti gli archivi a numeri del sito.
Le lotterie sono economicamente resilienti: se uno schema esistesse, l'operatore fallirebbe. Funziona come prova indiretta.
La statistica non prevede i numeri, ma aiuta a disciplinare la scelta e a eliminare i rituali travestiti da strategie.
Testare un algoritmo sull'archivio è sempre un adattamento. L'unico test onesto è prevedere il futuro, e in quel formato ogni "algoritmo" rende quanto un'estrazione casuale.

Schemi e pattern nella lotteria: esistono e come testarli

La risposta principale e perché il rumore sembra uno schema

Come distinguere il rumore dal segnale: p-value e intervallo di confidenza

Autocorrelazione: un'estrazione dipende dalla precedente?

Il test delle sequenze (runs test): casualità dell'alternanza

La legge di Benford: vale per i numeri della lotteria?

Catene di Markov: il passaggio da numero a numero

La conclusione onesta: perché la lotteria resiste all'"hackeraggio"

In sintesi

Provalo tu stesso

Articoli correlati

Numeri caldi e freddi: la strategia funziona davvero?

Come analizzare la lotteria: 20 metodi e quando usare ciascuno

Combinazioni vincenti: ambi, terzine e z-score