Moderatori: Messanensis, Alessio Bruno Bedini, GENS VALERIA
Frederick ha scritto:Una simile coincidenza avrebbe una probabilità prossima allo zero di verificarsi se i tre rami non fossero imparentati.
antonio33 ha scritto:Sì, tutto giustissimo, ma la storia si basa sui documenti e non sul calcolo delle probabilità...
Frederick ha scritto:Quello che voglio, in sinetesi, dire è che persino un documento è soggetto a errore e quindi ha una probabilità (e non una certezza) di essere veritiero.
antonio33 ha scritto:Sconfiniamo nella "filosofia": sì, col DNA potremmo provare che Tizio non è figlio di Caio, e come un documento non corrisponda alla verità.
Ma la storia, da quando esiste, si scrive grazie ai documenti...
antonio33 ha scritto:Mettiamola cosi: abbiamo buone probabilità di avere ragione entrambi. Ah, anche il test del DNA è un "documento"!
Non confonderei la "storia" (e chi la scrive...) con la verità. E con il calcolo delle probabilità...
Frederick ha scritto:Solo più informazioni riconducibili le une alle altre riducono questo grado di incertezza. Una registrazione parrocchiale non avrà mai lo stesso grado di certezza di un controllo incrociato tra molti personaggi della stessa famiglia presenti in un determinato luogo, in un determinato tempo, con determinate omonimie, con determinati titoli ecc. così come quanto appena detto non avrà mai lo stesso grado di certezza di un test del DNA. E lo stesso test del DNA non è sicuro al 100%.
Vincenzo ha scritto:Io di statistica credo di capirne abbastanza, e mi farebbe piacere come avete costruito questo modello. Difatti, per poter fare qualcosa di simile a quanto avete suggerito, occorrerebbe avere un'infinità di dati su tutti gli altri comuni d'Italia, se non del mondo (come fa altrimenti a stabilire che il cognome non è comune, che le migrazioni non lo sono, che gli incroci sono improbabili, eccetera?). Queste, a mio modo di vedere, sono assunzioni, non verità statistiche, che poi sfociano in stime statistiche che, come in un ourobourus, si pretendono essere vere ma in realtà lo sono a condizione che le assunzioni che si è stabilito son vere. E così via, così discorrendo...
Frederick ha scritto:Sono perfettamente d'accordo con Lei quando dice che le assunzioni alla base del modello devono essere vere. Sul web sono disponibili più database che forniscono informazioni sui cognomi. Ovviamente i dati sono approssimativi, certo.
Incrociando i dati di tre di questi database si possono trarre informazioni su cui poi si possono fare delle medie. E' semplice verificare come un cognome sia tipicamente regionale attraverso filtri di ricerca dal fatto che è quasi assente in altre regioni. Migrazioni in ingresso nella regione nulle quindi e migrazioni in uscita rappresentate dai pochi casi presenti nelle altre regioni.
Per quanto riguarda la rarità del cognome consideri che, appunto, un cognome che presenti 1000 maschi e 1000 femmine nel 2000 in Italia, concentrati ad esempio al 75% in una singola regione, possono rappresentare la totalità dei discendenti delle persone portatrici di tale cognome (tipicamente regionale) nel secolo da me preso in considerazione: il 1700. Il restante 25% è probabilmente migrato nelle altre regioni nel periodo successivo quando la mobilità sociale era molto più elevata.
Partendo da questo esempio di 1000 maschi (che sono ovviamente gli unici che trasmettono il cognome) possiamo, per ridurre al minimo la probabilità di attribuire maggior rarità del cognome nel 1700, ipotizzare anche che, a causa delle guerre mondiali, la popolazione maschile non abbia subito crescita nel corso del '900 (ed è una stima che, converrà con me, di certo sottovaluta la rarità del cognome nei primi del '900).
Nel corso dell'ottocento possiamo, sempre per ridurre al minimo la probabilità di attribuire maggior rarità del cognome, ipotizzare, come risulta da dati storici sul numero medio di figli per donna (non morti durante l'infanzia), un numero di 5,5. Di conseguenza avremo 2,25 figli maschi per donna. Per ottenere 1000 soggetti maschi dobbiamo quindi partire da 111 soggetti maschi ai primi dell'ottocento che per 4 generazioni hanno procreato 2,25 maschi.
Per evitare sempre di attribuire maggior rarità al cognome non considero nemmeno le eventuali migrazioni in uscita dall'Italia.
Di conseguenza avremo che in data anteriore al 1800 vi saranno ragionevolmente meno di 111 individui maschi portatori del cognome. (Stime prudenziali: potrebbero essere di meno).
Vincenzo ha scritto:Quello che intendo dire io, che non è una critica a lei anche perché credo di essere anche io uno dei pochi che applica la statistica (e non la matematica, che c'entra poco a dir il vero) alla ricerca genealogica
Vincenzo ha scritto:Prendiamo il semplice caso delle donne che lei faceva. Un cognome può diluirsi perché si hanno tante figlie femmine, moltiplicarsi perché si han tanti maschi. La cosa è indipendente sia dalla prosperità del capostipite in termini di figli, che dalla diffusione del cognome. Lei nel suo modello sottopone il calcolo al vincolo che la funzione che determina il sesso del nascituro restituisca alternativamente maschio e femmina. Ma il teorema limite centrale suggerisce che questo è vero asintodicamente, e cioè all'infinito. Non quando n è pari a 1000, come nel suo caso. Avere 1000 femmine che portano all'estinzione del cognome, o mille maschi che lo moltiplicano all'infinito, è perfettamente possibile (anzi, le due cose sono equiprobabili ad averne 500 e 500, per la legge debole dei grandi numeri).
Vincenzo ha scritto:Non ho alcuna intenzione di fare polemica qui. A mio modo di vedere lei confonde inferenza con calcolo delle probabilità. Ma non è mia intenzione convincerla né polemizzare gratuitamente: visto che chiedeva pareri, e visto che ho applicato la statistica alla ricerca genealogica, immaginavo potessero interessarle le mie opinioni. Dato che così non è, la ringrazio ugualmente.
Frederick ha scritto:Concorderà con me che stiamo parlando di inferenza statistica. L'inferenza statistica è una branca della probabilità che è una branca della matematica. Il modello astratto viene applicato al modello reale. Tuttavia nemmeno io voglio fare polemica. A me interessa la Sua opinione, come quella di chiunque altro, per comprendere se vi possono essere delle falle nel mio ragionamento. La ringrazio ugualmente.
Vincenzo ha scritto:"In un altro caso, si è umili manovali che misurano dati reali, e su quella base predicono cosa potrebbe essere successo."
Frederick ha scritto:Le sue osservazioni fanno comunque capire a qualsiasi persona che si fosse interessata a questo post che Lei, come ha dichiarato, ritiene che la statistica possa dare un contributo alla genealogia. Anche io ne sono convinto.
Seguendo una ricostruzione tradizionale per stabilire una linea di discendenza una singola registrazione battesimale errata o contraffatta ha una probabilità molto maggiore di avvenire.
Questo dimostra come incrociare più dati fornisca informazioni più rigorose, più scientificamente probabili e meno soggette a errori o manomissioni di una ricostruzione basata su un passaggio attraverso una singola registrazione battesimale.
Torna a Storia di Famiglia e Genealogia / Family History and Genealogy
Visitano il forum: Nessuno e 8 ospiti