| I sondaggi |
| Messaggio: #1 I sondaggi (05-09-2011 20:11 da ) |
| Mi sono preso la briga di scrivere alcune note sui sondaggi. Ho cercato di limitare al minimo la simbologia tecnica e lo statistichese. Sarò lieto di esaminare le vostre eventuali critiche e/o osservazioni. Avverto che non ho corretto le bozze. Per cui vi possono essere (come vi saranno) errori, che con benevola indulgenza, vorrete ignorare. (anche perchè oggi non ho fatto un tubo per scrivere sta cosa) |
| La situazione è grave, ma non seria |
| |
Rispondi |
| Messaggio: #2 RE: I sondaggi (05-09-2011 20:49 da ) |
| La spiegazione di come si svolga un sondaggio, dei suoi "limiti", di cosa si intende per errore" statistico, è chiarissima, non so se può o meno farti piacere, ma difficilmente mi succede di leggere qualcosa di "ostico" e proseguire la lettura liscia come l'olio, purtroppo tutto questo si è fermato alle formule e alla loro comprensione, vi sono segni per me incomprensibili Cmq grazie anche senza il poter capire e decifrare le forumle è stata una "lezione" utile e interessante. |
| http://welcomeitaly.forumfree.it/ |
| (Questo messaggio è stato modificato l'ultima volta il: 05-09-2011 20:55 da Ninetta.) |
Rispondi |
| Messaggio: #3 RE: I sondaggi (05-09-2011 20:56 da ) |
| Grazie daniele, veramente un bel lavoro, semplice, efficace, ridotto all' osso rispetto a quello che ci interessa qui. Anche a me hanno insegnato più o meno le stesse cose all' università quando negli anni 70 era di gran moda l'archeologia predittiva, cioè quando l'archeologia (troppo tardi!!!!) ha scoperto i vantaggi della clusterizzazione e dell'analisi matematica. E' stata la penultima rivoluzione in archeologia e l' ho vissuta da studente, mentre l' ultima, l' informatica l' ho vissuta da docente. Devo dire che l' ultima è abbastanza fallita perchè gli archeologi non hanno capito bene cos'è l' informatica, ma anche la penultima non è che sia andata molto meglio. Il motivo è tipicamente archeologico, tuttavia mi chiedo se alcune delle obiezioni che nel tempo abbiamo sviluppato verso la statistica in archeologia non siano valide anche per la statistica in politica. In archeologia abbiamo un doppio problema: il campione è "forzatamente casuale" e la verifica è impossibile. Un ritrovamento archeologico è quanto di più casuale si possa immaginare, ma appunto per questo non può essere stratificato cioè assunto o corretto. Il motivo è nel secondo problema, la verifica è impossibile.... puoi provare con un sondaggio a immaginare che mercato potrebbe avere la nutella alla fragola, poi la metti sul mercato e verifichi di quanto ti sei discostato, puoi formulare l' ipotesi nulla perchè hai un campione di controllo. In archeologia non è così. Non saprai mai se la tua proiezione è vera o totalmente sballata. Per fortuna in politica non è così, ogni tanto si fanno le elezioni e come stanno le cose lo sai, ma cosa ti garantisce dall' inefficacia del campione? Solo i grandissimi numeri temo almeno finchè la statificazione che fai non è perfettamente equilibrata. Ovvero mettiamo che dividi la popolazione in 3 cluster: giovani, adulti e vecchi. Altrettanto farai per il campione e a ciascun cluster del campione darai il "peso" del cluster nella popolazione reale. Ma cosa ti garantisce che il cluster giovani del tuo campione sia nella media? Hai dalla tua solo la casualità..... Con varie correzioni ti avvicinerai e diminuirai l' errore, ma come misuri l'errore dovuto alla casualità? |
| http://www.karmapolitico.ilcannocchiale.it |
| |
Rispondi |
| Messaggio: #4 RE: I sondaggi (05-09-2011 22:03 da ) |
| Conosco molto poco delle applicazioni statistiche in archeologia. Da qualche parte ho letto che aiuta a costruire cladi assai complessi. Confesso la mia ignoranza ed anche la colpa di non avere spinto oltre le mie conoscenze in materia. Quanto ai tuoi dubbi, Karma, dico che sono anche i miei. Una ricerca, se fatta bene, porta a buoni risultati. Ormai i metodi statistici sono stati collaudati per piu' di un secolo e continuamente aggiornati. Basta leggere gli annali di Biometrika per rendersi conto di quanto gli statistici siano pignoli fino alla perversione Ciò che rimane aleatorio è la costruzione del campione, in ogni indagine. Se lo statistico non è particolarmente attento, se non fa un giusto screening delle variabili da indagare si corre il rischio di avere dei responsi del tutto avulsi dalla realtà che delineano ipotetici modelli del tutto inadeguati. In questo senso mi sono sentito di esporre cautele d'innanzi al sondaggio su Vendola, richiamato da Enrico. Non perchè l'oggetto fosse Vendola. Poteva essere Bersani o Berlusconi o chiunque altro. Forse sono diffidente per natura ma quando vedo una domanda ambigua mi viene sempre in mente il detto: " chi male capisce peggio risponde" Ma anche ammesso che una ricerca sia fatta con tutti i crismi canonici, niente ci mette al riparo dalla obsolescenza dei risultati che, coi tempi che corrono, rischiano di essere vecchi già nel momento in cui li elabori. Prendiamo questa manovra ( quale, la prima, la seconda, la terza, la quarta o quella che uscirà dal Parlamento?) Il massimo reponsabile dell'Economia, Tremonti, si lascia andare ad una affermazione del tipo: " in sette giorni è cambiato tutto" Ora sarà vero, sarà falso, conoscendo il personaggio sono piu' per la prima ipotesi. Resta il fatto che questi sono tempi di navigazione a vista e che misurare in tempo reale l'economia, la politica è cosa assai ardua. Si vive alla giornata, perchè non c'è tempo e non c'è modo di apparecchiare a strategie di lungo termine, sostanziate da studi mirati. Anni fa ho avuto modo di conoscere un professore di Scienze Statistiche nigeriano. Aveva elaborato un corposo modello econometrico per il suo paese. La situazione, a quei tempi era molto meno dinamica di oggi. Però ogni lavoro che presupponga uno studio di migliaia di pagine dimostra, di per sè, i propri limiti. Sarei curioso di saper che ne è stato del voluminoso tomo che ha scritto. La formula di Einstein sulla relatività è di una semplicità disarmante, anche se ci sono voluti anni e anni di studio per arrivarci. Questo perchè è un condensato di verità. La statistica, per sua natura, è un condensato di probabilità. Mi taglierei gli zebedei da solo se dichiarassi che non serve o non serve piu'. Penso esattamente il contrario. Però non possono esserle attribuiti poteri taumaturgici che non ha. E' solo un utile strumento predittivo che, se usato bene, può indirizzare nelle scelte. Se usato male porta solo a grandi cantonate. (05-09-2011 20:49)Ninetta Ha scritto: La spiegazione di come si svolga un sondaggio, dei suoi "limiti", di cosa si intende per errore" statistico, è chiarissima, non so se può o meno farti piacere, ma difficilmente mi succede di leggere qualcosa di "ostico" e proseguire la lettura liscia come l'olio, purtroppo tutto questo si è fermato alle formule e alla loro comprensione, vi sono segni per me incomprensibiliGrazie. Non è poco che tu abbia colto il senso generale di quanto ho scritto. Per chi non ha fatto studi specifici la simbologia può essere ostica. |
| La situazione è grave, ma non seria |
| (Questo messaggio è stato modificato l'ultima volta il: 05-09-2011 22:06 da Daniele.) |
Rispondi |
| Messaggio: #5 RE: I sondaggi (06-09-2011 09:48 da ) |
| Cerco di provocare sia lo statistico daniele che il matematico DoooD (che da qualche tempo non si fa vedere). Perchè non fare una statistica della statistica? Esempio: In una scatola metto 1000 palline metà di in colore e metà di un altro. Quante palline devo tirare fuori per sapere quali sono i due colori? In senso matematico devo tirare fuori 501 palline, sicuramente così ce ne saranno di 2 colori, ma empiricamente sappiamo tutti che se ne tiro fuori almeno 10 le probabilità che siano tutte dello stesso colore non sono nulle, ma certamente molto basse. Quindi con un campione casuale dell' 1% ho una soluzione valida in che percentuale? (non fatemi fare di conto, non ho i fogli elettronici giusti e non mi va di impostarli!!!!) La cosa si complica e di molto se le palline sono di 3 colori e non sono affatto distribuite equamente e io voglio sapere la loro distribuzione. Quante ne devo tirare fuori casualmente per poter affermare che la loro distribuzione è uguale alla distribuzione media della scatola? PS: le palline sono 40 milioni, gli aventi diritto al voto. |
| http://www.karmapolitico.ilcannocchiale.it |
| |
Rispondi |
| Messaggio: #6 RE: I sondaggi (06-09-2011 10:01 da ) |
(06-09-2011 09:48)Karma Ha scritto: Cerco di provocare sia lo statistico daniele che il matematico DoooD (che da qualche tempo non si fa vedere).Accetto la "provocazione". Appena posso vedrò di rispondere in modo compiuto. Dico subito che, nel caso di palline di due colori si può ricorrere alla distribuzione binomiale, dove un evento esclude l'altro ( p= 1-q ; p+q=1). Il caso di palline di piu' colori può essere risolto ricorrendo al teorema di Bayes (probabilità a priori). Il caso di milioni di pirla che votano Berlusconi richiede qualche cosa di piu' di uno studio statistico |
| La situazione è grave, ma non seria |
| |
Rispondi |
| Messaggio: #7 RE: I sondaggi (06-09-2011 10:13 da ) |
Citazione:Il caso di milioni di pirla che votano Berlusconi richiede qualche cosa di piu' di uno studio statisticoSi in quel caso lo psichiatra è più indicato.... cmq a semplificare al massimo le palline sono di 3 colori: centrodestra, centrosinistra e astenuti, se poi ci metti anche il terzo polo .... ma appunto puoi provare a tenere insieme terzo polo ed astenuti in quanto con l'attuale sistema elettorale è irrilevante. |
| http://www.karmapolitico.ilcannocchiale.it |
| |
Rispondi |
| Messaggio: #8 RE: I sondaggi (06-09-2011 10:41 da ) |
| io non ho il tempo per abbozzare qualche conto con cui rispondere alla tua provocazione, anche perchè dovrei essere piuttosto rigoroso per non finire giustamente bacchettato da Daniele. Però posso dire che la dimensione del campione su cui basare l'indagine statistica non dipende proporzionalmente dalla dimensione della popolazione che si sta studiando, almeno non nei termini che verrebbero intuitivi. Con un migliaio di individui si può può ottenere un'indagine attendibile e rappresentativa (margine di errore basso) della popolazione di Padova, del Veneto o dell'Italia intera, molto dipenderà dai metodi di campionamento utilizzati che dovranno tenere conto della varianza della popolazione. Di fatto la nostra indagine sui bananas della popolazione, per stabilire il giusto campione da adottare, terrebbe conto di fattori non statistici (costi, logistica ecc..) che lasciamo perdere e statistici, del tipo - Precisione desiderata (chessò errore del 5%) - Stima a priori dell'incidenza del fenomeno di indagine (50% della popolazione ...) - Livello di confidenza (al 95%) Vado, azzardo (scrivendo m'è venuta voglia Daniele correggimi)n = K^2*P(1-P)/D^2 n = 1.96^2 (costante del livello di confidenza al 95% ovvero l'area sottostante la curva normale standard al 95%) * 0.5 (la stima) * (1 - 0.5 (sempre la stima)) / 0.05 (l'errore desiderato)^2 = 384,16 ovvero prendi un quattrocento persone sufficientemente eterogenee e data la stima che un italiano su 2 sia un bananas avrai uno studio statistico attendibile per stimare la distribuzione dei bananas reale nella popolazione LOL mi sembrano pochi...Daniele controlla! edit infatti avevo sbagliato i conti di appena un'unità di grandezza... ora mi sembra più plausibile |
| I popoli non dovrebbero aver paura dei propri governi: sono i governi che dovrebbero aver paura dei popoli. |
| (Questo messaggio è stato modificato l'ultima volta il: 06-09-2011 10:48 da DOOOOD.) |
Rispondi |
| Messaggio: #9 RE: I sondaggi (06-09-2011 11:00 da ) |
| Teniamo conto che il miglior sondaggio è un fotogramma di un film, dal quale si tenta di indovinare i fotogrammi successivi; di solito si indovina, ma ovviamente possono esserci i "colpi di scena", nella trama di un film, e quindi la qualità di un sondaggio non ha nulla a che fare con la probabilità che le previsoni, basate sul sondaggio, poi si avverino. Banalità, ma volevo dirla visto che mi è passata per la testa.... e che penso spesso ai CAS, i sistemi complessi adattativi, di cui la società è un esempio magnifico. Un battito d'ali di farfalla.... una statuetta del Duomo che vola.... e addio sondaggi. |
| But to speak seriously, the universality of an opinion is no proof, nay, it is not even a probability, that the opinion is right (A. Schopenhauer). |
| |
Rispondi |
| Messaggio: #10 RE: I sondaggi (06-09-2011 11:11 da ) |
| Si DOOOOD, quello che scrivi è sostanzialmente corretto. La domanda di Karma è ricorrente in tutte le indagini: " quanto deve essere ampio il campione per essere adeguato alla ricerca?" Per rispondere dobbiamo scomodare due concetti: la significatività e la potenza del test. Un test può essere significativo ma non potente. In questo caso avremo un responso che non si presta all'inferenza. E' intuitivo che un test è sia significativo ( 1-alfa) che potente ( 1- beta) all'aumentare di N. Bella scoperta. Però "N" grande ha un costo ( tempo, denaro ) per cui è necessario dimensionare il campione in modo necessario e sufficiente a soddisfare i due requisiti anzidetti. Per fortuna esistono delle tavole grafiche, in cui sono presenti tante curve che indicano la numerosità campionaria una volta definito il rischio alfa e il rischio beta. I rischi a cui si ricorre maggiormente sono 0,05 per alfa e 0,20 per beta. Definito ciò le curve evidenziano la numerosità campionaria necessaria per evitare di commettere errori di primo tipo e secondo tipo. Come ha affermato DOOOOD, un campione di mille unità statistiche, se ben stratificato restituisce ottime approssimazioni ai parametri veri della popolazione. Nei fatti la numerosità del campione dipende da: - rischio alfa - rischio beta - da delta ( distanza tra le medie di due campioni, in un confronto prima/dopo) - dalla varianza. E' intuitivo che piu' bassa è la varianza ( dunque maggiore la concentrazione attorno alla media) piu' sono sufficienti piccoli campioni. Non a caso, proprio per evitare campionamenti enormi, Gosset ( Student) ha escogitato il "t" che mette a confronto non solo le medie ma anche le varianze ( di due proporzioni o di due campioni o di un campione rispetto ai parametri noti della popolazione) Addirittura nei collaudi distruttivi si impiegano campioni N=30. Posso dire per esperienza empirica che un numero piu' grande di provini distrutti porta solo a modeste correzioni. Una volta nota media e varianza, ricorrendo alla curva normale standardizzata ( valore di Z) si ottiene l'intervallo di confidenza della media vera. Aumentando il campione ( con aumento di costi e di tempo) si stringe di poco l'intervallo attorno a µ. Nella ricerca sociale, mille unità statistiche sono piu' che sufficienti. Naturalmente è possibile dimostrarlo sia in modo empirico che teorico. (06-09-2011 11:00)alex Ha scritto: Teniamo conto che il miglior sondaggio è un fotogramma di un film, dal quale si tenta di indovinare i fotogrammi successivi; di solito si indovina, ma ovviamente possono esserci i "colpi di scena", nella trama di un film, e quindi la qualità di un sondaggio non ha nulla a che fare con la probabilità che le previsoni, basate sul sondaggio, poi si avverino.Un sondaggio è , effettivamente, una "fotografia" in un certo istante tk, fissato a caso, tra i tn istanti possibili della variabile T Però la stratificazione riguarda piu' di un fotogramma. Si cerca di includere nel campione piu' aspetti rappresentativi del film; proprio per evitare una stima puntuale ( sempre possibile ma a piu' alto rischio). Piu' fotogrammi ci mettono meglio al riparo dai "colpi di scena". Anche se il rischio è sempre presente di escludere dalla ricerca proprio quel fotogramma in cui le sorti si capovolgono. La casualità del campione serve proprio a questo: ad aumentare la rappresentatività del campione e a ridurre il rischio di escludere dalla ricerca aspetti fondamentali. Del resto, come patologo, tu sai bene che si può fare una biopsia ad un fegato alla ricerca di neoplasie e di incorrere, magari, nell'unico pezzetto di fegato sano che è rimasto al pz. In fondo la statistica è e rimane una scienza probabilistica, dunque non esatta. Quanto alla statuetta del Duomo....... Da anni ormai gli statistici, forti dell'impiego dei PC e software sempre meglio studiati correlano una grande quantità di variabili in modelli multivariati. Però piu' sono le variabili e piu' si abbassa il coefficiente di correlazione ( e di decisione). Per dirla semplice, aumentano le zone "grige" di accettazione/rifiuto dell'Ipotesi. Un esempio ci viene dalle previsioni del tempo. Oggi, grazie ai satelliti sono sempre piu' precise. Tuttavia, senza l'uso dei PC, non sarebbe possibile elaborare il gran numero di informazioni necessarie a fornire un modello previsionale sufficientemente attendibile. |
| La situazione è grave, ma non seria |
| (Questo messaggio è stato modificato l'ultima volta il: 06-09-2011 11:30 da Daniele.) |
Rispondi |
| Messaggio: #11 RE: I sondaggi (06-09-2011 13:45 da ) |
| va bene però il modello è uguale a quello del gioco d'azzardo. Se alla lotteria compero un biglietto ho 1 probabilità su 1 milione (se sono stati venduti un milione di biglietti) di vincere il premio, se compero più biglietti le mie probabilità aumentano, ma non in modo significativo, al punto che per essere sicuro di vincere mi tocca comperarli tutti!!!! Il campionamento non è che il sezionamento di un insieme per poterlo gestire visto che è troppo numeroso. Si basa sul principio che posso dividere la torta in tanti spicchi (cluster) la cui composizione sia la stessa dell' intera torta. La confidenza è il margine di errore che mi concedo, quello che decido per convenzione che sfugga alla mia misurazione. Allora la mia provocazione era: in quanti spicchi identici al totale come composizione politica possiami dividere la popolazione italiana? La risposta 40.000 (cioè 40.000.000 diviso 1000) a cosa è dovuta? Sempre ammesso appunto che una volta fatta questa divisione teorica siamo in grado di riconoscere e scegliere quell' insieme di 1000 individui, ogni errore di inclusione od esclusione ci discosta dal risultato (anche se errori opposti si elidono). Ma proprio Alex notava che PW somiglia notevolmente all' italia, ne è lo specchio in piccolo. Allora mi viene da pensare che forse la tecnica dei focus group in politica possa essere più efficace del sondaggio...... |
| http://www.karmapolitico.ilcannocchiale.it |
| |
Rispondi |
| Messaggio: #12 RE: I sondaggi (06-09-2011 15:13 da ) |
| La televisione, attorno a cui girano dei bei soldini, usa sicuramente il "focus group", i misteriosi volontari Auditel. Quanto alla rappresentatività di PW, lo è in termini qualitativi ma non credo in termini quantitativi; dubito moltissimo che possaessere considerato un focus group valido, Di certo NDI, da questo punto di vista, è tremendamente peggiore. |
| But to speak seriously, the universality of an opinion is no proof, nay, it is not even a probability, that the opinion is right (A. Schopenhauer). |
| |
Rispondi |
| Messaggio: #13 RE: I sondaggi (06-09-2011 16:15 da ) | ||
(06-09-2011 15:13)alex Ha scritto: La televisione, attorno a cui girano dei bei soldini, usa sicuramente il "focus group", i misteriosi volontari Auditel. Quanto alla rappresentatività di PW, lo è in termini qualitativi ma non credo in termini quantitativi; dubito moltissimo che possaessere considerato un focus group valido, Di certo NDI, da questo punto di vista, è tremendamente peggiore. Eh già, un vero inferno.. Perchè qui siamo omologati... Viva la diversità | ||
| ||
| | ||
Rispondi |
| Messaggio: #14 RE: I sondaggi (06-09-2011 16:22 da ) |
| Dipende dai punti di vista, secondo me siamo un ottimo focus group della sinistra..... |
| http://www.karmapolitico.ilcannocchiale.it |
| |
Rispondi |
| « Precedente | Successivo » |
Utente(i) che stanno guardando questa discussione: 1 Ospite(i)

Cerca
Lista utenti
Calendario
Aiuto
Rispondi

Rispondi

Daniele correggimi)
ora mi sembra più plausibile
![[Immagine: OrangeRibbonG.gif]](http://www.thelibby.com/OrangeRibbonG.gif)