Scusa, se approfitto...al di là del discorso gadget, non pensi che 8 edicole di un medesimo quartiere più diciamo 4-5 del centro di una città possano costituire una campionatura, sia pure con ampi margini di variazione, diciamo discreta per quel che riguarda le vendite di un determinato prodotto in una determinata città e che il risultato di una città italiana possa, sempre con ampi margini, costituire una discreta campionatura per quel che riguarda la diffusione nelle altre città? Pensi che tra un quartiere e un altro di una città (escludendo magari gli estremi: quartiere degradato e quartiere residenziale) possano esserci grandi differenze e tra una città e l'altra pure? Non stiamo parlando di un partito politico, ma di un prodotto dichiaratamente di massa e ampiamente pubblicizzato. Se puoi, tengo molto al tuo parere e a una tua eventuale spiegazione. Grazie.
Per esempio...per intuire il calo di Dylan Dog negli ultimi anni, l'edicola presso cui mi servo abitualmente è...più che sufficiente. Diminuisce il numero di copie in arrivo e sulle medesime diminuisce quello delle copie vendute. Dipende, ripeto, da "cosa" si prende in esame. Un conto è fare un' indagine su quale marca di automobili preferiscono gli italiani (e questa è sì un'indagine complessa e articolata), ma se parliamo di un fumetto diffuso in tutte le edicole d'Italia penso possa ritenersi, sia pure "parzialmente" valida, la regola del "ciò che vale nel piccolo, vale anche nel grande".
Sono felicissimo di spiegarti tutto solo che temo di finire OT. Ti dico un paio di cose brevemente e se vuoi continuare il discorso magari lo facciamo privatamente!
Dunque una statistica è una funzione di un campione casuale attraverso la quale possiamo determinare i parametri incogniti della distribuzione della variabile aleatoria che vogliamo studiare. Questo procedimento è detto "inferenza".
Supponiamo che X sia la variabile aleatoria indicante percentualmente il numero di albi venuti sul totale (che quindi può assumere tutti i valori reali tra 0 ed 1) e che questa sia la variabile aleatoria generatrice di tutte le realizzazioni sul territorio nazionale.
Ciascun valore che può essere assunto dalla v.a. X (che chiameremo "xi") è determinato da una certa probabilità "pi". La relazione tra realizzazione e probabilità della stessa (ossia la probabilità che la X assuma proprio un certo valore xi) è definita dalla funzione di densità della variabile aleatoria X, funzione che dipende proprio dai parametri sui quali vogliamo fare inferenza.
Il campione statistico generato da una X costruita secondo le ipotesi descritte sarà perciò costituito da un insieme di realizzazioni della variabile aleatoria del tipo: (0,5; 1; 0,7; 0,1; ...).
L'obiettivo è costruire una statistica per riuscire a comprendere il modo in cui X si distribuisce.
Poiché sappiamo che (si veda il teorema del limite centrale) la statistica costruita come media campionaria di un campione di taglia tendente all'infinito si distribuisce come la v.a. normale (una nota variabile aleatoria di cui conosciamo tutte le caratteristiche), disponendo di un campione sufficientemente grande possiamo fare inferenza essendo certi di non commettere errori più grandi di una certa quantità calcolabile.
Già ma "grande" che cosa significa? In ambito di analisi dei dati di solito un campione di taglia n>=30 è considerato rilevante ed ha senso studiarlo. Quindi basterebbe che tu facessi un giro di 30 giornalai? Sì ma non proprio. Nel nostro caso la faccenda è complicata dal fatto che un campione di 30 elementi presi tutti da una stessa area geografica perde di significatività a causa del diverso modo in cui si manifesta l'interesse verso la testata nello stivale.
In pratica se volessimo tentare di fare inferenza utilizzando solo le nostre forze ciascuno di noi dovrebbe riportare il dato di vendita dei giornalai della sua zona specificando in che comune si trova. Raggiunto un campione abbastanza grande e raccolto in modo abbastanza omogeneo sul territorio avremmo dati sufficienti per fare inferenza e, quindi, per poter discutere.