5.2.3. Statisztikai adatokon alapuló érvek
A lakosság 52,2 százaléka támogatja az euró mielőbbi bevezetését. Nap, mint nap találkozunk a fentiekhez hasonló állításokkal. Sokak számára a bennük szereplő számok már eleve azt a benyomást keltik, hogy jól megalapozott, mondhatni tudományos megállapításokkal van dolgunk. Mások - és remélhetőleg az olvasó is ez utóbbiak közé tartozik - inkább tudni szeretnék, hogy min is alapulnak, milyen érvek szólnak mellettük vagy netán ellenük. Az első két példával már találkoztunk, mint induktív következtetések konklúziójával, így - bár csak futólag - szó volt arról is, min alapulnak. Az ilyen következtetések az induktív érvelések egy sajátos, kifinomultabb változatát alkotják. Nem arról van bennük szó, hogy egy minta összes - vagy szinte összes - elemében meglevő tulajdonságot vetítünk ki az egész alapsokaságra, vagy annak egy ismeretlen elemére. Most a vizsgált tulajdonság valamilyen arányban megosztja a mintát - egyes elemekben megvan, másokban nincs -, és ezt a megoszlást vetítjük ki az alapsokaságra. Ugyancsak a tulajdonságnak a mintán belüli eloszlása alapján adunk becslést arra, hogy az alapsokaságnak egy meghatározott további eleme milyen valószínűséggel rendelkezik a vizsgált tulajdonsággal. További, bonyolultabb esete a mintából nyert adatok felhasználásának, amikor nem egyszerűen egy tulajdonság megléte vagy hiánya a kérdés, hanem valamilyen mennyiséget rendelünk az alapsokaság, és ezen belül a minta elemeihez. Ennek értékét mérjük le a minta elemein, és az értékek kapott eloszlásából készítünk becslést arra, hogy hogyan oszlik meg az egész alapsokaságban. Ilyen mennyiség lehet a testsúly vagy az élettartam. Mindegyik esetben arról van szó, hogy a minta elemeiről nyerhető adatokat megfigyeljük, illetve megmérjük, összegyűjtjük, meghatározzuk a mintán belüli megoszlásokat, azaz statisztikát készítünk, és ennek eredményeit vetítjük ki az alapsokaságra. Az előző bekezdésben körülírt következtetéseket (és rokonaikat) nevezhetjük statisztikán alapuló következtetéseknek. Amikor számadatok segítségével próbálnak meggyőzni bennünket valamiről, az esetek nagy többségében statisztika alapján érvelnek, vagy azt a látszatot próbálják kelteni, hogy erről van szó. Vizsgáljuk meg egy egyszerű eseten az 5.1. szakaszban szereplő valószínűség-számítási ismeretek felhasználásával, milyen adatokon alapul egy statisztikai érv, mit lehet kezdeni vele, és mik lehetnek a gyenge pontjai. Amikor az euró mielőbbi bevezetésének támogatóira és ellenzőire vagyunk kíváncsiak, a helyzetet az teszi viszonylag egyszerűvé, hogy egyetlen, igennel vagy nemmel megválaszolható kérdést kell csak feltenni: A kérdés lehet ez: "Támogatja-e Ön, hogy Magyarország minél előbb bevezesse az eurót?". Egyesek igennel, mások nemmel fognak válaszolni, ebből pedig levonhatunk valamilyen következtetést a mielőbbi bevezetés támogatottságára vonatkozóan. A dolog azonban bonyolultabb; vegyünk sorra néhány tényezőt, ami befolyással lehet az eredmény megbízhatóságára. Kezdjük a kérdés megfogalmazásával. A fenti változat korrektnek és semlegesnek tűnik. De ugyanezt meg lehetne úgy is fogalmazni, hogy a kérdés sugallja, milyen választ vár az, aki feltette, mondjuk: "Akkor is támogatja-e Ön, hogy Magyarország minél előbb vezesse be az eurót, ha a feltételek megteremtése számottevő életszínvonal-csökkenéssel jár?". Természetesen olyan megfogalmazást sem volna nehéz találni, amely a mielőbbi bevezetés kedvező következményeire, vagy a halasztás hátrányaira hívja fel a figyelmet. A tendenciózus kérdés hibáját máshol részletesebben tárgyaljuk; itt azonban lényeges, hogy lemérhető következményei vannak annak, ha lényegében ugyanazt ugyanazoktól a személyektől így vagy úgy kérdezzük. Nem elhanyagolható tényező, hogy azok között, akiknek ezt a kérdést felteszik, az igennel és a nemmel válaszolók mellett ott vannak azok is, akik egyik választ sem választják. Egy részük azért nem válaszol, mert nincs véleménye, nem tud egyértelműen ítélni, mások pedig azért, mert titkolni akarják a véleményüket. Ez a két utóbbi csoport eléggé megnehezíti azt, hogy a válaszok arányából reális következtetéseket lehessen levonni - mindenesetre a kérdezőnek legalább arra kell törekednie, hogy azok között, akik nem adnak egyértelmű választ, külön lehessen választani a bizonytalanokat és a válaszmegtagadókat. A minta reprezentativitásának kérdésével már foglalkoztunk. Azok a tényezők, amelyek (eleve nyilvánvaló módon, vagy a mintavételnél vagy felmérésnél szerzett tapasztalatok szerint) befolyásolják a választ, a mintát és az alapsokaságot is részsokaságokra osztják. A minta egyes részsokaságaiban (például a városban élő, 40 és 50 év közötti, felsőfokú végzettségű nők, vagy a falun élő, 18 és 30 év közötti, középfokú végzettségű férfiak körében) más-más lesz az "igen", a "nem", a "nincs határozott véleményem" és a "nem kívánok válaszolni" aránya. Ezeket lehet kivetíteni az alapsokaság (adott esetben bizonyára az egész felnőtt lakosság) megfelelő részsokaságaira. Ha a mintában ezek a részsokaságok ugyanolyan arányban szerepelnek, mint az egész felnőtt lakosságban, akkor az egyes válaszoknak a minta egészében tapasztalt arányát vetíthetjük ki az alapsokaság egészére. Újabb kérdés azonban az, hogy mennyire megbízható a kapott eredmény. Ahhoz, hogy erre a kérdésre teljesen tisztázott választ adjunk, el kellene mélyülnünk a valószínűség-számításban és a matematikai statisztikában, de a válasz alapgondolata az eddigiekre (főleg az 5.1.5. és az 5.1.6.) szakaszban leírtakra) támaszkodva vázolható. Lényegében arról van szó, hogy a minta egyes részsokaságaiban tapasztalt és az egész lakosság megfelelő részsokaságaiban feltételezhető válaszmegoszlás eltérését már véletlenszerűnek tekinthetjük. Ezeket az eltéréseket az egyes részsokaságokon belül, majd ezekből kiindulva (súlyozott számtani közepüket véve) az átlagos eltérést az egész felnőtt lakosságon belül valószínűségi változókkal ábrázolhatjuk. Az 5.1.6. szakaszban ismertetett centrális határeloszlás-tétel és további matematikai eszközök segítségével ki lehet mutatni, hogy normális eloszlású, azaz Gauss-görbét követő változókról van szó. (A tétel feltételeinek teljesülésében van szerepe a minta reprezentativitásának.) Változóink várható értéke 0 (hiszen az alapfeltevésünk az, hogy az egész lakosságon belüli és a mintán belüli arányok megegyeznek), a kérdés pedig valójában az, hogy mekkora a szórása az egész lakosságon belüli eltérést ábrázoló változónak. Ehelyett az egy, de nem olyan könnyen átlátható jelentésű érték helyett ilyenfajta statisztikai vizsgálatok korrekt ismertetése alkalmával két adatot szoktak megadni: a "hibahatárt" (szakszerű nevén: konfidencia-intervallumot) és a megbízhatósági szintet. Ha a fenti eredményt azzal egészítik ki, hogy a felmérés hibahatára ± 3%, megbízhatósága 97 % (vagy kissé világosabb megfogalmazásban: az igennel válaszolók valóságos aránya 97% valószínűséggel 3%-nál kevesebbel tér el az 52,2 %-tól, [Jegyzet: Vigyázat, nem hiteles adatok! Csak a példa kedvéért kerültek a szövegbe!] akkor a Gauss-görbével kapcsolatos ismereteink alapján már tudjuk, hogy az eltérés szórása 0,015 (azaz 1,5 %). A szórás döntően a minta nagyságától (a minta és az alapsokaság arányától), valamint az előbb emlegetett részsokaságok számától, azaz az alapsokaság struktúrájának bonyolultságától függ. |