Tétel adatlapja
VisszaCÍMLAP

Kehl Dániel, Sipos Béla

Excel parancsfájlok felhasználása a statisztikai elemzésekben

TARTALOM, ELŐSZÓ


Tartalom


ELŐSZÓ
BEVEZETÉS, AZ EXCEL BEÁLLÍTÁSAI, AZ EXCEL PARANCSFÁJLOK HASZNÁLATA SORÁN

1 EGYSZERŰ ADAT-ELEMZÉSEK: VISZONYSZÁMOK SZÁMÍTÁSA ÉS GRAFIKUS ÁBRÁZOLÁS
1.1 A DINAMIKUS VISZONYSZÁMOK PARANCSFÁJL MŰKÖDÉSE GYAKORLÓ FELADATOK. (DINAMIKUS VISZONYSZÁMOK.XLS)
1.2 ÁBRÁK KÉSZÍTÉSE EXCEL PARANCSFÁJL MŰKÖDÉSE GYAKORLÓ FELADATOK. (ÁBRÁK KÉSZITÉSE.XLS)
1.3 AZ ORSZÁGONKÉNTI KORFA PROGNÓZIS KÉSZÍTÉSE 2050-IG EXCEL PARANCSFÁJL MŰKÖDÉSE GYAKORLÓ FELADATOK. (ORSZÁGONKÉNTI KORFA PROGNÓZIS KÉSZÍTÉSE 2050-IG.XLS)
1.4 NEMZETKÖZI ÖSSZEHASONLÍTÁSOK EXCEL PARANCSFÁJLOK FELHASZNÁLÁSÁVAL
GYAKORLÓ FELADATOK. (NEMZETKÖZI ÖSSZEHASONLÍTÁSOK EXCEL PARANCSFÁJLOK)

2 ELEMI MŰVELETEK A VÁLTOZÓKKAL ÉS EMPIRIKUS ELOSZLÁSOK ELEMZÉSE
2.1 SZÁMLÁLÁS, RANGSOROLÁS, ÖSSZEGZÉS
2.2 KÖZÉPÉRTÉKEK ÉS KVANTILISEK
2.3 SZÓRÓDÁSI MÉRŐSZÁMOK
2.4 AZ ELEMI MŰVELETEK PARANCSFÁJL MŰKÖDÉSE
2.5 EMPIRIKUS ELOSZLÁSOK ELEMZÉSE EXCEL PARANCSFÁJL MŰKÖDÉSE
GYAKORLÓ FELADATOK. (ELEMIMŰVELETEK.XLS ÉS EMPIRIKUSELOSZLÁSOKELEMZÉSE.XLS)

3 AZ IDŐSOROK ELEMZÉSI MÓDSZEREI
3.1 A DEKOMPOZÍCIÓS IDŐSORMODELLEK
3.1.1 AZ IDŐSOROK ÖSSZETEVŐI ÉS KAPCSOLÓDÁSI MÓDJAI
3.1.2 A TREND VAGY A HOSSZÚ TÁVÚ ALAPIRÁNYZAT BECSLÉSI MÓDSZEREI
3.1.3 A SZABÁLYOS RÖVID TÁVÚ (SZEZONÁLIS) INGADOZÁS
3.1.4 A CIKLIKUS (PERIODIKUS) MOZGÁS MODELLEZÉSE
3.2 AZ ELŐREJELZÉSEK HIBÁINAK A MÉRÉSE85F (A HIBAKÉPLETEK EXCEL PARANCSFÁJL MŰKÖDÉSE)
3.3 TRENDSZEZON-HIBASZÁMÍTÁS PARANCSFÁJL MŰKÖDÉSE
GYAKORLÓ FELADATOK. KONJUNKTÚRA CIKLUSOK MODELLEZÉSE, A TRENDSZEZON - HIBASZÁMÍTÁS EXCEL PARANCSFÁJL MŰKÖDÉSE)
3.4 A TELÍTŐDÉSI, A LOGISZTIKUS (S-ALAKÚ)- ÉS ÉLETGÖRBE TRENDFÜGGVÉNYEK BECSLÉSE EXCEL PARANCSFÁJLLAL
3.4.1 INFLEXIÓS PONTTAL NEM RENDELKEZŐ TELÍTŐDÉSI GÖRBÉK
3.4.2 EGY INFLEXIÓS PONTTAL RENDELKEZŐ TRENDFÜGGVÉNYEK
3.4.3 KÉT INFLEXIÓS PONTTAL RENDELKEZŐ TRENDFÜGGVÉNYEK
3.4.4 A LOGISZTIKUS TRENDEK BECSLÉSE EXCEL PARANCSFÁJL MŰKÖDÉSE
GYAKORLÓ FELADATOK. DEKOMPOZÍCIÓS IDŐSORMODELLEK
3.5 NAIV ELŐREJELZÉSI TECHNIKÁK. (A NAIVMÓDSZER-PARANCSFÁJL MŰKÖDÉSE.)
GYAKORLÓ FELADATOK. (NAIVMODSZER.XLS)
3.6 AZ EXPONENCIÁLIS KIEGYENLÍTÉS MÓDSZERE (EXPONENCIÁLISSIMITÁS.XLS ÉS EXPS FOR WINDOWS)
3.6.1 AZ EXPONENCIÁLISSIMITÁS.XLS PARANCSFÁJL MŰKÖDÉSE
GYAKORLÓ FELADATOK. (EXPONENCIÁLISSIMITÁS.XLS)
3.6.2 AZ EXPS FOR WINDOWS SZOFTVER MŰKÖDÉSE
3.7 A SABL-MÓDSZER (SZOFTVER) FELHASZNÁLÁSA ADATELŐKÉSZÍTÉSRE, A TREND ÉS A PERIODIKUS HULLÁMZÁS SZÉTVÁLASZTÁSÁRA
GYAKORLÓ FELADATOK A SABL-SZOFTVER ALKALMAZÁSÁRA
3.8 AZ ARIMA MODELLEZÉS MENETE
3.8.1 AZ ARIMA MODELLEZÉS LÉPÉSEI
3.8.2 AZ ARIMA MODELL AZONOSÍTÁSA
3.8.3 AZ ARIMA MODELLEK BECSLÉSE
3.8.4 EXCEL-PARANCSFÁJLOK AZ ARIMA MODELLEZÉS TÉMAKÖRÉBŐL
3.8.5 SPEKTRÁLANALIZIS.XLS PARANCSFÁJL MŰKÖDÉSE
3.8.5 25 IDŐSORKUTATÁSI MODELL BECSLÉSE.XLS EXCEL PARANCSFÁJL MŰKÖDÉSE
3.8.6 R+ INTERNETEN ELÉRHETŐ: FREE STATISTICS SOFTWARE (CALCULATOR)

4. A KORRELÁCIÓ- ÉS REGRESSZIÓSZÁMÍTÁS
4.1 A REGRESSZIÓ.XLS PARANCSFÁJL MŰKÖDÉSE
4.1.1 AZ ADAT MUNKALAP
4.1.2 A MÁTRIX MUNKALAP
4.1.3 A MARADÉK MUNKALAP
4.1.4 A MULTIKOLLINEARITÁS MUNKALAP
4.1.5 AZ AUTOKORRELÁCIÓ MUNKALAP
4.1.6 A HOMOSZKEDASZTICITÁS MUNKALAP
4.2 GYAKORLATI ALKALMAZÁSOK BEMUTATÁSA IDŐSOROS ÉS KERESZTMETSZETI ADATOK ALAPJÁN
4.3 COCHRANE-ORCUTT ITERÁCIÓS ELJÁRÁS, A COTRANSZFORMÁCIÓ.XLS PARANCSFÁJL MŰKÖDÉSE
4.4 A SZROETER-HARRISON-KING-FÉLE PRÓBA. (SZROETERTESZ.XLS PARANCSFÁJ MŰKÖDÉSE) ÉS A GOLDFELD-QUANDT-PRÓBA (GOLDFELD-QUANDT-PRÓBA.XLS PARANCSFÁJ MŰKÖDÉSE)
4.4.1 A SZROETER-HARRISON-KING-FÉLE PRÓBA
4.4.2 A GOLDFELD-QUANDT-PRÓBA
4.5 A REGRESSZIÓS EGYÜTTHATÓK ÖSSZEFÜGGÉSEI (AZ ÚTELEMZÉS)
4.6 KÉSLELTETETT REGRESSZIÓS MODELLEK. (KÉSLELTETETTMÁTRIX.XLS PARANCSFÁJL MŰKÖDÉSE)
4.6.1 A KÉSLELTETÉS MODELLJEINEK RÖVID TÖRTÉNETE
4.6.2 A FORDÍTOTT V-KÉSLELTETÉSŰ MODELLEK
4.6.3 KOYCK MÓDSZEREI
4.6.4 ALMON-FÉLE POLINOM ELOSZLÁSÚ OSZTOTT KÉSLELTETÉSŰ MODELLEK
4.7 A HATVÁNYKITEVŐS, COBB-DOUGLAS TERMELÉSI FÜGGVÉNY (A TERMELÉSI FÜGGVÉNY ÁTLAG ÉS HATÁRMUTATÓI.XLS PARANCSFÁJL MŰKÖDÉSE)
GYAKORLÓ FELADATOK: C-D-TERMELÉSI FÜGGVÉNY ÁTLAG ÉS HATÁRMUTATÓI EXCEL PARANCSFÁJL.XLS ALKALMAZÁSA. NEM LINEÁRIS, DE LINEARIZÁLHATÓ REGRESSZIÓS FÜGGVÉNYEK BECSLÉSE REGRESSZIO.XLS EXCEL PARANCSFÁJLLAL
4.8 A CES-FÜGGVÉNY BECSLÉSE. (CES1.XLS, CES2.XLS CES3.XLS)
GYAKORLÓ FELADATOK CES1.XLS, CES2.XLS ÉS CES3.XLS
4.9 LOGISZTIKUS REGRESSZIÓS FÜGGVÉNYEK
4.10 A SZTOCHASZTIKUS KAPCSOLAT ELEMZÉSE, AZ ASSZOCIÁCIÓS EGYÜTTHATÓK EXCEL PARANCSFÁJL MŰKÖDÉSE
4.11 KENDALL-FÉLE RANGKONKORDANCIA-MUTATÓ

FÜGGELÉK
F.1 INTERNETES INGYENES SZOFTVEREK ÉS ADATBÁZISOK
F.2 A MATRIX.XLS PARANCSFÁJL MŰKÖDÉSE
F.3 TUDOMÁNYTÖRTÉNETI ÖSSZEFOGLALÓ
F.4. TÁBLÁZATOK
F.4. A GÖRÖG BETŰK
FELHASZNÁLT IRODALOM



Előszó

A valós méretű statisztikai modellek megoldása kézi számításokkal általában nem, vagy csak nehezen végezhető el, a számítógépes feldolgozás lehetősége azonban új utakat nyitott meg a statisztika tudományában is. Napjainkban a számolási igény - a személyi számítógépek megjelenése és elterjedése miatt - már nem jelent különösebb akadályt, a számítások megkönnyítésére több matematikai-statisztikai és ökonometriai szoftvert is megalkottak. Ezeknek a programoknak az oktatás és a gyakorlati felhasználás szempontjából azonban több hiányossága is van. Az eladásra szánt programcsomagok általában "fekete dobozként" működnek, azaz a felhasználó nem látja, azt, hogy mi történik a háttérben, a bevitt input és az értelmezendő output jelenik meg csupán. A hivatkozott, legtöbbször az Amerikai Egyesült Államokban kiadott szakkönyvek a hallgatók számára nehezen beszerezhetőek és drágák. Az ilyen szoftverekkel kapcsolatos további gond az is, hogy folyamatosan újabb verzióik jelennek meg, ami széleskörű alkalmazásuk lehetőségét megnehezíti. Drágítja a felhasználásukat továbbá, hogy az éves licencdíj kifizetésén túl a gépszám függvényében gyakorta külön díjat kell fizetni. A felsőoktatásban sok esetben a szoftverek csak az egyetemi/főiskolai számítógépeken érhetőek el, a hallgatók otthoni számítógépükre legálisan nem telepíthetik azokat. A különböző szoftverek emellett különböző felhasználói felülettel rendelkeznek. A "preferált" csomag kiválasztása így meglehetősen önkényes. A különböző formátumok miatt a programcsomagok közötti váltás némely esetben gondokat okoz. Az interneten található, ingyenesen letölthető ökonometriai programcsomagok, mint például az egyik legismertebb és legelterjedtebb gretl (Gnu Regression, Econometrics and Time-series Library, http://gretl.sourceforge.net/), igen sokoldalú szolgáltatást nyújtanak, de az elméleti háttér feldolgozásához a megadott angol nyelvű szakirodalmat is be kell szerezni és el kell sajátítani. A jelenleg legnépszerűbb irodai programcsomag a Microsoft Office Windows változata 1990-ben jelent meg. A Microsoft Office és ezen belül az MS Excel világviszonylatban és Magyarországon is széleskörűen alkalmazott szoftver. Egyrészt ez a tény indokolja az MS Excel (továbbiakban Excel) alkalmazását, továbbá az is, hogy az előzőekben ismertetett problémákat részben ki lehet küszöbölni. Az Excel sok statisztikai műveletet képes elvégezni, de az alapfunkciók segítségével felépíthetők a bonyolultabb statisztikai és ökonometriai módszerek is a függvények segítségével. Az Excellel ilyen módon a széles értelemben vett modellezést is taníthatjuk a hallgatóknak. További előny, hogy a módszerek, a felhasznált képletek megjelennek, azok alakíthatók, az adott feladat megoldásához testre szabhatók, láthatóvá, és megérthetővé válnak a részeredmények és a mellékszámítások. Az Excel - a speciális statisztikai szoftverekhez hasonlóan, de messze nem olyan részletességgel - a statisztika módszertanának nagy részét felöleli beépített modulja (Analysis ToolPak) segítségével, de jó néhány apróbb hiba (pl. rossz, vagy félreérthető magyarra fordítás) és hiányosság is a sajátja. Az említett félrefordításoknál nagyobb hibák is megfigyelhetők, melyek az Excel korábbi verzióiban csakúgy megtalálhatók voltak, mint a legújabbakban. Az Excel a főként a következtetéses statisztikában oly fontos eloszlások esetén némely speciális esetben hibás, nagyban félrevezető értékeket szolgáltat. A témakör bőséges irodalommal rendelkezik, itt csak utalunk Knüsel illetve McCullough és Wilson vagy az Excel legújabb kiadásával kapcsolatban Yalta munkáira, melyekből az érdeklődő olvasó kimerítő "hibalistát" meríthet. Az említett hibák azért is bosszantóak, mert több éve ismertek. Hasonló problémák más szoftverek esetén is előfordultak, de valamennyit a lehető leggyorsabban javították, míg az Excel esetében ez a jelentős tudományos visszhang ellenére sem történt meg. Ennek megfelelően az Excelt tudományos felhasználásra nem, oktatásra azonban ajánlják a szerzők. Az Excel kétségtelen és messze legfontosabb előnye ugyanakkor, hogy az Office csomag elterjedése miatt szinte mindenhol megtalálható. Általános elérhetősége egyben azt is jelenti, hogy akár mikro- és kisvállalatok - amelyek a drága, és folyamatosan friss verziókkal jelentkező szoftvereket nem képesek megvásárolni - elemzési eszköztárát is erősítheti. Megemlítjük továbbá azt a fontos tényt, hogy a statisztika oktatásában ma már Magyarországon, a nagyobb egyetemeken és főiskolákon az Excel, mint táblázatkezelő szoftver elterjedt, főként könnyű elérhetősége okán. Az első könyv e témakörben Magyarországon Rappai Gábor: Üzleti statisztika Excellel c. műve volt. Ismereteink szerint csak az Excel alapszolgáltatásainak használata terjedt el az oktatásban és az üzleti életben Magyarországon, pedig - mint arról már szó esett - az Excel ennél többre képes, lehet batch file-okat, kötegelt parancsállományokat (a továbbiakban parancsfájlokat, illetve programokat) készíteni. Internetes keresés, és a rendelkezésünkre álló szakkönyvek feldolgozása alapján megállapítottuk, hogy az USA-ban igen elterjedtek a parancsfájlok, bár legtöbbször csak korlátozott szolgáltatásokat nyújtanak. A további szolgáltatásokat külön meg kell fizetni, azokat a könyvekhez mellékelt CD-k nem tartalmazzák. Rátérve az alkalmazási lehetőségekre, véleményünk szerint az adatelemzés öt szintje oldható meg az Excellel: Az első szint az, amikor a Függvény beszúrása varázslót (ikont) használjuk, tehát beépített statisztikai, matematikai és trigonometriai, mátrix, adatbázis, stb. függvényeket alkalmazunk. A második szint, amikor az Eszközök - Adatelemzés menüpont szolgáltatásait (pl. korrelációanalízis, regresszió) használjuk. A harmadik szint, amikor magunk írunk konkrét adatsorhoz vagy adatsorokhoz képleteket, mivel nem minden feladathoz áll rendelkezésre megírt függvény. A negyedik szint az, amikor parancsfájlokat készítünk - vagyis a harmadik szintet általánosítjuk - aminek felhasználásával az általunk megadott adatbázis terjedelméig (ez az adatbázisok sajátosságainak függvényében 25 - 10000 megfigyelés) új adatbázisok felhasználásával korlátlan számban számításokat végezhetünk a programozott képletek, illetve függvények alkalmazásával. Gyakran igen sok számítást kell elvégezni. Eben az esetben az idővel való takarékos gazdálkodás a cél, mert gyakran a harmadik szintnél egy feladatsor számításainak elvégzése több óra, vagy több nap, amit a parancsfájlok felhasználásával egy perc alatt el lehet végezni. Az ötödik szint az, amikor a feladat a hagyományos módon nem oldható meg. Erre példa a CES termelési függvény, ahol a változók száma több mint a rendelkezésre álló egyenletek száma. A feladat a legjobban illeszkedő függvény paramétereinek a megkeresése. A logisztikus és egyéb speciális trendfüggvények esetében a függvényeket nem lehet lineárisra transzformálni, a cél megkeresni azokat a paramétereket, amelyek mellett az illesztés a legpontosabb. A logisztikus regressziós függvények sem linearizálhatók, de iterációs eljárással, a paraméterek változtatásával a paraméterek becsülhetők, meghatározható egy olyan függvény, ahol a többszörös determinációs együttható a legnagyobb. Az Excel a Visual Basic for Applications (VBA) felhasználásával programozható, így ezek a feladatok egy iterációs eljárással megoldhatók. A negyedik és ötödik szint további előnye az, hogy szakértői értékelésre is felhasználhatók, vagyis javaslatot lehet tenni a különböző modellek elfogadására vagy elutasítására, továbbá kiküszöbölhetőek az Excel fordítási és tartalmi hiányosságai. Éppen ezért, és az eddig felsoroltak miatt gondoltuk úgy, hogy érdemes lenne olyan Excel alkalmazásokat létrehozni, melyek megkönnyítik a tanultak elsajátítását, dinamikusak, a felhasznált képletek "könnyen leolvashatók", megkönnyítik a feladatmegoldást, és didaktikusak. A hallgatóknak lehetőségük nyílik a nagy mennyiségű számítási folyamat "mögé nézni". További nagy előnye a következőkben ismertetett módszernek az, hogy az érdeklődő hallgatók - amennyiben valamilyen speciális módszer alkalmazására van szükségük, a bemutatott programok alapján, vagy azok módosításával - elkészíthetik saját, testhezálló Excel fájljaikat is. A munkalapokat egységes szerkezetben építettük fel. A változtatható, illetve megadható vagy megadandó adatokat sárga mezők jelölik, az eredményeket pedig egységes struktúrában, illetve szóhasználattal kívántuk megjeleníteni. A megértéshez szükséges végeredmények, és az egyes cellák számításához használt képletek valamennyi cella esetén láthatóak. Természetesen a képletek, függvények olvasásához alapvető táblázatkezelési ismeretek elengedhetetlenek, ezzel a számítás menete követhetővé válik. Szintén nagyon fontos, hogy egyetlen cella, vagy vezérlőelem (Checkbox, legördülő menü stb.) megváltoztatása az eredmények azonnali változását vonja maga után, és mindezt - hála a gyors számítási sebességnek - azonnal elérhetjük. Rappai Gábor az informatikai támogatottsággal és az Excel felhasználásával kapcsolatban a következőket írta: "meggyőződésem szerint a legszélesebb körben rendelkezésre álló támogatóeszköz használata a legindokoltabb". A modernizáció jelentőségére hívja fel a figyelmet Kovács Péter tanulmánya is, aki a Szegedi Tudományegyetemen bevezetett tanterven keresztül mutatja be a szegedi modellt, ami szintén erősen támaszkodik az Excelre. Úgy gondoljuk, hogy az általunk felvázolt, Excel alapú oktatás az egyik, természetesen nem kizárólagos irány lehet a jövőben. Rappai Gábor dékán javaslatára 2006-ban kezdtük meg a fejlesztő munkát. Az általunk írt oktatási segédlet "felhasználóbarát" stílusban íródott, csak annyi matematikai képletet tartalmaz, ami az Excel parancsfájlok megértéshez és a feldolgozáshoz, az eredmények értelmezéséhez feltétlenül szükséges és széleskörű hazai és nemzetközi adatbázist dolgoz fel, ami a szakmai megértést elősegíti. Az oktatási segédlet függelékében felhívjuk a figyelmet arra és bemutatjuk, hogy hogyan lehet a feldolgozott adatsorokat az interneten megkeresni és letölteni. Oktatási segédletünkben azokat az Excel parancsfájlokat mutatjuk be, melyek elkészítését feladatul tűztük ki, és amelyek felölelik a statisztika illetve ökonometria három fontos területét; 1. egyszerű elemzések: viszonyszámok számítása, grafikonok készítése, empirikus eloszlások elemzése és elemi statisztikai műveletek; 2. dekompoziciós és sztochasztikus idősorelemzés fontosabb statisztikai módszerei; 3; korreláció- és regressziószámítás, sztochasztikus kapcsolatok elemzése és egyes speciális alkalmazások: pl. késleltetett regressziós modellek, CES-függvények, logisztikus regressziós függvények. Az oktatási segédlet megértéséhez szükséges elméleti háttér nagy része megtalálható a Pintér József - Rappai Gábor (szerkesztő) [2007]: Statisztika. c. BSC tankönyvben, amire az Excel parancsfájlok kidolgozása során támaszkodtunk, ezért csak az Excel parancsfájlok megértéséhez feltétlenül szükséges elméleti ismereteket és képleteket ismertetjük. Tapasztalataink szerint az Excel parancsfájlok minden újabb Excel változatnál működnek, 2022-ben a legújabb változat az Excel 2019.

Munkánk során értékes segítséget kaptunk Hunyadi László emeritus egyetemi tanártól (Corvinus Egyetem) és Rédey Katalin nyugdíjas egyetemi adjunktustól (Pécsi Tudományegyetem, Közgazdaságtudományi Kar). Segítségüket ezúton is köszönjük.

A Szerzők


×