FORGALOMANALÍZIS A HBONE MAGBAN
Fulajtár Pál,
fooly@sztaki.huMagyar Tudományos Akadémia, Számítástechnikai és Automatizálási Kutató Intézet
Az IP hálózatokon a forgalmat nem lehet olyan egyszerűen mérni, mint mondjuk a telefon előfizetők forgalmát. Ugyanis a távbeszélő hálózatok tarifázási elve, mely szerint a hívó fizet itt nem érvényesíthető. Miért is van ez így?
a; Nem oldható meg a vonalhasználat szerinti mérés, mivel a bérelt összeköttetések állandóan élnek.
b; A fogadott és küldött adatmennyiség szerinti mérés megoldható ugyan, de a mérés annyira könnyen befolyásolható, hogy igazságtalan lenne ez alapján számlázni.
Melyek is azok a tényezők, amelyek ilyen módon befolyásolják a mérést?
A vonalakon állandóan jelen van bizonyos forgalom az üzemképesség ellenőrzése miatt, amelyet a menedzsment rendszer generál, gondoljunk csak egyszerűen a
ping parancsra. Ez a hasznos kis programocska minden operációs rendszer alatt megtalálható és nagyszerűen ellenőrizhető vele a távoli gépek elérhetősége. Egyszerűsége rejti magában a legnagyobb veszélyt is, miszerint ha valakit elkezdek pingetni, akkor az Ő vonalán forgalmat generál és ha Neki a letöltött adatmennyiség után fizetnie kell, akkor bizony komoly károkat lehet ezzel okozni az illetőnek. Tegyük fel, hogy egy intézmény, vagy cég vásárolt magának egy 64 kbps sebességű bérelt vonali Internet hozzáférést és olyan szerződése van, amely szerint a letöltött adatmennyiség után fizetnie kell. Ennek szokásos díja ma Magyarországon 80 - 100 Ft/MB. Nem is kell hozzá rossz szándék, csak valaki állandóan tudni akarja, hogy ennek a cégnek a WWW szervere állandóan elérhető-e és emiatt másodpercenként 64 byte-os csomagokkal pingeti. Mit is jelent ez egy hónap alatt:
Ennyi kárt okozott ez az egy ember a cégnek egy hónap alatt. Könnyen ki lehet találni, hogy mekkora károkat lehet okozni ezen a módon, ha valaki ezt szándékosan teszi, mondjuk csak 10%-ig kiterhelve a vonalat, amit még feltehetőleg senkinek sem tűnik fel. Az ilyen módon átvitt adatmennyiség már több mint 2 GB, amelynek az ára 198 eFt.
A korszerű 33.6 kbps sebességű modemek korában ez a forgalom már egy sima telefonos kapcsolaton is elképzelhető.
Ezek alapján ez a rendszer is csak tájékoztató jellegű adatokat szolgá
ltat, semmilyen számlázással kapcsolatos tevékenységhez nem használjuk fel az így kinyert információkat.
2. A forgalommérő rendszer működési elve
Adott a tágabban értelmezett HBONE mag, amelynek az alábbi routerek a tagjai:
|
|
Ezek a routerek mind kapcsolódnak egymáshoz valamilyen módon, illetve minden külső kapcsolat ezen
eszközök valamelyikébe fut be.A tervezés során két nagyon fontos szempontra kellett ügyelni.
a; Minden a magon áthaladó adatcsomagot egyszer és csakis egyszer meg kell számolni.
b; A rendszer a rendkívül nagy mennyiségű transzparens forgalmat képes legyen feldolgozni, azaz a minél egyszerűbb és tömörebb legyen.
A forgalom számlálása viszonylag egyszerűen megoldható volt azzal, hogy igénybevettük a Cisco routereink azon szolgáltatását, hogy a kimenő csomagokat az interfészeken számlálni ké
pes. A kiolvasott adatok tartalmazzák aA beállításnál ügyelni kell arra, hogy azokat az interfészeket amelyek a mag routereket kötik össze a számlálásból ki kell hagyni, elkerülendő a kettős regisztrálást.
Ezt egy példával illusztrálnám:
Tegyük fel, hogy van két intézmény a JPTE és a VEIN, amelyek más-más routerekbe futnak be jelen esetben ezek a VHJ és a VHG. Ha a JPTE egyik számítógépe küld egy csomagot a VEIN egyik gépére, akkor ez a HBONE magon kersztül a következőképpen zajlik le: (1. ábra)
1. ábra
3. A működésről
A magon keresztül egy átlagos hétköznapon kb. 30-35 ezer számítógép forgalmaz. Ez hérvégén kevesebb, szombaton 5-8 ezer, vasárnap pedig 16-20 ezer gép átlagosan. A mért adatok 1 nap pontossággal bármikor visszakereshetők, de az aktuális nap statisztikája mindig perc pontosságú. Ez azért fontos, mert csak így biztosítható, hogy az rész napi adatok összevethetőek legyen más teljes napi adatokkal. Könnyen belátható tehát, hogy itt egy elég nagy adatmennyiségről van szó, amely naponta 5-35 ezer rekorddal gyarapszik. Ahhoz, hogy az adatok gyorsan feldolgozhatók és visszakereshetők legyenek ki kellett választani a megfelelő tárolási módot. Nagyon egyszerű lett volna a dolog, ha minden nap felsoroljuk egy táblázatban az összes a HUNGARNET közösségbe tartozó számítógép címét és ehhez kapcsolva tároljuk az információkat. Ez nem bizonyult járható útnak, mivel több százezer címről van szó a fent említett aktív kb. 35000 hosttal szemben, ezen kívül ez a módszer nem biztosítja a gyors lekérdezhetőséget és különféle paraméterek szerinti rendezést. Azaz így rengeteg tároló helyet áldoznánk fel a tárolás egyszerűsége miatt. Ennek kiküszöbölésére az adatokat egy SQL adatbázisban tároltuk el. Az adatbázis kezelő megvalósítja a gyors beillesztési, visszakeresési feladatokat és a saját fejlesztésű rendszer felé egy szabványos interfészt nyújt. Az SQL adatbázis kezelő lehetővé teszi azt is, hogy ODBC-n keresztül mások is hozzákapcsolódhassanak az adatbázishoz és az adatokban lekérdezéseket, gyűjtéseket végezhessenek olyan különleges estekre is, amelyeket az alaprendszerbe nem építettünk bele, vagy csak éppen nem lenne célszerű, hogy ha feldolgozó gép processzorát terhelnénk olyan összetett összefüggések kiértékelésével, amelyek a napi felhasználásban érdektelenek. Így elérhető lett, hogy az adatgyűjtést és az alapvető kiértékelési feladatokat egy PC végezze el, amely emellett még más feladatokat is ellát a HBONE üzemeltetésében. Csak érdekességképpen a PC kiépítettsége: Intel Pentium 100MHz CPU, 32MB RAM, 1GB SCSI HDD, Linux OS.
A rendszer a felhasználók felé egy WWW alapú felületet biztosít, amelyen keresztül a különféle lekérdezési paraméterek megadhatók. A lekérdezések vonatkoztathatók a teljes HBONE-ra, vagy a hálózat egy tetszőleges nagyságú darabjára, így a teljes hálózathoz mérten elenyésző forgalmú, de helyileg kirívó esetek is pontosan vizsgálhatók. A forgalmi adatok grafikonon is ábrázolódnak, így nagyon könnyen felfedezhetők az olyan hirtelen változások a forgalomban, amelyek az esetek többségében valamilyen rendellenességre utalnak.
Szükség esetén a lehetőség van különleges paraméterek mérésére is, ezeket azonban csak nagyon indokolt esetben figyeljük, mert óriási adatmennyiséget eredményez és ezeknek a feldolgozása is jelentős teljesítményeket köt le.
Ezek a következők lehetnek: Figyelhető, hogy egy számítógép milyen más gépekkel létesített kapcsolatot, kinek mennyi adatot küldött és kitől mennyit fogadott. Lehetséges a protokoll szerinti elemzés is, amikor az adatok típusáról is szeretnénk információhoz jutni. Erre akkor van szükség ha feltételezhető, hogy valaki rends
zeresen nagy mennyiségű, a kutatási profilba nem illő, illegális, szerzői jogot sértő adatokat továbbít vagy terjeszt. Vagy egyszerűen csak a forgalom protokollok szerinti megoszlásáról szeretnénk pontosabb képet kapni.
4. Felhasználási területek:
A rendszer 1997 november elsejei indulása óta már többször is bizonyította hasznosságát, olyan esetekben is amelyekben nem is számítottunk rá, hogy hasznos lehet.
Legfontosabb felhasználási terület mint említettem a HUNGARNET AUP-ben foglaltak betartásának ellenőrzése. Szerencsére jellemző, hogy azokat az anyagokat, amelyek nem illeszkednek a kutatói célú felhasználásba sokkal intenzívebben látogatják, így az ezeket tároló számítógépek forgalma is kirívóan megnő. Volt rá példa, hogy egy közismert feltört játékokat terjesztő gép forgalma olyan magas volt, maga mögé utasította a több mint 30000 felhasználóval rendelkező helka.iif.hu gépet vagy a napi több mint 1 GB news forgalmat bonyolító almos.vein.hu-t. Ugyancsak kirívó eset volt, amikor az egyik nagy vidéki regionális központ 512kbps sávszélességű vonalának 96%-át egy szerző jogvédett anyagokat illegálisan szolgáltató gép vitte el, ezzel gyakorlatilag lehetetlenné téve rendeltetésszerű használatot. Természetesen nem csak ilyen példákkal demonstrálható a rendszer működése. A lemma.math.bme.hu gépet figyelve pontosan látható az új linux disztribúciók megjelenésének az ideje, mivel ekkor a letöltések száma nagyon megnövekszik.
A rendszer nagyon hasznosnak bizonyult, az utóbbi időszak legnagyobb számítógépes b
etöréssorozatának kivizsgálása során, amikor a HUNGARNET CERT-et segítette rendszer azzal, hogy pontosan végigkövette, ahogyan a támadó végigpásztázza az általunk üzemeltetett hálózatok gépeit.
5. Megoldatlan kérdések:
A rendszer felépítéséből következően néhány olyan kompromisszumot kellett kötnünk, amelyek a mérést befolyásolják. Más esetekben pedig a műszaki lehetőségek szabnak határt a mérések elvégzésének.
Az ilyen problémák a következők:
A virtuális ATM interfészek forgalma nem mérhető, mivel a CI
SCO 4000-es routerekhez jelenleg nincs olyan szoftver, ami ezt támogatná.
Ez a következő területeket érinti:
- a BME bemenő forgalma
- a SZTAKI bemenő forgalma
- a HUNGARNET TEN-34 felé menő forgalma
Ennek a problémának az áthidalására a megoldást kidolgoztuk, sajnos a jelenleg használt routerek nem elegendőek ennek az elvégzésére.
Ugyancsak nem mérhető a HBONE mag csomópontjában lévő gépek forgalma (amelyek a vh* rotuereket összekötő pontra kapcsolódnak) bejövő forgalma, mivel ezeken az interfészeken nincs számlázás az algoritmus tisztasága és a teljesítmény érdekében. Viszont bizonyos nagy forgalmú gépeket (helka.iif.hu, listserv.iif.hu) legcélszerűbb ezen a részen elhelyezni.
Ezek a problémák hasonlóan az előzőhöz nagyobb teljesítményű routerek al
kalmazásával, illetve a topológia részleges megváltoztatásával orvosolhatók illetve orvosolva is lesznek.
Ami miatt ez nem jelent különösebb problémát azaz, hogy általában sehol sem a letöltött adatmennyiség szokta jelenteni a problémát, hanem szolgáltatott tartalom. Ezek mérésében pedig sokkal kevésbé okoznak gondot a fentebb leírt problémák.