Skip to content Skip to sidebar Skip to footer

Adatvizualizáció a 21. században

2018. január 10-én került sor az I. SZÉKELYDATA Adatvizualizációs pályázat meghirdetésére. A SZÉKELYDATA mottója: Erdély, Székelyföld és a nagyvilág a Big Data korszakában. A pályázat célja az adatfeldolgozás és adatvizualizáció népszerűsítése volt iskolások és friss egyetemista fiatalok körében. A pályamunkákat két kategóriában pontozta a zsűri: adatanalízis minősége (content) és vizualizáció szépsége (beauty) szerint. A résztvevők közül betekintést nyuerhettünk a fődíjasok munkáiba: Salamon Evelinnek és Rapa Eriknek (Sapientia EMTE) a Tudásbázis alapú tisztítás és adatvizualizálás című munkáját, továbbá még a legjobb adatelemzésnek járó kategóriában díjazott lányok: Rétyi Dorottya és Földi Zsuzsanna-Boglárka (BBTE) projektjét – a Munka és tanulás Székelyföldön című adatvizualizációt – ismerhettük meg..

Az adathalmazt a Hol vagytok székely(földi)ek? SZÉKELYDATA blogbejegyzés alapjául szolgáló, nagyobb székelyföldi településeken született személyek Facebook információi képezik. Ezeket az adatokat kellett feldolgozni a csapatoknak a pályázat keretén belül. A közönség soraiból több kérdés is felmerült így például érdemes lehet a jövőben Románia cégeinek a pénzügyi mutatói közötti összefüggések után kutatni.

 

De mi is a lényege az adatvizualizációnak? Az, hogy laikus emberek is megértsék a statisztikákat meg a grafikonokat és a készítőknek pedig jópofa dolog, állítják a versenyzők. Továbbá, egy kívülről szemlélődőnek, egy nézőnek játéknak is tűnhet úgy, hogy közben nem tudhatja, hogy mennyi munka van mögötte. Lássuk csak, mit is takar egy ilyen szép, színes, egyszerűnek tűnő (bár nem az elkészítés szempontjából) ábrázolás?

 

Három lépésben zajlik  az adatvizualizálás folyamata: adattisztítás, kategorizálás (statisztikák kinyerése), vizualizálás. Adattisztítás alatt kisbetűsítést meg ékezettelenítést kell érteni például, hogy a program a Tanár és a Tanar kifejezéseket mind a tanar kategóriába sorolhassa, mint foglalkozás. A pályázat fő témája az volt, hogy derítsék ki a diákok, melyik városból hova mennek a fiatalok tanulni, s ezután milyen szakmát választanak maguknak, egyszerűen mondva: merre szélednek szét a székelyek. Második lépésként a kategorizálás során szempontokat (nem, születési hely, aktuális tartózkodási hely, születési dátum, munkakör) választottak ki a pályázól. Utolsó lépésként a vizualizáció elkészítésére kerül sor, amely lehet statikus vagy dinamikus, interaktív.

Ugyanezen témán belül mesélt foglalkozásáról Búzás Ernő, az Átlátszó Erdély oknyomozó újságírója, aki szintén vett részt több adatvizualizációs versenyen Budapesten. Azt vallja, hogy az adatvizualizálás gyors és egyben lassú munka is.:assú, hiszen manuálisan történik az adatok bevezetése, másfelől gyors, mert az adattisztítás után már hamar meglesz a várt eredmény. Projektje volt például a Közpénzeső a székelyudvarhelyi médiára téma, de azzal is foglalkozik például, hogy milyen közigazgatási problémák akadnak az önkormányzatoknál.

Ernő kellő öniróniával jellemzi a szakmát: unalmas dolog, annyira nem látványos munka, nézel sorokat, amiben vannak karakterek, számok, betűk, viszont a téma az, ami motiválhat, főleg akkor, ha tudod, hogy lesz egy meglepő eredmény. Nem egyszerű munka, inkább nehéz: fel kell dolgozni az adatokat, az érintettekkel kell beszélni, adatokat kell ellenőrizni és a többi és a többi. Adatvizualizáció maga gyors, ha kész vannak az adatok, mi azt odaadjuk egy cégnek, s onnan rájuk van bízva – meséli Ernő. Vannak érdekesebb tények adatvizualizálással promoválva: például, hogyan függ össze a holdnak a ciklusa a GDP-vel? Ez is csak egy fun fact. Gyönyörű korrelációk vannak, de nem biztos, hogy mind helyénvaló.

Ernő még volt egy Hackathon adat-újságírói versenyen is Budapesten, 2018-ban már a második fordulóján. Miből áll ez a megmérettetés? Nyolc-kilenc óra áll egy versenyző(csapat) számára, azalatt ki kell dolgozzon kategóriákat, sokféle adatból, amit ez idő alatt összegyűjtött és még rá is jöjjön arra, hogy mire is lehet kíváncsi a zsűri.

 

Egy másik érdekes adatvizualizálási téma a következő: mi az egyetemek a hatása a lakások árára, így például Kolozsváron hogyan szöktek ugrottak ekkorát az árak?

 

Zárom is Kolozsvárral a cikket, egy a biztos: a lakossága folyamatosan növekedik, egyre több adat lesz, egyre több adatvizualizálóra van szükség, úgyhogy találkozunk még a módszerrel, nem szabadulunk meg tőle olyan könnyen!

Hajrá infósok, nahát, az újságírás is összefügghet ezen szakmával!

 
Ajánlom másnak is

Írd meg a véleményed