Intelligens adatelemzés
VIMMD294 | PhD | Kredit: 5
A tantárgy célkitűzése
Az utóbbi évtizedek ugrásszerűen megnövekedő adattárolási lehetőségei miatt a vizsgált rendszerekről, folyamatokról egyre több mérési, megfigyelési adat kerül rögzítésre. Az új lehetőségek olyan új kérdéseket vetnek fel, mint a megfelelő adatok megszerzését biztosító kísérlettervezés, a mérés megtervezése, valamint a megszerzett - esetenként nagyon nagyszámú és sokdimenziós - adat elemzése: a megfelelő adatelemzési módszerek skálázhatósága, a számítási komplexitás növekedésének kézbentartása, továbbá a sokdimenziós adatok hatékony ábrázolása, vizualizációja.
Az újabb aspektusok, mint például a változók számának nagyságrendekkel történő növekedése, az adott tárgyterületet több szempontból jellemző adatok, a strukturált tárgyterületek, az aktív tanulás (a kísérlettervezéstől a beavatkozásos adatokig és megerősítéses tanulásig), illetve a különböző reprezentációjú háttértudás felhasználása a tervezéstől az elemzésen át az értelmezésig, új megközelítéseket igényelnek.
A tárgy célja, a kísérlettervezéstől a mérési adatok beszerzésén át az adatok komplex feldolgozásig és felhasználói modellbe integrálásáig tartó munkafolyamat egészének áttekintése részletesen bemutatva az adatábrázolás és -elemzés algoritmusait és eszközeit.
A tárgyaláshoz több szempontból előnyös, közös nevező a komplex modellek használata, amelyben kiemelt szerepet kapnak a valószínűségi gráfos modellek (probabilistic graphical models).
A komplex modellek használata a nagy változószám és viszonylag kis mintaszám mellett az induktív következtetés pontossága és megbízhatósága miatt szintén új kereteket igényel, amire különböző számításintenzív statisztikai megközelítések jelentek meg (pl. a „bootstrap" vagy permutáció alapú tesztek, a többszörös tesztelési korrekciós eljárások, illetve a Bayes statisztikai keretrendszer, benne a bayesi modellátlagolással).
A tantárgy követelményeit eredményesen teljesítő hallgatóktól elvárható, hogy:
1. Képesek legyenek az informatika széles területén a kísérletes, illetve a megfigyelésen alapuló ismeretszerzési folyamatok tervezésére, végrehajtására és eredményük szabatos reprezentációjára. Ismerjék a megfigyelési/beavatkozásos, statisztikai/oksági és strukturálatlan/strukturált adatok típusait, a kísérlettervezés, adatminőség-biztosítás, adattisztítás, adatelemzés, értelmezés, döntéstámogatás és modellalkotás fázisait.
2. Ismerjék a klasszikus statisztikai döntéselméleti alapokat, különös tekintettel az optimalizálási és mintavételi technikákra.
3. Ismerjék a komplex modellek leírására általános keretet adó valószínűségi gráfos modelleket, (probabilistic graphical models), ennek legnépszerűbb osztályait, a Markov hálókat, a rejtett Markov modelleket, és a Bayes hálókat. Ismerjenek számításintenzív statisztikai kereteket, mint például a „bootstrap" vagy permutáció alapú módszereket, és a Bayes statisztikai keretrendszert, illetve hozzájuk tartozó technikák elméleti alapjait és alkalmazását, benne többszörös tesztelési korrekciós eljárásokat és mintavételi technikákat.
4. Ismerjék az elemzésre szolgáló alkalmas legfontosabb dedikált hardver/szoftver eszközöket, valamint a kinyert tudás integrációját a tipikus informatikai kulcsterületeken.
A tárgy oktatói
Antal Péter
docens
tárgyfelelős
A tantárgy részletes tematikája
féle modellezés kapcsolata: predikátumabsztrakció és hibrid modellezés. Adatelemzés és metamodellezés.