Intelligens adatelemzés és döntéstámogatás
VIMIMB09 | Mérnökinformatikus MSc | Félév: 3 | Kredit: 5
A tantárgy célkitűzése
Az intelligens adatelemzés és döntéstámogatás tárgy haladó, a gépi tanulás és mélytanulás kutatási frontvonalában lévő megközelítéseket mutat be, így segítve valós problémák szélesebb körének mérnöki megoldását. Elsőként áttekintjük a bayes statisztikai és döntéselméleti kereteket, amelyek egységes keretet nyújtanak a háttértudás felhasználásához, a hiányos és bizonytalan adatok kezeléséhez, komplex modellek alkalmazásához és az intelligens következtetési formákhoz, adaptív adatgyűjtéshez.
Intelligens adatelemzési módszerek között bemutatjuk azokat a technikákat, melyek előfeldolgozásként segíthetnek az elemzés hatékonyságán, jóságán. Ezek között a dimenziócsökkentési és reprezentáció tanulási módszerek a hatékonyságot növelik - az utóbbiak absztraktabb megoldást nyújtva - a klaszterezés pedig fontos része az adatelemzés folyamatának. Az adatelemzést segítő gépi tanuló módszerek teljesítményének növelése történhet együttes gépi tanuló módszerekkel, ezen kívül valós teszthalmazon robusztusabb teljesítmény érhető el regularizációval. Részletesen ismertetjük az adatvezérelt döntéstámogatást ezekkel a gépi tanuló módszerekkel és a döntések kiértékelésének folyamatát, valamint gyakorlatban bemutatjuk ezek használatát különböző típusú (egyszerű, hierarchikus, idősoros, strukturálatlan) adatokon.
A beavatkozási adatok kezelésére és az intelligens adatgyűjtés támogatására bemutatjuk a valószínűségi gráfos modellosztályt és a kapcsolódó döntési hálókat és oksági hálókat, valamint a valószínűségi, oksági és kontrafaktuális következtetési módokat. Ismertetjük a bayes következtetések közelítő számítási módszereit, elsősorban a Markov lánc Monte Carlo módszereket. Bemutatjuk az oksági modellek modern gépi tanulási módszereit és a háttértudás szerepét a tanulásban, adat- és tudásfúzióban. Az adaptív adatgyűjtés keretén belül bemutatjuk az aktív tanulást, a megerősítéses tanulást és a k-karú rablókat, valamint ezek alkalmazását ajánló rendszerekben és felfedező rendszerekben.
A tárgy oktatói
Antal Péter
docens
tárgyfelelős

Hullám Gábor
tanszékvezető helyettes, docens

Sándor Dániel
doktorandusz
A tantárgy részletes tematikája
Az előadások részletes tematikája:
- Becslés és döntéselmélet, az optimális döntés és az emberi döntések sajátosságai, hasznosságfüggvények típusai. Intelligens következtetési típusok: valószínűségi, oksági és kontrafaktuális következtetés. Az információ értéke és optimális információgyűjtési stratégiák.
- Intelligens adatelemzési módszerek, adatelemzés különböző típusú (táblázatos, idősoros, strukturálatlan) adatokon.
- Regresszió típusú döntési problémák. Regularizált regressziós módszerek: Ridge, Lasso, Elastic net.
- Nem lineáris dimenziócsökkentő metódusok (autoencoder, manifold). Dimenzióredukció alkalmazási területei.
- Klaszterezés csoportosítási feladatoknál és osztályozási problémák előfeldolgozásaként. Biklaszterezés, spektrál klaszterező módszerek.
- ML módszerek teljesítményének (pontosságának) növelése. Együttes gépi tanuló módszerek (ensemble, ECOC).
- Ajánlórendszerek típusai és adatelemző módszerei. Mátrix faktorizáció és kollaboratív szűrés az ajánlórendszereknél.
- Adatvezérelt döntéstámogatás gépi tanuló modellekkel. Döntések kiértékelésének folyamata.
- Valószínűségi gráfos modellek definíciói, parametrikus és strukturális szemantikája, ritka reprezentációk használata, következtetési algoritmusok, nevezetes modellosztályok (naív Bayes hálók, Rejtett Markov Modellek). Kiterjesztések elsőrendű valószínűségi logikák és sztochasztikus nyelvtanok irányába.
- Oksági modellek származtatása, megfigyelési ekvivalencia fogalma. Beavatkozások modellezése a do(.) szemantika és gráf csonkolás segítségével. Korrigálás fogalma oksági hatáserősség becslésében. Kontrafaktuális következtetés.
- Konjugáltság és elégséges statisztika egzakt Bayes következtetésben. Bayes következtetések közelítési módszerei. Monte Carlo módszerek, elutasításos és fontossági mintavételezés. Markov Lánc Monte Carlo módszerek (MLMC): konvergencia és konfidencia diagnosztikai, többláncú módszerek, Metropolis-kapcsolt MLMC. Hibrid MLMC.
- Oksági modellek tanulása megfigyelési és beavatkozási adatból. Tanulás háttértudással, adat- és tudásfúzió rendszermodellek tanulásánál. Modelltulajdonságok Bayes tanulása.
- Aktív tanulás, tanulás költséggel. k-karú rablók (banditák), Monte Carlo fakeresés. Megerősítéses tanulás, mély megerősítéses tanulás.
- Ajánló rendszerek, zaj és informatív hiányzás kezelése. Felfedező rendszerek, korai felfedezési teljesítménymértékek, kísérlet várható hasznossága, adaptív kísérlettervezés.
A gyakorlatok részletes tematikája:
- Döntési modell konstruálása. Optimális döntés és információ értékének vizsgálata.
- Haladó regressziós gyakorlat Pythonban
- Spektrál klaszterezés képeken (Python)
- Együttes gépi tanuló módszerek (számolási gyakorlat)
- Oksági modell konstruálása. Valószínűségi, oksági és kontrafaktuális következtetés vizsgálata.
- Markov Lánc Monte Carlo módszerek vizsgálata: Gibbs és hibrid MCMC mintavételezés.
- Hiperparaméter optimalizálás k-karú rablók és mély tanulásos Monte Carlo fakereséssel.