Nagy nyelvi modellek integrációja tudásalapú rendszerekkel

Kirás éve: 2025   |   Státusz: nyitott
Célkitűzés

Hogyan segíthetik a nagy nyelvi modellek klasszikus MI (általánosságban: IT) rendszerek használatát és megértését?

A feladat részletei

A nagy nyelvi modellek (large language models, LLM) alkalmazásai közül a információkereséssel kiterjesztett generálás (retrieval-augmented generation, RAG) az egyik legsikeresebb, mivel képes a modellt megfelelően fókuszálni, elkerüli a hallucinációit és magyarázatot (forrásokat) is megad a válaszaihoz.


Forrás: Intro to RAG

A feladat megoldása során azt vizsgáljuk, hogy ez a módszertan hogyan terjeszthető ki más rendszerekre, például klasszikus tudásalapú megoldásokra.

A konkrét alkalmazási területet és a részfeladatokat a jelentkezővel közösen alakítjuk ki. Példák:

  • Döntéstámogató rendszerek és nagy nyelvi modellek
  • Bayes-hálók következtetéseinek magyarázata
  • Adatból tanult modellek feltérképezése LLM segítségével
  • Személyre szabott LLM-alapú aszisztens
  • Kutatástámogató rendszer

A feladathoz konkrét alkalmazási területeken több témakiírásom is kapcsolódik. Érdemes átböngészni ezeket (linkek a honlapomon).

Irodalmak

Ágota Benedek, "Bayes-hálók kiterjesztése nagy nyelvi modellekkel diagnosztikai asszisztens létrehozásához", TDK dolgozat, BME 2024.
Y. Huang and J. Huang, “A Survey on Retrieval-Augmented Text Generation for Large Language Models,” Aug. 23, 2024, arXiv: arXiv:2404.10981. doi: 10.48550/arXiv.2404.10981.
L. Liang et al., “KAG: Boosting LLMs in Professional Domains via Knowledge Augmented Generation,” Sep. 26, 2024, arXiv: arXiv:2409.13731. doi: 10.48550/arXiv.2409.13731.
Think-on-Graph 2.0: Deep and Faithful Large Language Model Reasoning with Knowledge-guided Retrieval Augmented Generation,” presented at the The Thirteenth International Conference on Learning Representations, Oct. 2024. Accessed: Jan. 24, 2025.

Szükséges kompetenciák - megszerezhető képességek

A feladat sikeres megoldásához elemi programozói tudás (Python, esetleg NodeJS) szükséges, speciális (pl. NLP) algoritmusok és eszközök előzetes előismerete nem.

A feladat megoldása során gyakorlati ismeretek szerezhetők a természetes nyelvű szövegek gépi elemzésének különböző lépéseiről, a nagy nyelvi modellek (LLM) alkalmazásáról, prompttervezésről, programozói felületeikről, felhőalapú és lokális futtatásukról.

A jelentkezés menete, mi várható a konzulenstől...

Ezen a lapon összefoglaltam, mire számítok a jelentkezőktől, illetve mi várható tőlem.

 

Mészáros Tamás
Mészáros Tamás

docens
meszaros (*) mit * bme * hu
  ResearcherID Scopus ORCID Google Scholar ResearchGate