Tesztidő alatti számításoptimalizálás és chain-of-thought promptolás a modell teljesítményének javítására
Kirás éve: 2025 |
Státusz: nyitott
Ez a kutatás a nagy nyelvi modellek (LLM-ek) tesztelési teljesítményének növelésére összpontosít, elkerülve a költséges újratanítást. A megoldás két kulcsfontosságú technika kombinációján alapul: a "Chain-of-Thought" (CoT) promptolás és egy újszerű mintavételezési eljárás.
ProblémaAz LLM-ek gyakran nehezen birkóznak meg összetett feladatokkal, hibás vagy logikailag inkoherens válaszokat adhatnak.
MódszertanEz magában foglalhatja:
- A már generált, de a modell által még nem "látott" szöveg (tehát a prompt egy része) átfogalmazását, pontosítását.
- További, a gondolatmenetet segítő információk hozzáadását a prompt-hoz a generálás során.
- A modell által generált, de még nem véglegesített köztes gondolatmenetek értékelését, és ezek alapján a bemenet adaptív módosítását.

Marosi Márk
doktorandusz
marosi (*) mit * bme * hu