
Fachbeitrag zum Offline Reinforcement Learning erschienen
20 Juni 2025
Der Fachbeitrag "Improving network dynamic pricing policies through offline reinforcement learning", der in Kollaboration zwischen der Professur für Data Analytics & Statistics (Prof. Brieden) und der Professur für Business Analytics & Management Science (Prof. Steinhardt) entstanden ist, ist im OR Spectrum erschienen.
In der Forschungsarbeit wird mittels Offline Reinforcement Learning Algorithmen aus historischen Verkaufsdaten eine im Sinne der Erlösmaximierung bessere Pricing-Politik erlernt, als die Politik, die den Daten zugrunde liegt. Die Autoren zeigen damit erstmals auf typischen Benchmark-Netzwerken, wie das Reinforcement Learning auch im Dynamic Pricing erfolgreich eingesetzt werden kann. Offline-Verfahren haben gegenüber existierenden Online-Verfahren den großen Vorteil, dass keinerlei Interaktion mit der echten Welt erforderlich ist und damit der kostspielige Lernprozess von Online-Verfahren – aufgrund der notwendigen Exploration suboptimaler Preise – obsolet wird.
Die Open Access Publikation kann hier abgerufen werden.