Infrastruktura do nauki, czyli o metodach Contextual Bandits i Reinforcement Learning
Metody Contextual i Multi-Armed Bandits to szybsze i bardziej adaptacyjne metody w porównaniu do tradycyjnych testów A/B. Skuteczniej też ułatwiają podejmowanie decyzji przy wprowadzaniu nowych produktów na rynek. Podejścia te…