Policy: A Time and Space Efficient Algorithm for Contextual Linear Bandits — ContextualEpochGreedyPolicy • contextual

Policy: A Time and Space Efficient Algorithm for Contextual Linear Bandits

Usage

 policy &lt;- ContextualEpochGreedyPolicy$new(sZl = 10)

See also

Core contextual classes: Bandit, Policy, Simulator, Agent, History, Plot

Bandit subclass examples: BasicBernoulliBandit, ContextualLogitBandit, OfflineReplayEvaluatorBandit

Policy subclass examples: EpsilonGreedyPolicy, ContextualLinTSPolicy