„policy gradient methods“

Suchergebnisse

11 Treffer

Control Randomisation Approach for Policy Gradient and Application to Reinforcement Learning in Optimal Switching
Denkert, Robert ; Pham, Huyen ; Warin, Xavier
A Monte Carlo Policy Gradient Method with Local Search for Binary Optimization
Chen, Cheng ; Chen, Ruitao ; Li, Tianyou ; Ao, Ruicheng ; Wen, Zaiwen
Quantum Policy Gradient Algorithms
Jerbi, Sofiene ; Cornelissen, Arjan ; Ozols, Maris ; Dunjko, Vedran 2023 Schloss Dagstuhl – Leibniz-Zentrum für Informatik
Parametric estimation of stochastic differential equations via online gradient descent
Nakakita, Shogo
Softmax policy gradient methods can take exponential time to converge
Li, Gen ; Wei, Yuting ; Chi, Yuejie ; Chen, Yuxin
Approximate Gradient Methods in Policy-Space Optimization of Markov Reward Processes
Marbach, Peter ; Tsitsiklis, John N.
Robust gradient boosting for generalized additive models for location, scale and shape
Speller, Jan ; Staerk, Christian ; Gude, Francisco ; Mayr, Andreas
Geographic patterns of seed dormancy strategies along latitudinal and climatic gradients, Japanese East Asian islands
Fuji, Akinori ; Kusumoto, Buntarou ; Shiono, Takayuki ; Kubota, Yasuhiro ; Ulrich, Werner ; Dickie, John B. ; Chen, Si‐Chong
Geometry and convergence of natural policy gradient methods
Müller, Johannes ; Montúfar, Guido
Diagnostic test for misspecification of a random-effect distribution using the gradient function
Sakaguchi, Hiroki ; Kano, Yutaka
Gradient-projection and policy-iteration methods for solving optimization problems in STEOR-networks
Neumann, Klaus ; Delivorias, Panayote N. ; Steinhardt, Ulrich 1983 Inst. für Wirtschaftstheorie u. Operations-Research