leggedrobotics · tasdep · Jun 21, 2024 · Jun 21, 2024 · nikitardn · Jun 21, 2024
diff --git a/rsl_rl/runners/on_policy_runner.py b/rsl_rl/runners/on_policy_runner.py
@@ -42,8 +42,12 @@ def __init__(self, env: VecEnv, train_cfg, log_dir=None, device="cpu"):
         self.save_interval = self.cfg["save_interval"]
         self.empirical_normalization = self.cfg["empirical_normalization"]
         if self.empirical_normalization:
-            self.obs_normalizer = EmpiricalNormalization(shape=[num_obs], until=1.0e8).to(self.device)
-            self.critic_obs_normalizer = EmpiricalNormalization(shape=[num_critic_obs], until=1.0e8).to(self.device)
+            if train_cfg.get("resume") == True:
+                until = 0
+            else:
+                until = 1.0e8
+            self.obs_normalizer = EmpiricalNormalization(shape=[num_obs], until=until).to(self.device)
+            self.critic_obs_normalizer = EmpiricalNormalization(shape=[num_critic_obs], until=until).to(self.device)
         else:
             self.obs_normalizer = torch.nn.Identity()  # no normalization
             self.critic_obs_normalizer = torch.nn.Identity()  # no normalization