Merge branch 'main' into add_coat_optimizer

pytorch · MirMustafaAli · Nov 6, 2024 · Nov 6, 2024 · Nov 6, 2024 · Nov 6, 2024
commit 1f8f153bc6c7f5ede9eadf6be4f444e6ec8f0685
diff --git a/torchao/prototype/low_bit_optim/adam.py b/torchao/prototype/low_bit_optim/adam.py
@@ -55,16 +55,11 @@ def _subclass_zeros(self, p: Tensor, signed: bool):
         raise NotImplementedError
 
     def _new_buffer(self, p: Tensor, signed: bool):
-        if p.numel() >= 4096 and p.numel() % self.block_size == 0:
-            if isinstance(p, DTensor):
-                out = DTensor.from_local(
-                    local_tensor=self._subclass_zeros(p.to_local(), signed),
-                    device_mesh=p.device_mesh,
-                    placements=p.placements,
-                    run_check=False,
-                )
-            else:
-                out = self._subclass_zeros(p, signed)
+        local_p = p.to_local() if isinstance(p, DTensor) else p
+
+        # follow bitsandbytes, only quantize tensors >= 4096 values
+        if local_p.numel() >= 4096 and local_p.numel() % self.block_size == 0:
+            out = self._subclass_zeros(local_p, signed, self.block_size)
         else:
             out = torch.zeros_like(local_p)