finish Lora Extract

AI-Casanova · Oct 20, 2024 · 6a9b7bc · 6a9b7bc
1 parent 3ed48ec
commit 6a9b7bc
Showing 1 changed file with 45 additions and 54 deletions.
diff --git a/extensions-builtin/Lora/lora_extract.py b/extensions-builtin/Lora/lora_extract.py
@@ -1,20 +1,21 @@
 import torch
+import time
 from os import path
 from safetensors.torch import save_file
 import gradio as gr
 from modules import shared, devices
 from modules.ui_common import create_refresh_button
-# from modules.call_queue import wrap_gradio_gpu_call
 
 
 class SVDHandler:
-    def __init__(self):
+    def __init__(self, maxrank=0, rank_ratio=1):
         self.network_name = None
         self.U = None
         self.S = None
         self.Vh = None
+        self.maxrank = maxrank
+        self.rank_ratio = rank_ratio
         self.rank = 0
-        self.maxrank = 0
         self.out_size = None
         self.in_size = None
         self.kernel_size = None
@@ -31,31 +32,28 @@ def decompose(self, weight, backupweight):
                 diffweight = diffweight.flatten(start_dim=1)
             else:
                 diffweight = diffweight.squeeze()
-
-        self.U, self.S, self.Vh = torch.linalg.svd(diffweight.to(device=devices.device, dtype=torch.float))
-        del diffweight
+        self.U, self.S, self.Vh = torch.svd_lowrank(diffweight.to(device=devices.device, dtype=torch.float),
+                                                    self.maxrank, 2)
+        # del diffweight
         self.U = self.U.to(device=devices.cpu, dtype=torch.bfloat16)
         self.S = self.S.to(device=devices.cpu, dtype=torch.bfloat16)
-        self.Vh = self.Vh.to(device=devices.cpu, dtype=torch.bfloat16)
+        self.Vh = self.Vh.t().to(device=devices.cpu, dtype=torch.bfloat16)  # svd_lowrank outputs a transposed matrix
 
-    def findrank(self, maxrank, rankratio):
-        if rankratio < 1:
+    def findrank(self):
+        if self.rank_ratio < 1:
             S_squared = self.S.pow(2)
             S_fro_sq = float(torch.sum(S_squared))
             sum_S_squared = torch.cumsum(S_squared, dim=0) / S_fro_sq
-            index = int(torch.searchsorted(sum_S_squared, rankratio ** 2)) + 1
+            index = int(torch.searchsorted(sum_S_squared, self.rank_ratio ** 2)) + 1
             index = max(1, min(index, len(self.S) - 1))
             self.rank = index
-            if maxrank > 0:
-                self.rank = min(self.rank, maxrank)
-        elif maxrank == 0:
-            self.rank = min(self.in_size, self.out_size)
+            if self.maxrank > 0:
+                self.rank = min(self.rank, self.maxrank)
         else:
-            self.rank = min(self.in_size, self.out_size, maxrank)
+            self.rank = min(self.in_size, self.out_size, self.maxrank)
 
-    def makeweights(self, rankoverride=None):
-        if rankoverride:
-            self.rank = min(self.in_size, self.out_size, rankoverride)
+    def makeweights(self):
+        self.findrank()
         up = self.U[:, :self.rank] @ torch.diag(self.S[:self.rank])
         down = self.Vh[:self.rank, :]
         if self.conv2d:
@@ -81,48 +79,49 @@ def loaded_lora():
     return ", ".join(list(loaded))
 
 
-def make_lora(basename, rank, auto_rank, rank_ratio, constant_rank):
-    if not shared.sd_loaded or not shared.native or loaded_lora() == "":
+def make_lora(basename, maxrank, auto_rank, rank_ratio):
+    if not shared.sd_loaded or not shared.native:
+        return
+    if loaded_lora() == "":
+        shared.log.warning("Lora extract: No LoRA detected. Aborting...")
         return
-    rank = int(rank)
+    if not basename:
+        shared.log.warning("Lora extract: Base name required. Aborting...")
+        return
+    t0 = time.time()
+    maxrank = int(maxrank)
     rank_ratio = 1 if not auto_rank else rank_ratio
-    constant_rank = False if not auto_rank else constant_rank
-    rank_overide = 0 if constant_rank else None
 
     if hasattr(shared.sd_model, 'text_encoder') and shared.sd_model.text_encoder is not None:
         for name, module in shared.sd_model.text_encoder.named_modules():
             weights_backup = getattr(module, "network_weights_backup", None)
             if weights_backup is None or getattr(module, "network_current_names", None) is None:
                 continue
             prefix = "lora_te1_" if hasattr(shared.sd_model, 'text_encoder_2') else "lora_te_"
-            module.svdhandler = SVDHandler()
+            module.svdhandler = SVDHandler(maxrank, rank_ratio)
             module.svdhandler.network_name = prefix + name.replace(".", "_")
             with devices.inference_context():
                 module.svdhandler.decompose(module.weight, weights_backup)
-            module.svdhandler.findrank(rank, rank_ratio)
-    print("TE1 done")
+
     if hasattr(shared.sd_model, 'text_encoder_2'):
         for name, module in shared.sd_model.text_encoder_2.named_modules():
             weights_backup = getattr(module, "network_weights_backup", None)
             if weights_backup is None or getattr(module, "network_current_names", None) is None:
                 continue
-            module.svdhandler = SVDHandler()
+            module.svdhandler = SVDHandler(maxrank, rank_ratio)
             module.svdhandler.network_name = "lora_te2_" + name.replace(".", "_")
             with devices.inference_context():
                 module.svdhandler.decompose(module.weight, weights_backup)
-            module.svdhandler.findrank(rank, rank_ratio)
 
-    print("TE2 done")
     if hasattr(shared.sd_model, 'unet'):
         for name, module in shared.sd_model.unet.named_modules():
             weights_backup = getattr(module, "network_weights_backup", None)
             if weights_backup is None or getattr(module, "network_current_names", None) is None:
                 continue
-            module.svdhandler = SVDHandler()
+            module.svdhandler = SVDHandler(maxrank, rank_ratio)
             module.svdhandler.network_name = "lora_unet_" + name.replace(".", "_")
             with devices.inference_context():
                 module.svdhandler.decompose(module.weight, weights_backup)
-            module.svdhandler.findrank(rank, rank_ratio)
 
     # if hasattr(shared.sd_model, 'transformer'):  # TODO: Handle quant for Flux
     #     for name, module in shared.sd_model.transformer.named_modules():
@@ -138,55 +137,47 @@ def make_lora(basename, rank, auto_rank, rank_ratio, constant_rank):
 
     submodelname = ['text_encoder', 'text_encoder_2', 'unet', 'transformer']
 
-    if constant_rank:
-        for sub in submodelname:
-            submodel = getattr(shared.sd_model, sub, None)
-            if submodel is not None:
-                for name, module in submodel.named_modules():
-                    if not hasattr(module, "svdhandler"):
-                        continue
-                    rank_overide = max(rank_overide, module.svdhandler.rank)
-    print(f"rank_overide: {rank_overide}")
     lora_state_dict = {}
     for sub in submodelname:
         submodel = getattr(shared.sd_model, sub, None)
         if submodel is not None:
             for name, module in submodel.named_modules():
                 if not hasattr(module, "svdhandler"):
                     continue
-                lora_state_dict.update(module.svdhandler.makeweights(rank_overide))
+                lora_state_dict.update(module.svdhandler.makeweights())
                 del module.svdhandler
 
-    save_file(lora_state_dict, path.join(shared.cmd_opts.lora_dir, basename+".safetensors"))
+    suffix = []
+    if maxrank and auto_rank and rank_ratio != 1:
+        suffix.append(f'maxrank{str(maxrank).replace(".","-")}')
+    else:
+        suffix.append(f'rank{str(maxrank).replace(".","-")}')
+    if auto_rank and rank_ratio != 1:
+        suffix.append(f'autorank{str(rank_ratio).replace(".","-")}')
+    pathstr = str(path.join(shared.cmd_opts.lora_dir, basename+f'_{"_".join(suffix)}.safetensors'))
+    save_file(lora_state_dict, pathstr)
+    shared.log.info(f'LoRA extracted to {pathstr} in {time.time()-t0} seconds')
 
 
 def create_ui():
     def gr_show(visible=True):
         return {"visible": visible, "__type__": "update"}
 
-
-
     with gr.Tab(label="Extract LoRA"):
         with gr.Row():
-            loaded = gr.Textbox(label="Loaded LoRA", interactive=False)
-            # create_refresh_button(loaded, lambda: None, gr.update(value=loaded_lora()), "testid")
+            loaded = gr.Textbox(value="Press refresh to query loaded LoRA", label="Loaded LoRA", interactive=False)
             create_refresh_button(loaded, lambda: None, lambda: {'value': loaded_lora()}, "testid")
         with gr.Row():
-            rank = gr.Number(value=0, label="Optional max rank")
+            rank = gr.Number(value=32, label="Max rank to extract", minimum=1)
         with gr.Row():
             auto_rank = gr.Checkbox(value=False, label="Automatically determine rank")
         with gr.Row(visible=False) as rank_options:
             rank_ratio = gr.Slider(minimum=0, maximum=1, value=1, label="Autorank ratio", visible=True)
-            constant_rank = gr.Checkbox(value=False, label="Constant rank", visible=True)
         with gr.Row():
             basename = gr.Textbox(label="Base name for LoRa")
         with gr.Row():
             extract = gr.Button(value="Extract Lora", variant='primary')
 
     auto_rank.change(fn=lambda x: gr_show(x), inputs=[auto_rank], outputs=[rank_options])
-    # extract.click(
-    #     fn=wrap_gradio_gpu_call(make_lora(basename, rank, auto_rank, rank_ratio, constant_rank),
-    #                             extra_outputs=None), _js='loraextract', inputs=[],
-    #     outputs=[])
-    extract.click(fn=make_lora, inputs=[basename, rank, auto_rank, rank_ratio, constant_rank], outputs=[])
-    # extract.click(fn= lambda: None)
+
+    extract.click(fn=make_lora, inputs=[basename, rank, auto_rank, rank_ratio], outputs=[])