AllenCell · saeliddp · Feb 24, 2024 · Feb 15, 2024 · Feb 15, 2024 · Feb 16, 2024
@@ -39,6 +39,7 @@ project =
     hydra-core==1.3.2
     aicsimageio
     tifffile>=2023.4.12
+    watchdog
 
 # testing and linting requirements
 test_lint =

@@ -0,0 +1,36 @@
+from allencell_ml_segmenter.core.progress_tracker import ProgressTracker
+import pytest
+
+
+def test_set_progress_within_bounds():
+    tracker: ProgressTracker = ProgressTracker(
+        progress_minimum=0, progress_maximum=10
+    )
+    tracker.set_progress(2)
+    assert tracker.get_progress() == 2
+    tracker.set_progress(9)
+    assert tracker.get_progress() == 9
+    tracker.set_progress(0)
+    assert tracker.get_progress() == 0
+    tracker.set_progress(10)
+    assert tracker.get_progress() == 10
+
+
+def test_set_progress_greater_than_max():
+    tracker: ProgressTracker = ProgressTracker(
+        progress_minimum=0, progress_maximum=10
+    )
+    with pytest.raises(ValueError):
+        tracker.set_progress(11)
+    with pytest.raises(ValueError):
+        tracker.set_progress(10394)
+
+
+def test_set_progress_less_than_min():
+    tracker: ProgressTracker = ProgressTracker(
+        progress_minimum=0, progress_maximum=10
+    )
+    with pytest.raises(ValueError):
+        tracker.set_progress(-1)
+    with pytest.raises(ValueError):
+        tracker.set_progress(-1948)
@@ -0,0 +1 @@
+,epoch,fake1,fake2
@@ -0,0 +1,4 @@
+,epoch,fake1,fake2
+0,0,1,2
+0,1,1,2
+0,2,1,2
@@ -94,3 +94,75 @@ def test_get_train_config_path() -> None:
 
     # Act / Assert
     assert model.get_train_config_path("test_experiment") == expected
+
+
+def test_get_csv_path() -> None:
+    # Arrange
+    user_experiments_path = Path(__file__).parent / "experiments_home"
+    config = FakeUserSettings(
+        cyto_dl_home_path=Path(__file__).parent / "cyto_dl_home",
+        user_experiments_path=user_experiments_path,
+    )
+    model = ExperimentsModel(config)
+    model.set_experiment_name("0_exp")
+    expected = user_experiments_path / "0_exp" / "data"
+
+    # Act / Assert
+    assert model.get_csv_path() == expected
+
+
+def test_get_metrics_csv_path() -> None:
+    # Arrange
+    user_experiments_path = Path(__file__).parent / "experiments_home"
+    config = FakeUserSettings(
+        cyto_dl_home_path=Path(__file__).parent / "cyto_dl_home",
+        user_experiments_path=user_experiments_path,
+    )
+    model = ExperimentsModel(config)
+    model.set_experiment_name("0_exp")
+    expected = user_experiments_path / "0_exp" / "csv"
+
+    # Act / Assert
+    assert model.get_metrics_csv_path() == expected
+
+
+def test_get_latest_metrics_csv_version_no_versions() -> None:
+    # Arrange
+    user_experiments_path = Path(__file__).parent / "experiments_home"
+    config = FakeUserSettings(
+        cyto_dl_home_path=Path(__file__).parent / "cyto_dl_home",
+        user_experiments_path=user_experiments_path,
+    )
+    model = ExperimentsModel(config)
+    model.set_experiment_name("0_exp")
+
+    # Act / Assert
+    assert model.get_latest_metrics_csv_version() == -1
+
+
+def test_get_latest_metrics_csv_version_no_directory() -> None:
+    # Arrange
+    user_experiments_path = Path(__file__).parent / "experiments_home"
+    config = FakeUserSettings(
+        cyto_dl_home_path=Path(__file__).parent / "cyto_dl_home",
+        user_experiments_path=user_experiments_path,
+    )
+    model = ExperimentsModel(config)
+    model.set_experiment_name("2_exp")
+
+    # Act / Assert
+    assert model.get_latest_metrics_csv_version() == -1
+
+
+def test_get_latest_metrics_csv_version_version_1() -> None:
+    # Arrange
+    user_experiments_path = Path(__file__).parent / "experiments_home"
+    config = FakeUserSettings(
+        cyto_dl_home_path=Path(__file__).parent / "cyto_dl_home",
+        user_experiments_path=user_experiments_path,
+    )
+    model = ExperimentsModel(config)
+    model.set_experiment_name("1_exp")
+
+    # Act / Assert
+    assert model.get_latest_metrics_csv_version() == 1
@@ -0,0 +1,66 @@
+from pathlib import Path
+import allencell_ml_segmenter
+from allencell_ml_segmenter.training.metrics_csv_event_handler import (
+    MetricsCSVEventHandler,
+)
+from unittest.mock import Mock
+
+
+def test_csv_2_epochs():
+    callback_mock: Mock = Mock()
+    test_csv_path: Path = (
+        Path(allencell_ml_segmenter.__file__).parent
+        / "_tests"
+        / "main"
+        / "experiments_home"
+        / "1_exp"
+        / "csv"
+        / "version_1"
+        / "test_metrics_csv_2_epochs.csv"
+    )
+    handler: MetricsCSVEventHandler = MetricsCSVEventHandler(
+        test_csv_path, callback_mock
+    )
+    fs_event_mock: Mock = Mock(src_path=test_csv_path)
+    handler.on_any_event(fs_event_mock)
+    callback_mock.assert_called_with(2)
+
+
+def test_empty_csv():
+    callback_mock: Mock = Mock()
+    test_csv_path: Path = (
+        Path(allencell_ml_segmenter.__file__).parent
+        / "_tests"
+        / "main"
+        / "experiments_home"
+        / "1_exp"
+        / "csv"
+        / "version_0"
+        / "test_metrics_csv_empty.csv"
+    )
+    handler: MetricsCSVEventHandler = MetricsCSVEventHandler(
+        test_csv_path, callback_mock
+    )
+    fs_event_mock: Mock = Mock(src_path=test_csv_path)
+    handler.on_any_event(fs_event_mock)
+    callback_mock.assert_called_with(0)
+
+
+def test_nonexistent_csv():
+    callback_mock: Mock = Mock()
+    test_csv_path: Path = (
+        Path(allencell_ml_segmenter.__file__).parent
+        / "_tests"
+        / "main"
+        / "experiments_home"
+        / "0_exp"
+        / "csv"
+        / "version_0"
+        / "test_metrics_does_not_exist.csv"
+    )
+    handler: MetricsCSVEventHandler = MetricsCSVEventHandler(
+        test_csv_path, callback_mock
+    )
+    fs_event_mock: Mock = Mock(src_path=test_csv_path)
+    handler.on_any_event(fs_event_mock)
+    callback_mock.assert_not_called()
@@ -0,0 +1,56 @@
+from abc import abstractmethod
+
+
+class ProgressTracker:
+    """
+    Base class for all ProgressTrackers to inherit from. A ProgressTracker
+    maintains an integer measure of progress between progress_minimum and
+    progress_maximum. The progress value can be used by PyQt progress bars
+    for example.
+    """
+
+    def __init__(self, progress_minimum: int = 0, progress_maximum: int = 0):
+        self._progress_minimum: int = progress_minimum
+        self._progress_maximum: int = progress_maximum
+        self._progress: int = progress_minimum
+
+    def get_progress_minimum(self) -> int:
+        return self._progress_minimum
+
+    def get_progress_maximum(self) -> int:
+        return self._progress_maximum
+
+    def get_progress(self) -> int:
+        return self._progress
+
+    def set_progress(self, progress: int) -> None:
+        """
+        If param progress > progress_maximum, throws ValueError.
+        If param progress < progress minimum, throws ValueError.
+        Otherwise sets this trackers progress to param progress.
+        """
+        if progress > self._progress_maximum:
+            raise ValueError(
+                "cannot set progress to value greater than progress_maximum"
+            )
+        if progress < self._progress_minimum:
+            raise ValueError(
+                "cannot set progress to value less than progress_minimum"
+            )
+
+        self._progress = progress
+
+    @abstractmethod
+    def start_tracker(self) -> None:
+        """
+        Enables updates to the progress measure from another thread.
+        """
+        pass
+
+    @abstractmethod
+    def stop_tracker(self) -> None:
+        """
+        Stops any threads that may be active for progress updates.
+        Must be called before losing reference to the instance of the ProgressTracker.
+        """
+        pass
@@ -3,27 +3,42 @@
 from PyQt5.QtCore import Qt, QThread, pyqtSignal
 
 from allencell_ml_segmenter.core.subscriber import Subscriber
+from allencell_ml_segmenter.core.progress_tracker import ProgressTracker
 
 
 class ViewMeta(type(QWidget), type(Subscriber)):
     pass
 
 
 class LongTaskThread(QThread):
-    taskProgress = pyqtSignal(int)
 
     def __init__(self, do_work: callable, parent=None):
-        super(LongTaskThread, self).__init__(parent)
+        super().__init__(parent)
         self._do_work = do_work
 
+    # override
     def run(self):
         print("running")
-        # time.sleep(5)
         self._do_work()
 
-        # for i in range(1, 101):
-        # self.taskProgress.emit(i)
-        # self.msleep(100)  # Simulating some work
+
+class ProgressThread(QThread):
+    # pyqtSignal must be class attribute
+    # https://www.riverbankcomputing.com/static/Docs/PyQt5/signals_slots.html#defining-new-signals-with-pyqtsignal
+    task_progress: pyqtSignal = pyqtSignal(int)
+
+    def __init__(self, progress_tracker: ProgressTracker, parent=None):
+        super().__init__(parent)
+        self._progress_tracker: ProgressTracker = progress_tracker
+
+    # override
+    def run(self):
+        while (
+            self._progress_tracker.get_progress()
+            < self._progress_tracker.get_progress_maximum()
+        ):
+            self.task_progress.emit(self._progress_tracker.get_progress())
+            self.msleep(100)
 
 
 class View(QWidget, Subscriber, metaclass=ViewMeta):
@@ -36,7 +51,46 @@ class View(QWidget, Subscriber, metaclass=ViewMeta):
     def __init__(self):
         QWidget.__init__(self)
 
-    def startLongTask(self):
+    def startLongTaskWithProgressBar(
+        self, progress_tracker: ProgressTracker
+    ) -> None:
+        self.longTaskThread = LongTaskThread(do_work=self.doWork)
+        self.progressThread = ProgressThread(progress_tracker)
+
+        self.progressDialog = QProgressDialog(
+            f"{self.getTypeOfWork()} in Progress",
+            "Cancel",
+            progress_tracker.get_progress_minimum(),
+            progress_tracker.get_progress_maximum(),
+            self,
+        )
+        self.progressDialog.setWindowTitle(f"{self.getTypeOfWork()} Progress")
+        self.progressDialog.setWindowModality(Qt.ApplicationModal)
+        self.progressDialog.canceled.connect(self.longTaskThread.terminate)
+        self.progressDialog.canceled.connect(self.progressThread.terminate)
+        # stop the watchdog thread for file watching inside of the progress tracker
+        self.progressDialog.canceled.connect(progress_tracker.stop_tracker)
+
+        self.progressDialog.show()
+
+        self.longTaskThread.finished.connect(self.progressDialog.reset)
+        self.longTaskThread.finished.connect(self.longTaskThread.deleteLater)
+        self.longTaskThread.finished.connect(self.progressDialog.close)
+        self.longTaskThread.finished.connect(self.showResults)
+
+        # progressThread's task_progress.emit now calls updateProgress
+        self.progressThread.task_progress.connect(self.updateProgress)
+        # if the longTaskThread or the progressThread finishes, we no longer
+        # need to update progress, so we should stop the progress tracker
+        self.progressThread.finished.connect(progress_tracker.stop_tracker)
+        self.longTaskThread.finished.connect(progress_tracker.stop_tracker)
+
+        progress_tracker.start_tracker()
+        self.progressThread.start()
+        self.longTaskThread.start()
+
+    # will remove once prediction is also ported to progress bar
+    def startLongTask(self) -> None:
         self.longTaskThread = LongTaskThread(do_work=self.doWork)
         self.progressDialog = QProgressDialog(
             f"{self.getTypeOfWork()} in Progress", "Cancel", 0, 0, self
@@ -58,7 +112,7 @@ def startLongTask(self):
     def showResults(self):
         pass
 
-    def updateProgress(self, value):
+    def updateProgress(self, value: int) -> None:
         self.progressDialog.setValue(value)
 
     @abstractmethod

@@ -124,6 +124,34 @@ def get_csv_path(self) -> Path:
             / "data"
         )
 
+    def get_metrics_csv_path(self) -> Path:
+        return (
+            self.get_user_experiments_path()
+            / self.get_experiment_name()
+            / "csv"
+        )
+
+    def get_latest_metrics_csv_version(self) -> int:
+        """
+        Returns version number of the most recent version directory within
+        the cyto-dl CSV folder (self._csv_path) or -1 if no version directories
+        exist
+        """
+        last_version: int = -1
+        if self.get_metrics_csv_path().exists():
+            for child in self.get_metrics_csv_path().glob("version_*"):
+                if child.is_dir():
+                    version_str: str = child.name.split("_")[-1]
+                    try:
+                        last_version = (
+                            int(version_str)
+                            if int(version_str) > last_version
+                            else last_version
+                        )
+                    except ValueError:
+                        continue
+        return last_version
+
     def get_train_config_path(self, experiment_name: str) -> Path:
         return (
             self.get_user_experiments_path()