From 1d7b423db08e4bc3b8641ebfa1423da7f27f2fe3 Mon Sep 17 00:00:00 2001
From: Sasa Junuzovic <44276455+microsasa@users.noreply.github.com>
Date: Thu, 23 Apr 2026 22:33:56 -0700
Subject: [PATCH 1/3] refactor: convert ModelMetrics, RequestMetrics,
 TokenUsage to frozen dataclasses (#1066)
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

Replace mutable Pydantic BaseModel subclasses with frozen dataclasses
(frozen=True, slots=True) for TokenUsage, RequestMetrics, and
ModelMetrics. These are internal accumulator structs with no Pydantic
validators, making them candidates for plain frozen dataclasses per the
coding guidelines.

Changes:
- TokenUsage, RequestMetrics, ModelMetrics: BaseModel → frozen dataclass
- add_to_model_metrics: returns new ModelMetrics instead of mutating
- copy_model_metrics: uses dataclasses.replace (shallow copy sufficient)
- All 5 call sites updated to capture return value
- Tests updated: model_fields → dataclasses.fields, model_dump → asdict
- Added regression test verifying frozen instances reject mutation
- Updated implementation.md docs to reflect immutable semantics

Co-authored-by: Copilot <223556219+Copilot@users.noreply.github.com>
---
 src/copilot_usage/docs/implementation.md |   6 +-
 src/copilot_usage/models.py              |  57 +++++-----
 src/copilot_usage/parser.py              |   2 +-
 src/copilot_usage/report.py              |   6 +-
 tests/copilot_usage/test_models.py       | 127 ++++++++---------------
 5 files changed, 83 insertions(+), 115 deletions(-)

diff --git a/src/copilot_usage/docs/implementation.md b/src/copilot_usage/docs/implementation.md
index e0e716ce..8677820b 100644
--- a/src/copilot_usage/docs/implementation.md
+++ b/src/copilot_usage/docs/implementation.md
@@ -122,17 +122,17 @@ for idx, sd in fp.all_shutdowns:
 
 ### Model metrics merging
 
-When two shutdowns reference the **same model**, their `ModelMetrics` are summed field-by-field. Accumulation is done **in-place** using `add_to_model_metrics()` and `copy_model_metrics()` (in `models.py`):
+When two shutdowns reference the **same model**, their `ModelMetrics` are summed field-by-field. Because `ModelMetrics` is a frozen dataclass, accumulation returns a **new** instance via `add_to_model_metrics()`:
 
 ```python
 for model_name, mm in sd.modelMetrics.items():
     if model_name in merged_metrics:
-        add_to_model_metrics(merged_metrics[model_name], mm)
+        merged_metrics[model_name] = add_to_model_metrics(merged_metrics[model_name], mm)
     else:
         merged_metrics[model_name] = copy_model_metrics(mm)
 ```
 
-Each model is copied exactly once (on first encounter) and accumulated in-place thereafter, yielding O(M) `copy_model_metrics` calls regardless of the number of shutdown cycles K. When two shutdowns reference **different models**, separate entries are kept in the result dict.
+When two shutdowns reference **different models**, separate entries are kept in the result dict.
 
 ### Model resolution for shutdowns
 
diff --git a/src/copilot_usage/models.py b/src/copilot_usage/models.py
index d8d20f9d..8887c924 100644
--- a/src/copilot_usage/models.py
+++ b/src/copilot_usage/models.py
@@ -6,6 +6,7 @@
 """
 
 import builtins
+import dataclasses
 import math
 from datetime import UTC, datetime
 from enum import StrEnum
@@ -103,7 +104,8 @@ class SessionContext(BaseModel):
     cwd: str | None = None
 
 
-class TokenUsage(BaseModel):
+@dataclasses.dataclass(frozen=True, slots=True)
+class TokenUsage:
     """Token usage breakdown for a single model."""
 
     inputTokens: int = 0
@@ -112,46 +114,47 @@ class TokenUsage(BaseModel):
     cacheWriteTokens: int = 0
 
 
-class RequestMetrics(BaseModel):
+@dataclasses.dataclass(frozen=True, slots=True)
+class RequestMetrics:
     """Request count and cost for a single model."""
 
     count: int = 0
     cost: int = 0
 
 
-class ModelMetrics(BaseModel):
+@dataclasses.dataclass(frozen=True, slots=True)
+class ModelMetrics:
     """Combined request + usage metrics for one model."""
 
-    requests: RequestMetrics = Field(default_factory=RequestMetrics)
-    usage: TokenUsage = Field(default_factory=TokenUsage)
+    requests: RequestMetrics = dataclasses.field(default_factory=RequestMetrics)
+    usage: TokenUsage = dataclasses.field(default_factory=TokenUsage)
 
 
-def add_to_model_metrics(target: ModelMetrics, source: ModelMetrics) -> None:
-    """Add *source* fields into *target* in-place."""
-    target.requests.count += source.requests.count
-    target.requests.cost += source.requests.cost
-    target.usage.inputTokens += source.usage.inputTokens
-    target.usage.outputTokens += source.usage.outputTokens
-    target.usage.cacheReadTokens += source.usage.cacheReadTokens
-    target.usage.cacheWriteTokens += source.usage.cacheWriteTokens
+def add_to_model_metrics(target: ModelMetrics, source: ModelMetrics) -> ModelMetrics:
+    """Return a new ``ModelMetrics`` with *source* fields added to *target*."""
+    return ModelMetrics(
+        requests=RequestMetrics(
+            count=target.requests.count + source.requests.count,
+            cost=target.requests.cost + source.requests.cost,
+        ),
+        usage=TokenUsage(
+            inputTokens=target.usage.inputTokens + source.usage.inputTokens,
+            outputTokens=target.usage.outputTokens + source.usage.outputTokens,
+            cacheReadTokens=target.usage.cacheReadTokens + source.usage.cacheReadTokens,
+            cacheWriteTokens=target.usage.cacheWriteTokens + source.usage.cacheWriteTokens,
+        ),
+    )
 
 
 def copy_model_metrics(mm: ModelMetrics) -> ModelMetrics:
-    """Create an independent copy of *mm* via explicit construction.
+    """Create an independent copy of *mm*.
 
-    Builds new ``ModelMetrics``/``RequestMetrics``/``TokenUsage`` instances
-    instead of using Pydantic's ``model_copy(deep=True)`` which delegates to
-    ``copy.deepcopy`` and is significantly slower for simple int fields.
+    With frozen dataclasses every instance is already immutable, so a
+    shallow ``dataclasses.replace`` (no field overrides) is sufficient —
+    the nested ``RequestMetrics`` and ``TokenUsage`` are themselves frozen
+    and can safely be shared.
     """
-    return ModelMetrics(
-        requests=RequestMetrics(count=mm.requests.count, cost=mm.requests.cost),
-        usage=TokenUsage(
-            inputTokens=mm.usage.inputTokens,
-            outputTokens=mm.usage.outputTokens,
-            cacheReadTokens=mm.usage.cacheReadTokens,
-            cacheWriteTokens=mm.usage.cacheWriteTokens,
-        ),
-    )
+    return dataclasses.replace(mm)
 
 
 def merge_model_metrics(
@@ -162,7 +165,7 @@ def merge_model_metrics(
     result = {name: copy_model_metrics(mm) for name, mm in base.items()}
     for name, mm in additional.items():
         if name in result:
-            add_to_model_metrics(result[name], mm)
+            result[name] = add_to_model_metrics(result[name], mm)
         else:
             result[name] = copy_model_metrics(mm)
     return result
diff --git a/src/copilot_usage/parser.py b/src/copilot_usage/parser.py
index f0ed8f87..ce6128fb 100644
--- a/src/copilot_usage/parser.py
+++ b/src/copilot_usage/parser.py
@@ -920,7 +920,7 @@ def _build_completed_summary(
             all_files_modified.update(sd.codeChanges.filesModified)
         for model_name, mm in sd.modelMetrics.items():
             if model_name in merged_metrics:
-                add_to_model_metrics(merged_metrics[model_name], mm)
+                merged_metrics[model_name] = add_to_model_metrics(merged_metrics[model_name], mm)
             else:
                 merged_metrics[model_name] = copy_model_metrics(mm)
         shutdown_cycles.append(
diff --git a/src/copilot_usage/report.py b/src/copilot_usage/report.py
index 809e2141..2cae1611 100644
--- a/src/copilot_usage/report.py
+++ b/src/copilot_usage/report.py
@@ -262,14 +262,14 @@ def _aggregate_model_metrics(
 ) -> dict[str, ModelMetrics]:
     """Merge model metrics across all sessions into a single dict.
 
-    Accumulates in-place so each unique model name is copied at most once,
-    reducing copy overhead from O(n × m) to O(m).
+    Each unique model name produces a single accumulated ``ModelMetrics``
+    instance via immutable addition.
     """
     result: dict[str, ModelMetrics] = {}
     for s in sessions:
         for model_name, mm in s.model_metrics.items():
             if model_name in result:
-                add_to_model_metrics(result[model_name], mm)
+                result[model_name] = add_to_model_metrics(result[model_name], mm)
             else:
                 result[model_name] = copy_model_metrics(mm)
     return result
diff --git a/tests/copilot_usage/test_models.py b/tests/copilot_usage/test_models.py
index 26ae3546..991b0dda 100644
--- a/tests/copilot_usage/test_models.py
+++ b/tests/copilot_usage/test_models.py
@@ -1,5 +1,6 @@
-"""Tests for copilot_usage.models — Pydantic v2 event parsing."""
+"""Tests for copilot_usage.models — event parsing and metric helpers."""
 
+import dataclasses
 import json
 from datetime import UTC, datetime
 from unittest.mock import patch
@@ -463,18 +464,17 @@ class TestAddToModelMetrics:
     """Unit tests for the add_to_model_metrics helper."""
 
     def test_all_fields_accumulated(self) -> None:
-        # Assign distinct values per field so mis-mapped fields will fail the test.
-        target_requests_kwargs = {
-            name: idx + 1 for idx, name in enumerate(RequestMetrics.model_fields)
-        }
+        """Every field from both operands is summed in the result."""
+        req_fields = [f.name for f in dataclasses.fields(RequestMetrics)]
+        usage_fields = [f.name for f in dataclasses.fields(TokenUsage)]
+
+        target_requests_kwargs = {name: idx + 1 for idx, name in enumerate(req_fields)}
         source_requests_kwargs = {
-            name: (idx + 1) * 10 for idx, name in enumerate(RequestMetrics.model_fields)
-        }
-        target_usage_kwargs = {
-            name: idx + 100 for idx, name in enumerate(TokenUsage.model_fields)
+            name: (idx + 1) * 10 for idx, name in enumerate(req_fields)
         }
+        target_usage_kwargs = {name: idx + 100 for idx, name in enumerate(usage_fields)}
         source_usage_kwargs = {
-            name: (idx + 1) * 1000 for idx, name in enumerate(TokenUsage.model_fields)
+            name: (idx + 1) * 1000 for idx, name in enumerate(usage_fields)
         }
 
         target = ModelMetrics(
@@ -486,21 +486,22 @@ def test_all_fields_accumulated(self) -> None:
             usage=TokenUsage(**source_usage_kwargs),
         )
 
-        add_to_model_metrics(target, source)
+        result = add_to_model_metrics(target, source)
 
         expected_requests = {
             name: target_requests_kwargs[name] + source_requests_kwargs[name]
-            for name in RequestMetrics.model_fields
+            for name in req_fields
         }
         expected_usage = {
             name: target_usage_kwargs[name] + source_usage_kwargs[name]
-            for name in TokenUsage.model_fields
+            for name in usage_fields
         }
 
-        assert target.requests.model_dump() == expected_requests
-        assert target.usage.model_dump() == expected_usage
+        assert dataclasses.asdict(result.requests) == expected_requests
+        assert dataclasses.asdict(result.usage) == expected_usage
 
     def test_zero_source_is_identity(self) -> None:
+        """Adding a default (zero) source returns an equal value."""
         target = ModelMetrics(
             requests=RequestMetrics(count=5, cost=3),
             usage=TokenUsage(
@@ -510,30 +511,32 @@ def test_zero_source_is_identity(self) -> None:
                 cacheWriteTokens=5,
             ),
         )
-        before = target.model_dump()
-        add_to_model_metrics(target, ModelMetrics())
-        assert target.model_dump() == before
+        result = add_to_model_metrics(target, ModelMetrics())
+        assert dataclasses.asdict(result) == dataclasses.asdict(target)
 
-    def test_source_not_mutated(self) -> None:
+    def test_neither_operand_mutated(self) -> None:
+        """add_to_model_metrics must not modify *target* or *source*."""
         target = ModelMetrics(requests=RequestMetrics(count=1))
         source = ModelMetrics(requests=RequestMetrics(count=5))
-        source_before = source.model_dump()
+        target_before = dataclasses.asdict(target)
+        source_before = dataclasses.asdict(source)
         add_to_model_metrics(target, source)
-        assert source.model_dump() == source_before  # source unchanged
+        assert dataclasses.asdict(target) == target_before
+        assert dataclasses.asdict(source) == source_before
 
     def test_accumulates_incrementally(self) -> None:
         """Multiple sequential calls accumulate correctly."""
-        target = ModelMetrics()
+        acc = ModelMetrics()
         for _ in range(3):
-            add_to_model_metrics(
-                target,
+            acc = add_to_model_metrics(
+                acc,
                 ModelMetrics(
                     requests=RequestMetrics(count=2),
                     usage=TokenUsage(outputTokens=10),
                 ),
             )
-        assert target.requests.count == 6
-        assert target.usage.outputTokens == 30
+        assert acc.requests.count == 6
+        assert acc.usage.outputTokens == 30
 
 
 # ---------------------------------------------------------------------------
@@ -546,63 +549,34 @@ class TestCopyModelMetrics:
 
     def test_returns_equal_value(self) -> None:
         """All fields are faithfully copied, including any future additions."""
-        # Build kwargs with non-default values for every field so newly-added
-        # fields are automatically covered by the model_dump() comparison.
-        req_kwargs = {
-            name: idx + 1 for idx, name in enumerate(RequestMetrics.model_fields)
-        }
-        usage_kwargs = {
-            name: (idx + 1) * 100 for idx, name in enumerate(TokenUsage.model_fields)
-        }
+        req_fields = [f.name for f in dataclasses.fields(RequestMetrics)]
+        usage_fields = [f.name for f in dataclasses.fields(TokenUsage)]
+        req_kwargs = {name: idx + 1 for idx, name in enumerate(req_fields)}
+        usage_kwargs = {name: (idx + 1) * 100 for idx, name in enumerate(usage_fields)}
         mm = ModelMetrics(
             requests=RequestMetrics(**req_kwargs),
             usage=TokenUsage(**usage_kwargs),
         )
         result = copy_model_metrics(mm)
-        assert result.model_dump() == mm.model_dump()
+        assert dataclasses.asdict(result) == dataclasses.asdict(mm)
 
-    def test_requests_copy_is_independent(self) -> None:
-        """Mutating the copy's requests must not affect the original."""
+    def test_copy_is_distinct_object(self) -> None:
+        """The copy must be a new object, not the same reference."""
         mm = ModelMetrics(requests=RequestMetrics(count=5, cost=3))
         copy = copy_model_metrics(mm)
-        copy.requests.count = 999
-        copy.requests.cost = 888
-        assert mm.requests.count == 5
-        assert mm.requests.cost == 3
+        assert copy is not mm
 
-    def test_usage_copy_is_independent(self) -> None:
-        """Mutating the copy's usage must not affect the original."""
-        mm = ModelMetrics(
-            usage=TokenUsage(
-                inputTokens=100,
-                outputTokens=50,
-                cacheReadTokens=20,
-                cacheWriteTokens=10,
-            ),
-        )
-        copy = copy_model_metrics(mm)
-        copy.usage.inputTokens = 999
-        copy.usage.outputTokens = 888
-        copy.usage.cacheReadTokens = 777
-        copy.usage.cacheWriteTokens = 666
-        assert mm.usage.inputTokens == 100
-        assert mm.usage.outputTokens == 50
-        assert mm.usage.cacheReadTokens == 20
-        assert mm.usage.cacheWriteTokens == 10
-
-    def test_original_is_independent_of_copy_mutations(self) -> None:
-        """Mutating the original must not affect the copy."""
+    def test_frozen_prevents_mutation(self) -> None:
+        """Frozen dataclasses reject attribute assignment at runtime."""
         mm = ModelMetrics(requests=RequestMetrics(count=5))
-        copy = copy_model_metrics(mm)
-        mm.requests.count = 999
-        assert copy.requests.count == 5
+        with pytest.raises(dataclasses.FrozenInstanceError):
+            mm.requests = RequestMetrics(count=999)  # type: ignore[misc]
 
     def test_defaults_copied_correctly(self) -> None:
         """Default (zero) values are preserved in the copy for all fields."""
         mm = ModelMetrics()
         copy = copy_model_metrics(mm)
-        # Ensure *all* default values (including any future fields) are preserved
-        assert copy.model_dump() == mm.model_dump()
+        assert dataclasses.asdict(copy) == dataclasses.asdict(mm)
 
 
 # ---------------------------------------------------------------------------
@@ -728,19 +702,10 @@ def test_no_deep_copy_regression(self) -> None:
             )
         }
 
-        with (
-            patch.object(
-                ModelMetrics,
-                "model_copy",
-                side_effect=AssertionError(
-                    "merge_model_metrics must not call model_copy"
-                ),
-            ),
-            patch(
-                "copy.deepcopy",
-                side_effect=AssertionError(
-                    "merge_model_metrics must not call copy.deepcopy"
-                ),
+        with patch(
+            "copy.deepcopy",
+            side_effect=AssertionError(
+                "merge_model_metrics must not call copy.deepcopy"
             ),
         ):
             result = merge_model_metrics(base, additional)

From 8f500d6d873a386f43fed90a6a5b54d01c190264 Mon Sep 17 00:00:00 2001
From: Sasa Junuzovic <44276455+microsasa@users.noreply.github.com>
Date: Thu, 23 Apr 2026 22:49:04 -0700
Subject: [PATCH 2/3] fix: resolve CI failures (ruff format + dataclass API
 migration)

- Fix ruff format violations: break long lines in models.py and parser.py
- Fix test_report.py: replace model_dump() with dataclasses.asdict() for
  ModelMetrics which is now a frozen dataclass

Co-authored-by: Copilot <223556219+Copilot@users.noreply.github.com>
---
 src/copilot_usage/models.py        | 3 ++-
 src/copilot_usage/parser.py        | 4 +++-
 tests/copilot_usage/test_report.py | 3 ++-
 3 files changed, 7 insertions(+), 3 deletions(-)

diff --git a/src/copilot_usage/models.py b/src/copilot_usage/models.py
index 8887c924..a9b6c57d 100644
--- a/src/copilot_usage/models.py
+++ b/src/copilot_usage/models.py
@@ -141,7 +141,8 @@ def add_to_model_metrics(target: ModelMetrics, source: ModelMetrics) -> ModelMet
             inputTokens=target.usage.inputTokens + source.usage.inputTokens,
             outputTokens=target.usage.outputTokens + source.usage.outputTokens,
             cacheReadTokens=target.usage.cacheReadTokens + source.usage.cacheReadTokens,
-            cacheWriteTokens=target.usage.cacheWriteTokens + source.usage.cacheWriteTokens,
+            cacheWriteTokens=target.usage.cacheWriteTokens
+            + source.usage.cacheWriteTokens,
         ),
     )
 
diff --git a/src/copilot_usage/parser.py b/src/copilot_usage/parser.py
index ce6128fb..0dbeeeb4 100644
--- a/src/copilot_usage/parser.py
+++ b/src/copilot_usage/parser.py
@@ -920,7 +920,9 @@ def _build_completed_summary(
             all_files_modified.update(sd.codeChanges.filesModified)
         for model_name, mm in sd.modelMetrics.items():
             if model_name in merged_metrics:
-                merged_metrics[model_name] = add_to_model_metrics(merged_metrics[model_name], mm)
+                merged_metrics[model_name] = add_to_model_metrics(
+                    merged_metrics[model_name], mm
+                )
             else:
                 merged_metrics[model_name] = copy_model_metrics(mm)
         shutdown_cycles.append(
diff --git a/tests/copilot_usage/test_report.py b/tests/copilot_usage/test_report.py
index b5ecb7d6..12e2e066 100644
--- a/tests/copilot_usage/test_report.py
+++ b/tests/copilot_usage/test_report.py
@@ -2,6 +2,7 @@
 
 # pyright: reportPrivateUsage=false
 
+import dataclasses
 import json
 import re
 import warnings
@@ -5720,7 +5721,7 @@ def test_identical_field_values(self) -> None:
             m = merged[model_name]
             a = aggregated[model_name]
             # Compare full ModelMetrics contents to catch any future field additions
-            assert m.model_dump() == a.model_dump()
+            assert dataclasses.asdict(m) == dataclasses.asdict(a)
 
 
 # ---------------------------------------------------------------------------

From 3c80ec21b40a7c09d1c4b11194673a8753115df9 Mon Sep 17 00:00:00 2001
From: Sasa Junuzovic <44276455+microsasa@users.noreply.github.com>
Date: Thu, 23 Apr 2026 22:57:48 -0700
Subject: [PATCH 3/3] fix: address review comments

- models.py: Reword copy_model_metrics docstring from 'independent copy'
  to 'shallow copy' and clarify nested references are shared
- report.py: Clarify _aggregate_model_metrics docstring to note
  intermediate instances during immutable accumulation

Co-authored-by: Copilot <223556219+Copilot@users.noreply.github.com>
---
 src/copilot_usage/models.py | 6 +++---
 src/copilot_usage/report.py | 5 +++--
 2 files changed, 6 insertions(+), 5 deletions(-)

diff --git a/src/copilot_usage/models.py b/src/copilot_usage/models.py
index a9b6c57d..c6f7f88c 100644
--- a/src/copilot_usage/models.py
+++ b/src/copilot_usage/models.py
@@ -148,12 +148,12 @@ def add_to_model_metrics(target: ModelMetrics, source: ModelMetrics) -> ModelMet
 
 
 def copy_model_metrics(mm: ModelMetrics) -> ModelMetrics:
-    """Create an independent copy of *mm*.
+    """Create a shallow copy of *mm*.
 
     With frozen dataclasses every instance is already immutable, so a
     shallow ``dataclasses.replace`` (no field overrides) is sufficient —
-    the nested ``RequestMetrics`` and ``TokenUsage`` are themselves frozen
-    and can safely be shared.
+    the nested ``RequestMetrics`` and ``TokenUsage`` references are shared,
+    which is safe because they are themselves frozen.
     """
     return dataclasses.replace(mm)
 
diff --git a/src/copilot_usage/report.py b/src/copilot_usage/report.py
index 2cae1611..dc6ca6b5 100644
--- a/src/copilot_usage/report.py
+++ b/src/copilot_usage/report.py
@@ -262,8 +262,9 @@ def _aggregate_model_metrics(
 ) -> dict[str, ModelMetrics]:
     """Merge model metrics across all sessions into a single dict.
 
-    Each unique model name produces a single accumulated ``ModelMetrics``
-    instance via immutable addition.
+    The returned dict contains one final accumulated ``ModelMetrics``
+    value per unique model name. Accumulation uses immutable addition,
+    so intermediate merged instances may be created while aggregating.
     """
     result: dict[str, ModelMetrics] = {}
     for s in sessions: