Skip to content

Latest commit

 

History

History
129 lines (113 loc) · 18.4 KB

File metadata and controls

129 lines (113 loc) · 18.4 KB

Camera Analysis Pipeline

Этот набор документов описывает roadmap и PR pipeline для нового функционала Анализ картинки с семантическими подсказками.

Цель:

  • превратить текущий camera coach из набора эвристических подсказок в explainable AI-систему;
  • сохранить mobile-first архитектуру;
  • показать технологическую сложность, достаточную для диплома и диссертации;
  • разложить работу на детерминированные PR, которые можно безопасно отдавать разным AI-агентам.

Как читать

Если хочется общего понимания, начинайте с:

Если хочется отдавать работу агентам по частям:

Если хочется перейти к следующему этапу hybrid deterministic + neural:

Если хочется перейти к этапу semantic screen tips:

Главная идея

Для camera analysis v1 нельзя делать ставку только на:

  • набор коротких эвристик;
  • или один черный ящик, который "смотрит на кадр" и сразу пишет текст.

Нужен каскадный pipeline, где:

  • fast low-level сигналы работают локально и часто;
  • semantic critique строится поверх структурированных признаков;
  • explanation всегда восстанавливается до цепочки observation -> interpretation -> recommendation;
  • текущий app UI может показывать эту цепочку через sheet Почему?: verdict/confidence, evidence, semantic action ids, pipeline signals, fallback/assumptions и trace ids;
  • тяжелый reasoning включается в первую очередь в pause;
  • live остается быстрым, стабильным и пригодным для мобильного устройства.

Основные принципы

  • offline-first: базовый путь должен работать локально.
  • cascade-by-cost: самые дорогие вычисления должны запускаться реже.
  • explainability-by-construction: любой совет должен быть обоснован внутренним trace.
  • scene-aware: критика зависит от типа cinematic-сцены.
  • deterministic PR units: каждый PR должен иметь узкие границы и проверяемый DoD.

Ключевые артефакты пакета

Практическая рекомендация

Если цель сейчас перейти к реализации без хаоса, оптимальный порядок такой:

  1. Зафиксировать contracts и доменную модель.
  2. Собрать deterministic critique core без LLM.
  3. Подключить pause expanded analysis.
  4. Перевести live на новую модель hint-ов.
  5. Добавить LLM только как controlled reasoning/text layer.
  6. После этого строить eval и runtime feedback loop.