user-23xyz

Sabowsla user-23xyz

Achievements

flutter_appcenter_bundle flutter_appcenter_bundle Public

Forked from hanabi1224/flutter_appcenter_bundle

C++ 1
maestro_install maestro_install Public

JavaScript 1
ffmpeg-kit ffmpeg-kit Public

C
multi-turboquant multi-turboquant Public

Forked from rookiemann/multi-turboquant

Unified KV cache compression for LLM inference — TurboQuant, IsoQuant, PlanarQuant, TriAttention. 10 methods, GPU-validated, multi-GPU planner. Compress KV cache 5-80x to run bigger models, longer …

Python
rotorquant rotorquant Public

Forked from scrya-com/rotorquant

KV cache compression via block-diagonal rotation. Beats TurboQuant: better PPL (6.91 vs 7.07), 28% faster decode, 5.3x faster prefill, 44x fewer params. Drop-in llama.cpp integration.

Python
turboquant_plus turboquant_plus Public

Forked from TheTom/turboquant_plus

Python