Интеграция llama.cpp для парсинга сценариев

📋 Обзор

llama.cpp - это C++ библиотека для работы с LLM моделями на iOS. Она поддерживает TinyLlama и другие модели в формате GGUF.

🚀 Шаги интеграции

Шаг 1: Добавить llama.cpp в проект

Вариант A: Через Swift Package Manager (рекомендуется)

Откройте Xcode проект
File → Add Package Dependencies...
Введите URL: https://github.com/ggerganov/llama.cpp
Выберите версию (последняя стабильная)
Добавьте в Target: shafinMultitool

Вариант B: Вручную (если SPM не работает)

Клонируйте репозиторий:

git clone https://github.com/ggerganov/llama.cpp.git
cd llama.cpp

Соберите для iOS:

# Создайте Xcode проект
cmake -B build -DCMAKE_SYSTEM_NAME=iOS -DCMAKE_OSX_ARCHITECTURES=arm64

Добавьте собранную библиотеку в Xcode проект

Шаг 2: Скачать модель TinyLlama в формате GGUF

Перейдите на HuggingFace: https://huggingface.co/TheBloke/TinyLlama-1.1B-Chat-v1.0-GGUF
Скачайте квантизованную версию: tinyllama-1.1b-chat-v1.0.Q4_K_M.gguf (~700MB)
- Q4_K_M - хороший баланс между размером и качеством
- Можно использовать Q8_0 для лучшего качества (больше размер)
Добавьте модель в Xcode проект:
- Перетащите .gguf файл в папку SceneGeneratorModule/Models/
- Убедитесь что "Copy items if needed" отмечено
- Проверьте Target Membership

Шаг 3: Создать Swift обёртку для llama.cpp

Создайте файл SceneGeneratorModule/Services/LlamaCppWrapper.swift:

import Foundation

// Обёртка для C функций llama.cpp
@_cdecl("llama_backend_init")
func llama_backend_init() {
    // Вызов C функции
}

// Добавьте другие необходимые функции
// См. документацию llama.cpp для полного списка API

Шаг 4: Обновить LLMParserService

Раскомментируйте и доработайте код в LLMParserService.swift:

В методе loadModel() - загрузка модели через llama.cpp
В методе generateText() - генерация текста

Шаг 5: Тестирование

Запустите приложение
Введите сложный сценарий
Проверьте что LLM fallback срабатывает при низкой confidence

📝 Примеры использования

Загрузка модели

let modelPath = Bundle.main.path(forResource: "tinyllama-1.1b-chat-v1.0", ofType: "gguf")
// Инициализация через llama.cpp API

Генерация текста

let prompt = "Парси сцену: 2 актёра идут навстречу"
let response = generateText(prompt: prompt)
// Ожидаемый ответ: JSON с распарсенным сценарием

⚠️ Важные замечания

Размер модели: GGUF модель занимает ~700MB-1GB
- Убедитесь что есть место в проекте
- Рассмотрите возможность загрузки модели по требованию
Производительность:
- Первый запуск может быть медленным (загрузка модели)
- Генерация токенов занимает время (зависит от устройства)
Память:
- Модель загружается в RAM
- Убедитесь что устройство имеет достаточно памяти

🔗 Полезные ссылки

llama.cpp репозиторий: https://github.com/ggerganov/llama.cpp
Документация API: https://github.com/ggerganov/llama.cpp/blob/master/llama.h
TinyLlama GGUF модели: https://huggingface.co/TheBloke/TinyLlama-1.1B-Chat-v1.0-GGUF
Примеры интеграции: https://github.com/ggerganov/llama.cpp/tree/master/examples

🎯 Альтернатива: Готовые Swift обёртки

Если интеграция llama.cpp вручную сложна, рассмотрите готовые Swift обёртки:

llama.swift: https://github.com/ggerganov/llama.swift (если есть)
Или используйте серверный API для сложных случаев

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Интеграция llama.cpp для парсинга сценариев

📋 Обзор

🚀 Шаги интеграции

Шаг 1: Добавить llama.cpp в проект

Вариант A: Через Swift Package Manager (рекомендуется)

Вариант B: Вручную (если SPM не работает)

Шаг 2: Скачать модель TinyLlama в формате GGUF

Шаг 3: Создать Swift обёртку для llama.cpp

Шаг 4: Обновить LLMParserService

Шаг 5: Тестирование

📝 Примеры использования

Загрузка модели

Генерация текста

⚠️ Важные замечания

🔗 Полезные ссылки

🎯 Альтернатива: Готовые Swift обёртки

FilesExpand file tree

llama-cpp-integration.md

Latest commit

History

llama-cpp-integration.md

File metadata and controls

Интеграция llama.cpp для парсинга сценариев

📋 Обзор

🚀 Шаги интеграции

Шаг 1: Добавить llama.cpp в проект

Вариант A: Через Swift Package Manager (рекомендуется)

Вариант B: Вручную (если SPM не работает)

Шаг 2: Скачать модель TinyLlama в формате GGUF

Шаг 3: Создать Swift обёртку для llama.cpp

Шаг 4: Обновить LLMParserService

Шаг 5: Тестирование

📝 Примеры использования

Загрузка модели

Генерация текста

⚠️ Важные замечания

🔗 Полезные ссылки

🎯 Альтернатива: Готовые Swift обёртки