Skip to content

Push-to-talk dictation #22

Description

@KamelGherbi

Salam aleykoum ! 👋

Le problème

J'aimerais dicter mes prompts au lieu de les taper, surtout pour les longs
messages. Là, y'a aucune entrée vocale dans Sinew.

Ce que je propose

  • Tu maintiens la touche Fn (macOS) → Sinew enregistre le micro ; tu relâches →
    ça transcrit.
  • La transcription passe par un moteur déjà configuré (clé API OpenAI dédiée,
    abonnement Google, ou clé OpenRouter) — aucun nouvel identifiant à ajouter.
  • Le texte est inséré dans le composer Sinew, ou collé dans l'app active via un
    Cmd+V simulé si Sinew n'a pas le focus. Toujours copié dans le presse-papier.
  • Historique de dictation local 24h depuis la barre des tâches.
  • Un panneau de réglages (moteur, micro, etc.).

Portée & compromis (j'aimerais ton avis avant de faire la PR)

  • macOS uniquement pour l'instant (surveillance globale de Fn, simulation Cmd+V).
  • Nouvelles dépendances : cpal (audio), block2 (API macOS), directories.
  • Permissions : Micro (Info.plist) + Surveillance des saisies / Accessibilité.
  • Taille : ~2,6k lignes, surtout dans un nouveau src-tauri/src/dictation.rs (~1,4k).
    C'est opt-in, désactivé par défaut.

Implémentation

C'est fonctionnel dans mon fork. Vu la taille et le fait que ce soit macOS-only,
je préfère te demander avant : (1) un truc macOS-only ça passe ? (2) les deps et
permissions c'est ok ? (3) une préférence sur comment l'activer ?

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions