Trois problèmes, trois compromis
Les voice updates ont l'air faciles jusqu'à ce qu'on commence. Trois problèmes sont apparus :
- Latence. Les ingénieurs n'attendent pas 8 secondes une transcription.
- Précision. Les identifiants de code (
useEffect,gRPC) font trébucher tout modèle prêt-à-l'emploi. - Stockage. Un WAV de 90 secondes fait 1,5 Mo. Avec 2 400 équipes, chaque jour, c'est beaucoup de S3.
Ce qu'on a fait
- Whisper en streaming plutôt qu'en batch — les premiers mots arrivent en 200 ms.
- Prompt de glossaire chargé par workspace — a attrapé les identifiants de code.
- Réencodage en Opus + expiration 30 jours — a réduit le stockage 9×.
Et après
Diarisation des locuteurs. Loop suppose pour l'instant une seule voix par update. Pour les updates en binôme, nous voulons attribuer les deux noms automatiquement. Livraison estimée : T3.
RC
par Renzo Castellanos
Staff Engineer, Loop

