Voix-vers-digest : notes de release

Trois problèmes, trois compromis

Les voice updates ont l'air faciles jusqu'à ce qu'on commence. Trois problèmes sont apparus :

Latence. Les ingénieurs n'attendent pas 8 secondes une transcription.
Précision. Les identifiants de code (useEffect, gRPC) font trébucher tout modèle prêt-à-l'emploi.
Stockage. Un WAV de 90 secondes fait 1,5 Mo. Avec 2 400 équipes, chaque jour, c'est beaucoup de S3.

Ce qu'on a fait

Whisper en streaming plutôt qu'en batch — les premiers mots arrivent en 200 ms.
Prompt de glossaire chargé par workspace — a attrapé les identifiants de code.
Réencodage en Opus + expiration 30 jours — a réduit le stockage 9×.

Et après

Diarisation des locuteurs. Loop suppose pour l'instant une seule voix par update. Pour les updates en binôme, nous voulons attribuer les deux noms automatiquement. Livraison estimée : T3.

par Renzo Castellanos

Staff Engineer, Loop

PrécédentLa fin du standup Suivant Ce qu'on a appris en utilisant Loop sur Loop

Voix-vers-digest : notes de release

Trois problèmes, trois compromis

Ce qu'on a fait

Et après

À lire aussi · Loop

Comment écrire un update standup que les gens lisent vraiment

Voix-vers-digest : notes de release

Trois problèmes, trois compromis

Ce qu'on a fait

Et après

À lire aussi · Loop

Comment écrire un update standup que les gens lisent vraiment