Três problemas, três trade-offs
Voice updates parecem fáceis até começares. Três problemas saltaram à vista:
- Latência. Os engenheiros não esperam 8 segundos por uma transcrição.
- Precisão. Identificadores de código (
useEffect,gRPC) fazem tropeçar qualquer modelo off-the-shelf. - Storage. Um WAV de 90 segundos são 1,5 MB. Com 2.400 equipas, diariamente, é muito S3.
O que fizemos
- Whisper em streaming em vez de batch — as primeiras palavras aparecem em 200ms.
- Prompt de glossário carregado por workspace — apanhou os identificadores de código.
- Re-encode para Opus + expiração a 30 dias — cortou storage 9×.
O que vem aí
Diarização de falantes. Agora o Loop assume uma voz por update. Para updates em par queremos atribuir os dois nomes automaticamente. Ship estimado: Q3.
RC
por Renzo Castellanos
Staff Engineer, Loop

