Meeting Transcriber
Sistema local de transcrição de reuniões com identificação automática de falantes, 100% offline, para macOS com Apple Silicon.
O problema
Transcrever reuniões com múltiplos participantes exige não só reconhecimento de fala, mas identificação de quem falou o quê — a chamada diarização. Serviços em nuvem resolvem isso, mas enviam áudio sensível para servidores externos. Em contextos médicos e institucionais, isso é inaceitável.
A solução
Meeting Transcriber é um sistema 100% local para macOS com Apple Silicon (M1–M4). Após o download inicial dos modelos, tudo roda offline — nenhum áudio sai da máquina.
Ideal para reuniões de equipe, aulas e apresentações, áudios de WhatsApp e podcasts.
Três modos de operação
| Modo | Backend | Diarização | Uso ideal |
|---|---|---|---|
| Fast | MLX (Apple Silicon otimizado) | Não | Transcrições rápidas sem identificação de falantes |
| Meeting | Whisper large-v3 + pyannote.audio | Sim | Reuniões com múltiplos participantes (padrão) |
| Precise | IBM Granite 8B (~16GB RAM) | Sim | Máxima precisão em transcrições críticas |
Funcionalidades
- 8 formatos de áudio (mp3, wav, m4a, opus, flac, ogg, webm, aac)
- Português e inglês com detecção automática
- Vocabulário customizável para termos técnicos (médicos, jurídicos, etc.)
- Output em JSON, TXT e Markdown
- CLI bilíngue (pt/en)
- Notificação macOS ao concluir
- Integração com HuggingFace para modelos gated (pyannote requer aceite de termos)
Qualidade de código
148 testes automatizados passando. Arquitetura de backends intercambiáveis — cada modo de operação é um módulo independente, facilitando extensão futura.
Aprendizados
Esse projeto foi onde aprendi integração com HuggingFace (tokens, modelos gated), arquitetura de backends intercambiáveis e testes automatizados com pytest.