Scripta API
Scripta è un sistema automatico di speech recognition basato su modelli di Machine Learning. Ricevuto un audio, Scripta:
- identifica le regioni audio contenenti speech;
- riconosce gli speaker coinvolti nella conversazione, assegnandogli un ID univoco all'interno dell'intero audio;
- trascrive l'audio di ogni regione.
Il sistema supporta due modalità di utilizzo:
- Offline: l'utente carica un file audio intero e ne richiede il processamento.
- Streaming: l'utente manda un stream audio e riceve a sua volta il processamento in modalità streaming (attualmente, il riconoscimento degli speaker non è supportato).
info
Non sono attualmente disponibili librerie client per interfacciarsi a Scripta. Le interazioni avvengono tramite chiamate HTTP e WebSockets.
Formati Audio Supportati
Scripta supporta i seguenti formati audio:
- wav
- flac
- opus
- pcm
tip
Per ottenere la massima qualità di trascrizione, consigliamo di inviare file audio con sample rate di almeno 16 kHz.
Lingue Supportate
Il sistema attualmente supporta solo la lingua Italiana.