Scripta API
Scripta è un sistema automatico di speech recognition basato su modelli di Machine Learning. Ricevuto un audio, Scripta:
- identifica le regioni audio contenenti speech;
- riconosce gli speaker coinvolti nella conversazione, assegnandogli un ID univoco all'interno dell'intero audio;
- trascrive l'audio di ogni regione.
info
Non sono attualmente disponibili librerie client per interfacciarsi a Scripta. Le interazioni avvengono tramite chiamate HTTP.
Formati Audio Supportati
Scripta supporta i seguenti formati audio:
- wav
- flac
- mp3
- m4a
- aac
- webm
- opus
- ogg
tip
Per ottenere la massima qualità di trascrizione, consigliamo di inviare file audio con sample rate di almeno 16 kHz.
Lingue Supportate
Il sistema attualmente supporta solo la lingua italiana.