Skip to main content

Scripta API

Scripta è un sistema automatico di speech recognition basato su modelli di Machine Learning. Ricevuto un audio, Scripta:

  • identifica le regioni audio contenenti speech;
  • riconosce gli speaker coinvolti nella conversazione, assegnandogli un ID univoco all'interno dell'intero audio;
  • trascrive l'audio di ogni regione.

Il sistema supporta due modalità di utilizzo:

  • Offline: l'utente carica un file audio intero e ne richiede il processamento.
  • Streaming: l'utente manda un stream audio e riceve a sua volta il processamento in modalità streaming (attualmente, il riconoscimento degli speaker non è supportato).
info

Non sono attualmente disponibili librerie client per interfacciarsi a Scripta. Le interazioni avvengono tramite chiamate HTTP e WebSockets.

Formati Audio Supportati

Scripta supporta i seguenti formati audio:

  • wav
  • flac
  • opus
  • pcm
tip

Per ottenere la massima qualità di trascrizione, consigliamo di inviare file audio con sample rate di almeno 16 kHz.

Lingue Supportate

Il sistema attualmente supporta solo la lingua Italiana.