Meeting AI Assistant: Trascrizione Intelligente e Sintesi Automatica On-Premise

Insight

Una soluzione AI on-premise che trasforma l’audio delle riunioni in trascrizioni accurate con identificazione degli interlocutori, testi revisionati, minute operative e verbali dettagliati. Automatizza l’intero processo di documentazione, garantendo al contempo la massima riservatezza dei dati.

Tecnologie

  • WhisperX (per trascrizione e diarizzazione degli speaker)
  • Grandi Modelli Linguistici (LLM) per l’elaborazione del testo
  • Tecniche di Natural Language Processing (NLP)
  • Prompt Engineering avanzato
  • Sviluppo di Applicazioni Desktop (soluzione on-premise)

Competenze

  • Sviluppo di soluzioni AI basate su LLM
  • Natural Language Processing e Comprensione Semantica
  • Integrazione di modelli AI pre-addestrati (come WhisperX)
  • Prompt Engineering per la pulizia, correzione e sintesi di testi
  • Sviluppo di applicazioni desktop sicure e on-premise
  • Analisi e ottimizzazione dei flussi di documentazione

L'esigenza

  • Necessità di trascrivere accuratamente le riunioni registrate, identificando i diversi interlocutori.
  • Esigenza di ottenere trascrizioni “pulite”, prive di intercalari, errori e con significati impliciti resi espliciti.
  • Richiesta di generare automaticamente sia minute sintetiche con punti focali e call to action, sia verbali dettagliati.
 

La Soluzione

Abbiamo sviluppato un’applicazione desktop on-premise che utilizza il modello Whisper per una trascrizione puntuale e per il riconoscimento automatico dei diversi speaker. Successivamente, attraverso una serie di prompt ingegnerizzati ad hoc per un LLM, la soluzione pulisce il testo da intercalari e imprecisioni, corregge errori, esplicita concetti e genera, a scelta dell’utente, minute riassuntive con punti focali e call to action, oppure verbali analitici e dettagliati.

Cosa abbiamo fatto?

  • Analizzato le esigenze specifiche del cliente relative alla documentazione delle riunioni.
  • Selezionato e integrato il modello WhisperX per garantire trascrizioni accurate e l’identificazione degli speaker.
  • Progettato e implementato una catena di prompt per LLM dedicata alla pulizia del testo, alla correzione grammaticale/ortografica e all’esplicitazione dei contenuti.
  • Sviluppato l’applicazione desktop on-premise, garantendo che i dati sensibili delle riunioni rimanessero all’interno dell’infrastruttura del cliente.
  • Implementato le funzionalità per la generazione automatica di minute riassuntive (con focus e C.T.A.) e di verbali dettagliati.
  • Condotto test approfonditi per validare l’intero processo, dalla registrazione audio all’output documentale.
Tempo impiegato per la trascrizione
- 0 %
Accuratezza del riconoscimento degli speaker
+ 0 %
Velocità di accesso alle decisioni chiave
+ 0 %

Vuoi saperne di più?

Contattaci per avere informazioni sul progetto