Oscura i dati personali dalle registrazioni delle chiamate — bip o silenzio sui numeri di carta pronunciati

Distruggi i dati personali pronunciati dentro una registrazione di chiamata

Carica una chiamata di assistenza o di vendita, scegli le categorie da rimuovere, e i secondi in cui vengono pronunciati un numero di carta, un codice di sicurezza, un nome o un indirizzo vengono localizzati dalla trascrizione e distrutti sulla forma d'onda — sostituiti da un bip a 1 kHz o dal silenzio — prima che il file venga condiviso con qualità, analytics o un revisore esterno.

Medianonymizer Team1 luglio 20265 min di lettura

Prima che una registrazione lasci il tuo archivio, distruggi i secondi in cui vengono pronunciati dati personali. Una chiamata di assistenza o di vendita è una conversazione non strutturata, così il numero di carta, il codice di sicurezza e il nome del cliente non stanno in un campo etichettato: vengono detti ad alta voce, a metà frase, sparsi su minuti di dialogo. Puoi oscurare una registrazione adesso senza account: caricala, scegli le categorie da rimuovere e scarica un MP3 pulito.

Cosa cattura davvero una registrazione di chiamata

Le chiamate di pagamento e assistenza fanno trapelare proprio le categorie che preoccupano di più i regolatori, e le fanno trapelare come parlato invece che come colonne ordinate di un database:

Dati di carta nell'ambito PCI-DSS — il numero di conto principale letto cifra per cifra, la scadenza e il codice di sicurezza a tre cifre.
Identificatori diretti — nomi completi, cognomi scanditi, date di nascita e indirizzi email.
Dati di contatto e localizzazione — numeri di telefono, indirizzi di fatturazione e domicilio.
Numeri di riferimento — identificativi cliente, numeri d'ordine, IBAN e documenti d'identità nazionali.

La difficoltà non è mai cosa rimuovere. È trovare dove compare ogni valore lungo migliaia di ore di audio, e rimuoverlo in un modo che potrai dimostrare dopo. È un problema di pipeline, non di lavoro manuale.

Come funziona l'oscuramento: localizzare, poi distruggere

La pipeline tiene rigorosamente separate la parte probabilistica e la parte esatta.

Prima localizza. La registrazione viene normalizzata in una traccia mono pulita a 16 kHz e trascritta con marche temporali a livello di parola — usando per impostazione predefinita un modello in stile Whisper nel cloud, o un allineatore locale come ripiego. Il modello indica solo dove vengono dette le parole; non tocca mai l'audio. Su quella trascrizione il rilevamento agisce in due modi: il riconoscimento di entità segnala persone e luoghi, mentre i rilevatori validati con checksum catturano gli identificatori strutturati — un numero di carta viene segnalato solo se supera il controllo di Luhn, così un numero di conto reale viene catturato mentre una stringa casuale di sedici cifre detta di sfuggita viene lasciata stare. La stessa validazione protegge gli IBAN e i documenti d'identità. Puoi aggiungere la tua deny-list di stringhe esatte — un codice interno di pratica, un nome di prodotto — da rimuovere nella stessa passata.

Poi il codice deterministico distrugge. Ogni parola rilevata viene ricondotta al suo tempo di inizio e fine, si aggiunge un piccolo margine su ciascun lato, i tratti sovrapposti vengono uniti perché niente sfugga da un varco, e ffmpeg riscrive i campioni di quei tratti. Nulla di questo passo è generativo: lo stesso input produce lo stesso output a ogni esecuzione.

Il rilevamento è al meglio possibile — la distruzione è esatta

Siamo onesti sul confine. Trovare dati parlati dipende dalla trascrizione; se una parola non viene trascritta o non può essere allineata nel tempo, quel tratto viene lasciato intatto in sicurezza invece di indovinarlo. Ciò che non è probabilistico è la rimozione: una volta marcato un tratto, i campioni originali che contiene vengono distrutti fisicamente. Abbina la passata automatica a un controllo umano sulle tue chiamate più sensibili.

Silenzio o bip: scegli tu il segnale

Entrambe le opzioni cancellano l'audio sottostante; differiscono solo per ciò che un ascoltatore sente dopo.

Nascondere il momento

Abbassare il volume o attenuare lascia il parlato recuperabile
Un bip sovrapposto sopra può essere tolto per esporre l'originale
I metadati di origine possono ancora nominare dispositivo, operatore o sessione
Niente dimostra che un oscuramento fosse intenzionale

Distruggere i campioni

La forma d'onda di quel tratto viene azzerata — le cifre sono sparite
Un bip a 1 kHz o silenzio pulito le sostituisce nello stesso file
L'MP3 viene ricodificato con tutti i tag rimossi
L'elenco di audit marca il tratto, mai il valore

Cosa rileviamo e cosa non promettiamo

Rimuoviamo numeri di carta validati con Luhn, IBAN e dati bancari, documenti d'identità e passaporti, nomi, indirizzi email, numeri di telefono e indirizzi postali — oltre a qualsiasi cosa nella tua deny-list. Un codice di sicurezza a tre cifre pronunciato isolato non è un segnale forte da solo, quindi tratta il passo di revisione come parte del flusso e aggiungi valori precisi alla deny-list quando li conosci. Questo strumento elabora audio e restituisce audio: non ti consegna una trascrizione da conservare, non rileva volti nel video e non evidenzia un PDF — sono modalità distinte con strumenti propri.

0account necessari per oscurare una chiamata

1kHzbip di censura su ogni tratto oscurato

MP3output pulito, tutti i metadati rimossi

Oscura una registrazione di chiamata adesso

Carica la registrazione, scegli se i dati di carta, i nomi, i documenti e gli indirizzi pronunciati diventano un bip o silenzio, conferma il prezzo e scarica l'MP3 pulito. L'IA trova solo i momenti sensibili; il codice deterministico li distrugge, così il risultato è irreversibile e identico a ogni esecuzione. Senza account, paghi solo per ciò che oscuri.

Quando ti serve

È un martedì pomeriggio in un contact center e un operatore sta incassando un pagamento con carta al telefono. Il cliente legge ad alta voce le sedici cifre della carta, poi il codice di sicurezza a tre cifre, quindi scandisce il cognome e conferma l'indirizzo di fatturazione. Ogni secondo viene registrato per la valutazione della qualità e la gestione delle contestazioni, e resterà nel tuo archivio per mesi. Moltiplicalo per qualche migliaio di chiamate al giorno e stai custodendo una biblioteca ricercabile di dati di carta vivi e di identità. Carica quella registrazione su Medianonymizer, scegli le categorie da rimuovere, e i secondi in cui vengono pronunciati il numero di carta, il codice, il nome e l'indirizzo vengono localizzati da una trascrizione parola per parola e distrutti sulla forma d'onda — sostituiti da un bip a 1 kHz o dal silenzio — prima che il file venga mai consegnato alla qualità, a un fornitore di analytics o a un revisore esterno.

L'aspetto della conformità

Lo standard PCI-DSS v4.0 è esplicito: i dati di autenticazione sensibili come il codice di verifica della carta non devono mai essere conservati dopo l'autorizzazione (requisito 3.3.1), e il numero di conto principale deve essere reso illeggibile ovunque sia memorizzato (requisiti 3.4 e 3.5). Una registrazione che cattura quelle cifre lette ad alta voce è una memorizzazione. In parallelo, il GDPR tratta nome, indirizzo e telefono del chiamante come dati personali che devi minimizzare e proteggere. Distruggere i valori pronunciati dentro la registrazione toglie quel file dall'ambito PCI e GDPR per quegli elementi: non resta alcun numero di carta da proteggere né alcuna identità da esporre.

Ciò che puoi verificare

Il risultato è verificabile, non una promessa. Apri l'MP3 restituito e vai al momento in cui è stato letto il numero di carta: senti un tono a 1 kHz o silenzio, non le cifre — i campioni originali di quel tratto sono spariti, non abbassati di volume né nascosti sotto uno strato. Ispeziona i tag del file con qualsiasi strumento e non ci sono metadati ID3 trasferiti. L'elenco di audit registra solo i tratti temporali oscurati — secondo di inizio e di fine — mai le cifre stesse, così nemmeno il registro può divulgare ciò che ha rimosso.

Domande frequenti

Come trova lo strumento i dati personali nell'audio parlato?

Trascrive la chiamata in testo con marche temporali a livello di parola usando un modello vocale in stile Whisper, poi esegue il riconoscimento di entità e rilevatori validati con checksum su quella trascrizione. Nomi e luoghi arrivano dal riconoscimento di entità; numeri di carta, IBAN e documenti d'identità vengono individuati dalla struttura e validati — un numero di carta viene segnalato solo se supera il controllo di Luhn. Il modello indica soltanto dove viene pronunciato un valore; non modifica mai l'audio.

L'oscuramento è reversibile o l'audio viene davvero distrutto?

Viene distrutto. Ogni tratto rilevato viene riscritto sulla forma d'onda: i campioni originali vengono azzerati e sostituiti da un bip a 1 kHz o da silenzio pulito nello stesso file. Non c'è una traccia di bip separata da togliere né uno strato nascosto da staccare. Una volta oscurato un tratto, il parlato che vi si trovava non può essere ricostruito dall'output.

Devo usare un bip o il silenzio per i dati di carta?

Per contesti PCI e legali il bip è la scelta predefinita più sicura perché lascia un segnale udibile che qualcosa è stato rimosso intenzionalmente — un auditor può sentire l'oscuramento. Il silenzio è più pulito per dataset di analytics e qualità ma può essere scambiato per una caduta della registrazione. Entrambi cancellano i campioni sottostanti, quindi entrambi sono irreversibili.

L'output porta ancora metadati della registrazione originale?

No. La chiamata viene ricodificata in un nuovo MP3 con tutti i tag rimossi, così identificatori del dispositivo, dati di sessione e marche temporali della sorgente non viaggiano con essa. Il file che scarichi è l'audio ripulito e nient'altro.

Quali sono i limiti onesti del rilevamento automatico?

Trovare dati parlati dipende dalla trascrizione. Se una parola non viene trascritta o non può essere allineata nel tempo, quel tratto viene lasciato intatto in sicurezza invece di indovinarlo, così un codice di sicurezza a tre cifre pronunciato isolato non è un segnale forte da solo. Abbina la passata automatica a un controllo umano sulle chiamate sensibili e aggiungi alla deny-list le stringhe esatte che conosci. Il passo di distruzione è esatto; il passo di rilevamento è al meglio possibile.

Guide correlate

Riunioni e videochiamate

Anonimizzare la registrazione di una riunione — nascondi i volti dei partecipanti in un video Zoom, Teams o Meet

Carica la registrazione di una videochiamata e copri in modo irreversibile il volto di ogni partecipante con un riquadro pieno o una forte pixelatura prima di condividere il video oltre chi era presente. I volti vengono distrutti pixel per pixel, l'MP4 viene ricodificato senza metadati e i nomi pronunciati possono essere coperti da un bip nella stessa passata.

CCTV e videosorveglianza

Anonimizzare le riprese CCTV — oscura i terzi per una richiesta di accesso

Pixela i volti dei terzi nelle riprese CCTV prima di consegnarle per una richiesta di accesso. Ogni passante e distrutto fotogramma per fotogramma, non mascherato. Output verificabile. Senza account.

Dashcam e incidenti stradali

Anonimizzare le riprese dashcam — oscura i terzi prima di condividere un incidente

Pixela i volti degli altri automobilisti e pedoni nella tua ripresa dashcam prima di inviarla all'assicurazione o pubblicarla online. Volti distrutti fotogramma per fotogramma, verificabile. Senza account.