Zum Inhalt springen
Alle Anonymisierungs-Leitfäden
Qualitative Forschung und DSGVO

Gesprochene Kennungen aus einem Interview entfernen, bevor es Ihre Studie verlässt

Laden Sie ein qualitatives Interview hoch und wählen Sie die zu entfernenden gesprochenen Kennungen. Die Sekunden werden aus einem wortgenauen Transkript lokalisiert und auf der Wellenform zerstört — ersetzt durch einen 1-kHz-Piepton oder saubere Stille. Ehrlich zur Grenze: strukturierte Kennungen (IBAN, Kartennummer, Telefon, E-Mail) werden per Prüfsumme zuverlässig erkannt; deutsche Personennamen erkennt das Modell nur teilweise — nutzen Sie dafür die Deny-Liste und eine manuelle Kontrolle.

Medianonymizer Team1. Juli 20265 Min. Lesezeit
Ein Interview anonymisieren

Ohne Anmeldung · Zahlung pro Nutzung · Unwiderrufliche Schwärzung

Bevor eine Interview-Aufnahme Ihre Studie verlässt, schweigen Sie die Momente, in denen eine teilnehmende Person identifizierbar wird. Ein halbstrukturiertes Interview ist ein frei fließendes Gespräch, deshalb steckt ein Name, ein Arbeitgeber oder ein Heimatort nie in einem ordentlichen Feld — er taucht mitten im Satz auf, ungefragt, irgendwo in einer Stunde Gespräch vergraben. Sie können ein Interview jetzt anonymisieren ohne Konto: Datei hochladen, die gewünschten Kategorien ankreuzen und eine saubere MP3 herunterladen.

Warum Interview-Audio voller Kennungen ist, um die Sie nie gebeten haben

Sie haben die Studie um ein Thema herum entworfen, nicht um eine Person — und doch geben teilnehmende Personen ständig Konkretes preis, weil echte Menschen Geschichten erzählen und Geschichten Namen enthalten. Über dreißig Aufnahmen hinweg hören Sie:

  • Gesprochene Namen — den der teilnehmenden Person, aber auch den einer Vorgesetzten, einer Kollegin, eines Familienmitglieds, das in einer Anekdote fällt.
  • Orte, die jemanden festlegen — die Kleinstadt, in der jemand aufgewachsen ist, die Station, auf der jemand arbeitet, die Straße, in der das Büro liegt.
  • Laut vorgelesene Kontaktdaten — eine diktierte E-Mail für die Nachverfolgung, eine Handynummer, manchmal die eigene.
  • Referenznummern — eine Personalnummer, ein Aktenzeichen, eine Ausweisnummer, von einem Dokument auf dem Tisch abgelesen.

Nichts davon stand in Ihrem Interviewleitfaden. Es von Hand zu bereinigen bedeutet, dreißig Stunden Audio Sekunde für Sekunde durchzukämmen — genau die Arbeit, die eine Pipeline Ihnen abnehmen sollte, damit Sie zurück zum Codieren Ihrer Daten kommen.

Vom wortgenauen Transkript zur zerstörten Wellenform

Das Werkzeug hält das Raten und das Schneiden bewusst auseinander.

Zuerst findet es. Ihr Upload wird auf eine saubere 16-kHz-Monospur normalisiert und mit einem Zeitstempel auf jedem Wort durch ein Whisper-Klasse-Modell transkribiert. Dieses Transkript ist die Karte: die Entitätserkennung markiert Personen und Orte, während prüfsummengestützte Matcher strukturierte Werte herausgreifen — eine E-Mail, eine Telefonnummer, eine IBAN oder eine Ausweisnummer werden nur markiert, wenn ihr Format aufgeht, sodass eine beiläufig genannte Zahl in Ruhe gelassen wird. Das Sprachmodell bearbeitet das Audio nie; es sagt nur, wo jedes Wort in der Zeit liegt.

Dann zerstört es. Jedes markierte Wort wird seiner Start- und Endsekunde zugeordnet, an jeder Seite wird ein kleiner Puffer ergänzt, überlappende Spannen werden zusammengeführt, damit nichts durch eine Lücke rutscht, und ffmpeg überschreibt die Proben in diesen Bereichen. Diese Hälfte ist nicht probabilistisch: dieselbe Aufnahme erzeugt bei jedem Durchlauf dieselbe Ausgabe.

Die Erkennung ist nach bestem Bemühen — und die Sprache zählt

Einen gesprochenen Namen zu finden hängt vom Transkript und von der Sprachabdeckung des Erkenners ab. Die Erkennung von Personennamen ist auf Spanisch und Englisch am stärksten; für Interviews auf Deutsch, Französisch oder Italienisch erfasst das Modell Namen nur teilweise, sodass ein Nachname durchrutschen kann. Strukturierte Kennungen — E-Mail, Telefon, IBAN und Ausweisnummern — werden sprachübergreifend per Format erfasst. Für Feldarbeit, die nicht auf Spanisch oder Englisch ist, tragen Sie die echten Namen Ihrer teilnehmenden Personen in die Deny-Liste ein und behalten einen Menschen im Ablauf. Der Zerstörungsschritt ist exakt; der Erkennungsschritt ist keine Garantie.

Piepton oder Stille — und warum die Proben endgültig weg sind

Beide Optionen löschen, was darunter war; sie unterscheiden sich nur darin, was eine spätere Person hört.

Den Moment verdecken
  • Lautstärke senken oder dämpfen lässt den Namen wiederherstellbar
  • Ein obendrauf gelegter Piepton lässt sich abheben, um die Sprache freizulegen
  • Die Metadaten des Handys können weiterhin Gerät oder Sitzung benennen
  • Nichts zeigt einer Hörerin, dass der Schnitt beabsichtigt war
Die Proben löschen
  • Die Wellenform in dieser Spanne wird auf null gesetzt — der Name ist weg
  • Ein 1-kHz-Ton oder saubere Stille tritt an seine Stelle in derselben Datei
  • Die MP3 wird mit entfernten Tags neu kodiert
  • Die Prüfliste speichert nur den Zeitbereich, niemals die Wörter

Was das Werkzeug findet und wo Sie die Kontrolle behalten

Wir entfernen gesprochene Namen und Orte, die die Entitätserkennung findet, dazu E-Mails, Telefonnummern, IBANs und nationale Ausweisnummern, die per Format erfasst werden — und alles, was Sie in die Deny-Liste setzen. Was wir nicht tun, ist so zu tun, als wäre der Durchlauf vollständig: öffnen Sie die zurückgegebene Prüfliste, springen Sie zu einigen Zeitstempeln und bestätigen Sie die Momente, an die Sie sich aus dem Raum erinnern. Dieses Werkzeug arbeitet auf Audio und liefert Audio — es gibt Ihnen kein Transkript zum Behalten, es rührt keine Gesichter in Videos an und es schwärzt kein PDF. Das sind eigene Aufgaben mit eigenen Werkzeugen.

0Konten nötig, um eine Aufnahme zu anonymisieren
1kHzZensur-Piepton über jedem zerstörten Bereich
MP3saubere Ausgabe, alle Metadaten entfernt

Passt dazu, wie qualitative Feldarbeit wirklich klingt

Feldaufnahmen sind unordentlich, und die Pipeline rechnet damit. Ein auf dem Tisch liegendes Handy fängt beide Stimmen auf einem Monokanal ein, dazu Raumhall, ein Café im Hintergrund, das Kratzen eines Stuhls — nichts davon bringt die Zeitkarte aus der Spur, weil die Ausrichtung aus den Wörtern selbst rekonstruiert wird, nicht aus einem sauberen Studiosignal. Eine teilnehmende Person, die ihren eigenen Namen über Ihre Frage sagt, wird trotzdem auf die genaue Sekunde festgenagelt, in der sie ihn sagte. Lange Pausen, überlappende Redeanteile und ein Akzent, an dem der Erkenner arbeiten muss, lösen sich weiterhin in einen Zeitstempel auf, den der Schnitt nutzen kann.

Anonymisieren Sie jetzt eine Interview-Aufnahme

Laden Sie das Interview hoch, wählen Sie, ob gesprochene Namen, Orte und Kontaktdaten zu einem Piepton oder zu Stille werden, ergänzen Sie bekannte Namen in der Deny-Liste, bestätigen Sie den Preis und laden Sie die saubere MP3 herunter — bereit für das Repositorium, eine Ko-Autorin oder einen Transkriptionsdienst. Das Modell findet nur die sensiblen Momente; deterministischer Code zerstört sie, sodass das Ergebnis unwiderruflich und bei jedem Durchlauf identisch ist. Kein Konto, zahlen Sie nur für das, was Sie anonymisieren.

Wann Sie das brauchen

Eine Doktorandin hat gerade die Feldarbeit für ihre Studie abgeschlossen: dreißig halbstrukturierte Interviews, je eine Stunde lang, mit dem Handy aufgenommen. Jede teilnehmende Person hat eine Einwilligung unterschrieben, die verspricht, ihre Daten zu anonymisieren, bevor sie im offenen Forschungsrepositorium der Universität archiviert und bevor das Audio an einen externen Transkriptionsdienst geschickt wird. Doch die Aufnahmen sind voll gesprochener Kennungen, um die niemand gebeten hat und die sich nicht überhören lassen: Eine Person nennt ihren direkten Vorgesetzten, erwähnt die Kleinstadt, in der sie aufgewachsen ist, liest die E-Mail einer Kollegin vor, gibt ihre eigene Telefonnummer für die Nachverfolgung an. Das von Hand zu erledigen bedeutet, dreißig Stunden Audio Sekunde für Sekunde abzuhören. Laden Sie jedes Interview zu Medianonymizer hoch, wählen Sie die zu entfernenden Kategorien, und die Sekunden, in denen ein Name, ein Arbeitgeber, ein Ort oder ein Kontaktdetail gesprochen werden, werden aus einem wortgenauen Transkript lokalisiert und auf der Wellenform zerstört — ein 1-kHz-Piepton oder saubere Stille — bevor die Datei je das Repositorium, eine Ko-Autorin oder eine transkribierende Person erreicht.

Der Compliance-Aspekt

Nach Artikel 89 DSGVO gelten für die Verarbeitung personenbezogener Daten zu wissenschaftlichen Forschungszwecken besondere Garantien und eine Pflicht zur Datenminimierung: Sie dürfen keine Kennungen aufbewahren, die Sie nicht brauchen. Erwägungsgrund 26 ist der Hebel — wirklich anonymisierte Daten fallen vollständig aus der Verordnung heraus, sodass eine Aufnahme mit zerstörten direkten Kennungen archiviert und geteilt werden kann, ohne die Pflichten zu Widerruf der Einwilligung und Aufbewahrung, die lebende personenbezogene Daten mit sich bringen. Die Einwilligungen, die die meisten Ethikkommissionen genehmigen, versprechen genau das: Kennungen vor der Archivierung entfernt. Den gesprochenen Namen, Arbeitgeber und Ort im Audio zu zerstören ist, wie Sie dieses Versprechen halten, statt es nur zu behaupten.

Was Sie überprüfen können

Das Ergebnis ist überprüfbar, keine Behauptung. Öffnen Sie die zurückgegebene MP3 und springen Sie zum Zeitpunkt, an dem die Person ihren Namen sagte: Sie hören einen 1-kHz-Ton oder Stille, nicht den Namen — die Originalproben in diesem Bereich sind auf null gesetzt, nicht leiser gedreht und nicht unter einer abziehbaren Schicht versteckt. Prüfen Sie die Tags der Datei mit einem beliebigen Werkzeug, und es sind keine ID3-Metadaten vom aufnehmenden Handy übernommen. Die Prüfliste erfasst nur die geschwärzten Zeitbereiche — Start- und Endsekunde — niemals die Wörter selbst, sodass auch das Protokoll niemanden re-identifizieren kann.

Häufig gestellte Fragen

Kann ich auch ein anonymisiertes Transkript behalten, oder liefert dieses Werkzeug nur Audio?
Dieses Werkzeug liefert Audio: eine saubere MP3 mit den lokalisierten Kennungen zerstört und allen Metadaten entfernt. Es gibt kein Transkript zum Behalten zurück. Ein wortgenaues Transkript wird nur erstellt, um zu lokalisieren, wo Kennungen gesprochen werden, und die daraus erzeugte Prüfliste erfasst Zeitbereiche — Start- und Endsekunde — niemals die Wörter. Wenn Sie ein anonymisiertes Transkript zum Codieren brauchen, führen Sie das bereinigte Audio anschließend durch Ihren Transkriptions-Workflow, oder nutzen Sie unser Text-Werkzeug auf einem Transkript, das Sie bereits haben.
Wie geht es mit zwei Stimmen — der interviewenden und der teilnehmenden Person — in einer Aufnahme um?
Die Erkennung arbeitet auf den Wörtern, nicht darauf, wer sie gesagt hat, sodass eine Kennung entfernt wird, egal ob die teilnehmende Person sie sagte oder Sie sie zur Bestätigung wiederholten. Eine Handyaufnahme mischt beide Stimmen meist in eine Monospur, und das ist in Ordnung: die Zeitkarte wird aus dem Transkript rekonstruiert, nicht aus getrennten Kanälen. Wenn sich Ihre Kennungen in den Redeanteilen einer Stimme häufen, sind Deny-Liste und eine Stichprobe der Weg, um sicherzugehen, dass nichts aus der anderen Stimme durchgerutscht ist.
Funktioniert die automatische Erkennung bei Interviews auf Deutsch, Französisch oder Italienisch, oder nur auf Englisch und Spanisch?
Strukturierte Kennungen — E-Mail-Adressen, Telefonnummern, IBANs, Karten- und Ausweisnummern — werden in jeder Sprache per Format erkannt. Die Erkennung von Personennamen und Orten ist auf Spanisch und Englisch am stärksten; für Deutsch, Französisch oder Italienisch ist sie teilweise, sodass ein Nachname übersehen werden kann. Für Feldarbeit in diesen Sprachen tragen Sie die echten Namen in die Deny-Liste ein, damit sie immer entfernt werden, und behalten eine manuelle Kontrolle im Ablauf. Wir nennen diese Grenze lieber, als Sie annehmen zu lassen, ein Name sei erfasst worden, obwohl er es nicht war.
Kann ich die echten Namen meiner teilnehmenden Personen in eine Deny-Liste eintragen, damit sie immer entfernt werden?
Ja, und für Interviews, die nicht auf Englisch oder Spanisch sind, ist das der empfohlene Schritt. Eine Deny-Liste ist eine Menge exakter Zeichenfolgen — ein Teilnehmername, ein Ort, ein internes Projektkürzel — die im selben Durchlauf entfernt werden, unabhängig davon, wie der Erkenner sie bewertet. Sie schwächt die Erkennung nicht, sondern garantiert, dass die Werte, die Sie bereits kennen, zerstört werden. Die Liste dient nur dem Abgleich und wird nie in die Ausgabe oder das Prüfprotokoll geschrieben.
Ist die Anonymisierung umkehrbar, und reicht sie für die Einwilligung meiner Ethikkommission?
Die lokalisierten Bereiche werden zerstört, nicht versteckt: die Proben werden auf null gesetzt und durch einen Piepton oder Stille in derselben Datei ersetzt, ohne abziehbare Schicht — dieser Teil ist unwiderruflich. Ob das Ihrer Ethikkommission genügt, ist deren Entscheidung und hängt von Ihrer Studie ab. Wir zerstören die direkten Kennungen, die wir lokalisieren, aber wir zertifizieren eine Aufnahme nicht als anonym, denn indirekte Kennungen und alles, was die Erkennung verpasst hat, bleiben Ihre Verantwortung zur Prüfung. Betrachten Sie das Werkzeug als den Mechanismus, der das Versprechen Ihrer Einwilligung hält, zusammen mit Ihrer eigenen Kontrolle — nicht als Freigabe zur Konformität.

Anonymisieren Sie Ihre Datei jetzt

Laden Sie Ihren Text hoch, wählen Sie aus, was entfernt werden soll, und laden Sie eine bereinigte Kopie herunter — die personenbezogenen Daten werden gelöscht, nicht versteckt.

Ohne Anmeldung · Zahlung pro Nutzung · Unwiderrufliche Schwärzung

Schritt 1 von 5
Datei hochladen
Ziehen Sie eine beliebige Datei hinein — wir erkennen den Typ automatisch. Sie wird verschlüsselt und direkt in den Speicher hochgeladen, nicht über uns.

Verwandte Leitfäden