Wie kann ich eine saubere Transkriptionslösung (KI) bei mir installieren und in das Tagesgeschäft einbauen? (Whisper – OpenAI)

Vorraussetzung: installiertes Python oder Anaconda.

  1. Anaconda-Prompt starten
  2. pip install -U openai-whisper
  3. pip install setuptools-rust
  4. FFmpeg installieren (Anleitung: https://www.geeksforgeeks.org/how-to-install-ffmpeg-on-windows/)
  5. Anaconda-Prompt zu und im Administrator-Modus starten
  6. setx /m PATH „C:\ffmpeg\bin;%PATH%“ da eintragen und bestätigen

Befehle für für diese Lösung

  1. whisper datei.mp4 –model medium
  2. whisper datei.mp4 –model large
  3. whisper datei.mp4 –device cuda –task translate

Vorteil: diese Offline-KI-Lösung erkennt die Sprache automatisch und beinhaltet eine optionale Übersetzungsfunktion. Stapeltranskriptionen lassen sich mittels eigener Scripte lösen und für 20 Minuten Videotranskript inkl. Übersetzung werden etwas um die 2 Minuten benötigt.

Weiter lesen: https://github.com/openai/whisper

Kommentare sind deaktiviert.