Tach,
seit einiger Zeit nutze ich auf meinem Smartphone die Funktion speech-to-text, geht meistens ganz gut und erleichtert das Festhalten von Gedanken, wenn ich unterwegs bin. Gibt es ein vergleichbares Programm auch für Linux?
Anmeldungsdatum: Beiträge: 746 |
Tach, seit einiger Zeit nutze ich auf meinem Smartphone die Funktion speech-to-text, geht meistens ganz gut und erleichtert das Festhalten von Gedanken, wenn ich unterwegs bin. Gibt es ein vergleichbares Programm auch für Linux? |
Anmeldungsdatum: Beiträge: 4390 |
Entsprechende GPU vorausgesetzt, würde vielleicht whisper oder whisper.cpp klappen. Kenne ich zwar eigentlich eher zum Transkribieren von Audiodateien, aber wenns flott per GPU gerechnet wird, ginge das bestimmt auch in Realtime. |
(Themenstarter)
Anmeldungsdatum: Beiträge: 746 |
|
Anmeldungsdatum: Beiträge: 4390 |
Das Whisper, welches ich kenne, kann Audio verschiedener Sprachen, darunter auch Deutsch, transkribieren, aber auch nach Englisch übersetzen. Ich verwende das per CPU, also ziemlich lahm mit dem größten Modell. Irgendwo in Diskussionen bin ich auch mal über den Liveeinsatz gestolpert, war für mich aber uninteressant. Whisper: https://github.com/openai/whisper whisper.cpp (wird aktualisiert): https://github.com/ggerganov/whisper.cpp Oberbegriff für die Art solcher Programme (in Verbindung mit Dragon Naturally Speaking kam der vor): Spracherkennung |
(Themenstarter)
Anmeldungsdatum: Beiträge: 746 |
Kann Chrome angeblich auch, nun nutze ich zwar Firefox als Standardbrowser, aber einen Versuch mit Chrome wäre es mal wert. Da ist angeblich nach Öffnen eines leeren Dokumentes in Google Docs eine Sprachaufnahme möglich, die dann direkt in Text umgewandelt wird. Mal sehen, was ich jetzt mit alldem anfangen kann, vielen Dank erstmal für Deine schnelle Rückmeldung. |
Anmeldungsdatum: Beiträge: 4390 |
Diktiersoftware ist mir als Begriff noch begegnet. Als ich mein Notebook gekauft habe, hatte ich KI Anwendungen noch nicht auf dem Schirm, sonst hätte ich vielleicht eines mit "richtiger" Grafikkarte genommen, jetzt dauert sowas halt. |
Anmeldungsdatum: Beiträge: Zähle... |
Ich setze auf https://github.com/Softcatala/whisper-ctranslate2. |