ubuntuusers.de

Speech to text: Programm für Linux?

Status: Gelöst | Ubuntu-Version: Kubuntu 20.04 (Focal Fossa)
Antworten |

E6500Kubuntu

Anmeldungsdatum:
21. Februar 2013

Beiträge: 746

Tach,

seit einiger Zeit nutze ich auf meinem Smartphone die Funktion speech-to-text, geht meistens ganz gut und erleichtert das Festhalten von Gedanken, wenn ich unterwegs bin. Gibt es ein vergleichbares Programm auch für Linux?

verdooft

Anmeldungsdatum:
15. September 2012

Beiträge: 4390

Entsprechende GPU vorausgesetzt, würde vielleicht whisper oder whisper.cpp klappen. Kenne ich zwar eigentlich eher zum Transkribieren von Audiodateien, aber wenns flott per GPU gerechnet wird, ginge das bestimmt auch in Realtime.

E6500Kubuntu

(Themenstarter)

Anmeldungsdatum:
21. Februar 2013

Beiträge: 746

verdooft schrieb:

würde vielleicht whisper ... klappen.

Danke, gibt es das irgendwo im Wiki? Ich habe nichts gefunden, was ist denn der Oberbegriff für diese Art von Programmen?

Gerade mal noch anderweitig gesucht, dieses Whisper gibt es anscheinend nur für Englisch?

verdooft

Anmeldungsdatum:
15. September 2012

Beiträge: 4390

Das Whisper, welches ich kenne, kann Audio verschiedener Sprachen, darunter auch Deutsch, transkribieren, aber auch nach Englisch übersetzen. Ich verwende das per CPU, also ziemlich lahm mit dem größten Modell. Irgendwo in Diskussionen bin ich auch mal über den Liveeinsatz gestolpert, war für mich aber uninteressant.

Whisper: https://github.com/openai/whisper

whisper.cpp (wird aktualisiert): https://github.com/ggerganov/whisper.cpp

Oberbegriff für die Art solcher Programme (in Verbindung mit Dragon Naturally Speaking kam der vor): Spracherkennung

E6500Kubuntu

(Themenstarter)

Anmeldungsdatum:
21. Februar 2013

Beiträge: 746

verdooft schrieb:

Spracherkennung

Kann Chrome angeblich auch, nun nutze ich zwar Firefox als Standardbrowser, aber einen Versuch mit Chrome wäre es mal wert. Da ist angeblich nach Öffnen eines leeren Dokumentes in Google Docs eine Sprachaufnahme möglich, die dann direkt in Text umgewandelt wird.

Mal sehen, was ich jetzt mit alldem anfangen kann, vielen Dank erstmal für Deine schnelle Rückmeldung.

verdooft

Anmeldungsdatum:
15. September 2012

Beiträge: 4390

Diktiersoftware ist mir als Begriff noch begegnet. Als ich mein Notebook gekauft habe, hatte ich KI Anwendungen noch nicht auf dem Schirm, sonst hätte ich vielleicht eines mit "richtiger" Grafikkarte genommen, jetzt dauert sowas halt.

coolwalda

Anmeldungsdatum:
24. Januar 2017

Beiträge: Zähle...

Antworten |