ubuntuusers.de

Erfahrung mit Speech note?

Status: Ungelöst | Ubuntu-Version: Lubuntu 24.04 (Noble Numbat)
Antworten |

Stabsgefreiter

Avatar von Stabsgefreiter

Anmeldungsdatum:
27. Juli 2008

Beiträge: 832

Wohnort: Berlin

Hallo,

ich muss mich vielleicht von Dragon naturally speaking verabschieden. Hat vielleicht jemand hier Erfahrungen mit Speech note gemacht? Wäre das als Spracherkennung zu empfehlen?

sh4711

Anmeldungsdatum:
13. Februar 2011

Beiträge: 1146

Stabsgefreiter schrieb:

... Wäre das als Spracherkennung zu empfehlen?

Habe es selber nicht getestet

  1. es gibt aber ein Flatpak hier ... das heißt wenn du genug Plattenplatz hast kannst du es selber testen ... die eigenen Erfahrungen sind wohl die besten 😉

  2. Bei der Suche nach "Speech Note" bin ich noch auf folgende Browser App gestoßen. Diese kannst du bei Interesse ohne Installation testen.

Beide Programme benutzen externes Knowhow:

sh4711

Anmeldungsdatum:
13. Februar 2011

Beiträge: 1146

Hier noch ein relativ aktueller Thread von ubuntuusers.de zum Thema "speech to text".

Stabsgefreiter

(Themenstarter)
Avatar von Stabsgefreiter

Anmeldungsdatum:
27. Juli 2008

Beiträge: 832

Wohnort: Berlin

danke, ich werde das mal testen, notfalls deinstalliere ich es halt. Ich dachte dass jemand hier schon mehr Erfahrung damit hat als ich.

Mankind75 Team-Icon

Lokalisierungsteam
Avatar von Mankind75

Anmeldungsdatum:
4. Juni 2007

Beiträge: 3348

Wohnort: Wernigerode

Stabsgefreiter schrieb:

ich muss mich vielleicht von Dragon naturally speaking verabschieden.

Da hattest Du ja etwas dazu geschrieben aber hast dich wohl aus dem Thread verabschiedet ohne auf die Rückfragen einzugehen.

Stabsgefreiter

(Themenstarter)
Avatar von Stabsgefreiter

Anmeldungsdatum:
27. Juli 2008

Beiträge: 832

Wohnort: Berlin

nach dem ich eine Menge anderes Zeugs um die Ohren hatte musste speech note erst mal pausieren. Jetzt habe ich mich mal wieder damit beschäftigt, dazu habe ich mir ein youtube video runtergeladen und war zunächst voller Euphorie.

Die Installation war kein Problem, war alles gut erklärt. Aber der Typ muss einen Quantencomputer besitzen, so schnell wie die Spracherkennung bei ihm lief. Meine ersten Versuche mit dem sony vaio ( immerhin 8GB Speicher ) waren frustran, obwohl ich mit audacity eine Sprachaufnahme getestet hatte passsierte beim Diktieren in speech note zunächst nichts, beim Processing fror dann der notebook ein, ein Neustart war fällig.

Ich wollte jedoch so schnell nicht aufgeben und versuchte es auf dem Notebook meiner Freundin ( Lenovo G70 ). Das war schon besser, die Texterkennung ist okay, nur das processing ( Sprache auf das Notepad von speech note bringen ) dauert recht lange.

Da ging es mit Dragon sogar auf meinem alten medion notebook ( 2 GB ram, 32 bit ) wesentlich schneller.

Vielleicht stimmen meine Einstellungen bzg. der Sprache noch nicht, aber vielleicht hat hier ja hier jemand bessere Erfahrungen sammeln können?

verdooft

Anmeldungsdatum:
15. September 2012

Beiträge: 4391

Ich weiß nicht, für was du Speech note verwendest. Ich nutze für Sprache zu Text whisper.cpp. Das kommt auch mit quantisierten Modellen zurecht, die dann schneller laufen. Optimal ist es, wenn eine dezidierte Grafikkarte verwendet wird, habe ich nicht.

Vermutlich ist es nicht einfach, den diktierten Text in das gewünschte Eingabefenster zu bekommen, ich hantiere damit nur im Terminal.

Was gut klappt ist, Sprache aufnehmen und dann transkribieren/nach Englisch übersetzen lassen. Restliche Funktionalität, wie live Mikrofoneingaben erfassen, läuft über mitgelieferte Beispiele.

Habs eben nochmal mit einem kleineren Modell getestet, irgendwie klappt das jetzt besser als früher, obwohl mein internes Mikofon so rauscht:

./stream --threads 8 -l de -m models/q/ggml-base-q5_k.bin
[...]
[Start speaking]
 Das ist ein Aufnahme-Test. Mal sehen wie es klappt.
 Das ist ja super, es funktioniert auf Anhieb.
 * Musik *
[..]

Musik läuft hier eigentlich nicht, aber durch das offene Fenster ist Straßenverkehrslärm.

Stabsgefreiter

(Themenstarter)
Avatar von Stabsgefreiter

Anmeldungsdatum:
27. Juli 2008

Beiträge: 832

Wohnort: Berlin

ich möchte den Rest der Familienchronik, der noch teileweise handschriftlich vorliegt eindiktieren und dann als Text mit Druckbuchstaben verwenden,um daraus eine Art Buch zu machen das alles händisch zu machen ist ein zu großer Aufwand. Vielleicht geht es ja mit whisper was flotter, werd ich mal ausprobieren

verdooft

Anmeldungsdatum:
15. September 2012

Beiträge: 4391

whisper.cpp ist was anderes als OpenAI Whisper, bzw. ein Port. Bei meinem letzten Vergleich wurde whisper.cpp aktiver weiterentwickelt.

https://github.com/ggerganov/whisper.cpp

Antworten |