Erfahrung mit Speech note? › Programme › Ubuntu verwenden › Forum › ubuntuusers.de

Erfahrung mit Speech note?

« Vorherige1Nächste »

Status: Ungelöst | Ubuntu-Version: Lubuntu 24.04 (Noble Numbat)
Antworten |

Stabsgefreiter Anmeldungsdatum: 27. Juli 2008 Beiträge: 832 Wohnort: Berlin	Zitieren 22. Oktober 2024 15:55 Hallo, ich muss mich vielleicht von Dragon naturally speaking verabschieden. Hat vielleicht jemand hier Erfahrungen mit Speech note gemacht? Wäre das als Spracherkennung zu empfehlen?
sh4711 Anmeldungsdatum: 13. Februar 2011 Beiträge: 1146	Zitieren 22. Oktober 2024 16:46 Stabsgefreiter schrieb: ... Wäre das als Spracherkennung zu empfehlen? Habe es selber nicht getestet es gibt aber ein Flatpak hier ... das heißt wenn du genug Plattenplatz hast kannst du es selber testen ... die eigenen Erfahrungen sind wohl die besten 😉 Bei der Suche nach "Speech Note" bin ich noch auf folgende Browser App gestoßen. Diese kannst du bei Interesse ohne Installation testen. Beide Programme benutzen externes Knowhow: zu 1.) nutzt openai whisper; Quelle: omglinux.com zu 2.) "Your speech is sent to Google's speech-to-text engines for transcription." Quelle: speechnote.appspot.com
sh4711 Anmeldungsdatum: 13. Februar 2011 Beiträge: 1146	Zitieren 22. Oktober 2024 17:10 Hier noch ein relativ aktueller Thread von ubuntuusers.de zum Thema "speech to text".
Stabsgefreiter (Themenstarter) Anmeldungsdatum: 27. Juli 2008 Beiträge: 832 Wohnort: Berlin	Zitieren 22. Oktober 2024 17:37 danke, ich werde das mal testen, notfalls deinstalliere ich es halt. Ich dachte dass jemand hier schon mehr Erfahrung damit hat als ich.
Mankind75 Lokalisierungsteam Anmeldungsdatum: 4. Juni 2007 Beiträge: 3348 Wohnort: Wernigerode	Zitieren 22. Oktober 2024 18:36 Stabsgefreiter schrieb: ich muss mich vielleicht von Dragon naturally speaking verabschieden. Da hattest Du ja etwas dazu geschrieben aber hast dich wohl aus dem Thread verabschiedet ohne auf die Rückfragen einzugehen.
Stabsgefreiter (Themenstarter) Anmeldungsdatum: 27. Juli 2008 Beiträge: 832 Wohnort: Berlin	Zitieren 30. März 2025 14:35 (zuletzt bearbeitet: 30. März 2025 19:36) nach dem ich eine Menge anderes Zeugs um die Ohren hatte musste speech note erst mal pausieren. Jetzt habe ich mich mal wieder damit beschäftigt, dazu habe ich mir ein youtube video runtergeladen und war zunächst voller Euphorie. Die Installation war kein Problem, war alles gut erklärt. Aber der Typ muss einen Quantencomputer besitzen, so schnell wie die Spracherkennung bei ihm lief. Meine ersten Versuche mit dem sony vaio ( immerhin 8GB Speicher ) waren frustran, obwohl ich mit audacity eine Sprachaufnahme getestet hatte passsierte beim Diktieren in speech note zunächst nichts, beim Processing fror dann der notebook ein, ein Neustart war fällig. Ich wollte jedoch so schnell nicht aufgeben und versuchte es auf dem Notebook meiner Freundin ( Lenovo G70 ). Das war schon besser, die Texterkennung ist okay, nur das processing ( Sprache auf das Notepad von speech note bringen ) dauert recht lange. Da ging es mit Dragon sogar auf meinem alten medion notebook ( 2 GB ram, 32 bit ) wesentlich schneller. Vielleicht stimmen meine Einstellungen bzg. der Sprache noch nicht, aber vielleicht hat hier ja hier jemand bessere Erfahrungen sammeln können?
verdooft Anmeldungsdatum: 15. September 2012 Beiträge: 4391	Zitieren 31. März 2025 16:10 (zuletzt bearbeitet: 31. März 2025 16:38) Ich weiß nicht, für was du Speech note verwendest. Ich nutze für Sprache zu Text whisper.cpp. Das kommt auch mit quantisierten Modellen zurecht, die dann schneller laufen. Optimal ist es, wenn eine dezidierte Grafikkarte verwendet wird, habe ich nicht. Vermutlich ist es nicht einfach, den diktierten Text in das gewünschte Eingabefenster zu bekommen, ich hantiere damit nur im Terminal. Was gut klappt ist, Sprache aufnehmen und dann transkribieren/nach Englisch übersetzen lassen. Restliche Funktionalität, wie live Mikrofoneingaben erfassen, läuft über mitgelieferte Beispiele. Habs eben nochmal mit einem kleineren Modell getestet, irgendwie klappt das jetzt besser als früher, obwohl mein internes Mikofon so rauscht: ./stream --threads 8 -l de -m models/q/ggml-base-q5_k.bin [...] [Start speaking] Das ist ein Aufnahme-Test. Mal sehen wie es klappt. Das ist ja super, es funktioniert auf Anhieb. * Musik * [..] Musik läuft hier eigentlich nicht, aber durch das offene Fenster ist Straßenverkehrslärm.
Stabsgefreiter (Themenstarter) Anmeldungsdatum: 27. Juli 2008 Beiträge: 832 Wohnort: Berlin	Zitieren 31. März 2025 18:53 ich möchte den Rest der Familienchronik, der noch teileweise handschriftlich vorliegt eindiktieren und dann als Text mit Druckbuchstaben verwenden,um daraus eine Art Buch zu machen das alles händisch zu machen ist ein zu großer Aufwand. Vielleicht geht es ja mit whisper was flotter, werd ich mal ausprobieren
verdooft Anmeldungsdatum: 15. September 2012 Beiträge: 4391	Zitieren 31. März 2025 18:56 (zuletzt bearbeitet: 31. März 2025 18:56) whisper.cpp ist was anderes als OpenAI Whisper, bzw. ein Port. Bei meinem letzten Vergleich wurde whisper.cpp aktiver weiterentwickelt. https://github.com/ggerganov/whisper.cpp

« Vorherige1Nächste »

Antworten |

« Vorheriges Thema Nächstes Thema »