ubuntuusers.de

Text aus Textdatei in Audo Datei umwandeln text to speech wav

Status: Ungelöst | Ubuntu-Version: Ubuntu 20.04 (Focal Fossa)
Antworten |

Krümelomat

Avatar von Krümelomat

Anmeldungsdatum:
18. Oktober 2010

Beiträge: 1143

Kann man mit:

spd-say -o pico -l de "hallo ich bin da"

auch eine Textdatei laden und in Audio abspeichern? so wie:

espeak -v mb-de6 -f tex.txt -w text.wav

Thorsten Voice ist natürlich wesentlich besser, aber nach dem Befehl - pip install tts==0.8.0 legt der erst mal los und lädt allerhand runter, ich hab bei 1GB unterbrochen. Ich weiß weder ob er noch 30 GB laden will und wohin er das zwischenspeichert. Schön wäre wenn ich vorher wüsste wieviel Platz die Installation braucht, wohin gedownloaded wird, und wohin es installiert wird. Kann man ja im Terminal kurz mit angeben.

Gibt es noch bessere Lösungen, andre Lösungen? Textfenster zum reinkopieren hätte Gespeaker, kann ich aber nicht als deb installieren. Und es soll Plattenplatz sparen.

Notizen:
sudo apt-get install speech-dispatcher
spd-say -o pico -l de  "hallo ich bin da"
spd-say -o espeak-mbrola-generic -l de  "hallo ich bin da"
spd-say -l en -t female2 "why is this so difficult?"


sudo apt-get install mbrola mbrola-de6
espeak -v de "zu sprechender Text"
espeak -v mb-de6 "Das ist ein Test."
espeak -v mb-de6 -f tex.txt -w text.wav

nur englisch:
echo "hello" | festival --tts
text2wave EINGABE.txt" -o AUSGABE.wav

https://wiki.ubuntuusers.de/Sprachausgabe/

https://www.thorsten-voice.de/einfach-loslegen/


https://de.moyens.net/linux/so-beheben-sie-eine-eingefrorene-ubuntu-sitzung/

https://www.giga.de/downloads/linux-mint/tipps/linux-prozesse-anzeigen-so-gehts/

https://wiki.ubuntuusers.de/Notfall/


https://www.verfassungsschutz.de/SharedDocs/publikationen/DE/verfassungsschutzberichte/2023-06-20-verfassungsschutzbericht-2022.pdf;jsessionid=950E799B3262C2697455FC25920B1A33.intranet671?__blob=publicationFile&v=5

trollsportverein

Avatar von trollsportverein

Anmeldungsdatum:
21. Oktober 2010

Beiträge: 4997

Read Aloud - Webbrowser Add-on für Firefox oder Chrome Webbrowser. Wenn man wenig Overhead aber Sprachqualität auf Linux haben möchte. Das nutzt Google Speech Engines.

verdooft

Anmeldungsdatum:
15. September 2012

Beiträge: 4436

Ich richte Thorsten Voice gerade mittels venv ein. Da landen die ganzen Pythonsachen im Ordner der virtuellen Umgebung. Die eigentlichen Sprachmodelle (ich habe DDC und VITS, werden bei den ersten Serverstarts geladen) landen hier:

/home/<user>/.local/share/tts

Ordnergrößen:

venv:
5,6 GiB
39.759 Dateien, 3.274 Unterordner

~/.local/share/tts:
1,8 GiB
22 Dateien, 7 Unterordner

Vielleicht auch interessant:

Mimic 3: https://github.com/MycroftAI/mimic3

Dazu schaue ich gerade das Video, in dem Installationsmethoden und die Weboberfläche gezeigt werden: https://www.youtube.com/watch?v=bCZlS6I84Go

Antworten |