Text aus Textdatei in Audo Datei umwandeln text to speech wav

« Vorherige1Nächste »

Status: Ungelöst | Ubuntu-Version: Ubuntu 20.04 (Focal Fossa)
Antworten |

Krümelomat

Anmeldungsdatum:
18. Oktober 2010

Beiträge: 1143

Zitieren

8. Juli 2023 03:50 (zuletzt bearbeitet: 8. Juli 2023 15:20)

Kann man mit:

spd-say -o pico -l de "hallo ich bin da"

auch eine Textdatei laden und in Audio abspeichern? so wie:

espeak -v mb-de6 -f tex.txt -w text.wav

Thorsten Voice ist natürlich wesentlich besser, aber nach dem Befehl - pip install tts==0.8.0 legt der erst mal los und lädt allerhand runter, ich hab bei 1GB unterbrochen. Ich weiß weder ob er noch 30 GB laden will und wohin er das zwischenspeichert. Schön wäre wenn ich vorher wüsste wieviel Platz die Installation braucht, wohin gedownloaded wird, und wohin es installiert wird. Kann man ja im Terminal kurz mit angeben.

Gibt es noch bessere Lösungen, andre Lösungen? Textfenster zum reinkopieren hätte Gespeaker, kann ich aber nicht als deb installieren. Und es soll Plattenplatz sparen.

Notizen:
sudo apt-get install speech-dispatcher
spd-say -o pico -l de  "hallo ich bin da"
spd-say -o espeak-mbrola-generic -l de  "hallo ich bin da"
spd-say -l en -t female2 "why is this so difficult?"


sudo apt-get install mbrola mbrola-de6
espeak -v de "zu sprechender Text"
espeak -v mb-de6 "Das ist ein Test."
espeak -v mb-de6 -f tex.txt -w text.wav

nur englisch:
echo "hello" | festival --tts
text2wave EINGABE.txt" -o AUSGABE.wav

https://wiki.ubuntuusers.de/Sprachausgabe/

https://www.thorsten-voice.de/einfach-loslegen/

https://de.moyens.net/linux/so-beheben-sie-eine-eingefrorene-ubuntu-sitzung/

https://www.giga.de/downloads/linux-mint/tipps/linux-prozesse-anzeigen-so-gehts/

https://wiki.ubuntuusers.de/Notfall/

https://www.verfassungsschutz.de/SharedDocs/publikationen/DE/verfassungsschutzberichte/2023-06-20-verfassungsschutzbericht-2022.pdf;jsessionid=950E799B3262C2697455FC25920B1A33.intranet671?__blob=publicationFile&v=5

trollsportverein

Anmeldungsdatum:
21. Oktober 2010

Beiträge: 4997

Zitieren

9. Juli 2023 17:39

Read Aloud - Webbrowser Add-on für Firefox oder Chrome Webbrowser. Wenn man wenig Overhead aber Sprachqualität auf Linux haben möchte. Das nutzt Google Speech Engines.

verdooft

Anmeldungsdatum:
15. September 2012

Beiträge: 4436

Zitieren

26. Juli 2023 01:19 (zuletzt bearbeitet: 26. Juli 2023 01:50)

Ich richte Thorsten Voice gerade mittels venv ein. Da landen die ganzen Pythonsachen im Ordner der virtuellen Umgebung. Die eigentlichen Sprachmodelle (ich habe DDC und VITS, werden bei den ersten Serverstarts geladen) landen hier:

/home/<user>/.local/share/tts

Ordnergrößen:

venv:
5,6 GiB
39.759 Dateien, 3.274 Unterordner

~/.local/share/tts:
1,8 GiB
22 Dateien, 7 Unterordner

Vielleicht auch interessant:

Mimic 3: https://github.com/MycroftAI/mimic3

Dazu schaue ich gerade das Video, in dem Installationsmethoden und die Weboberfläche gezeigt werden: https://www.youtube.com/watch?v=bCZlS6I84Go

« Vorherige1Nächste »

Antworten |

« Vorheriges Thema Nächstes Thema »