ubuntuusers.de

Voice control / recognition unter Ubuntu

Status: Ungelöst | Ubuntu-Version: Nicht spezifiziert
Antworten |

Starfall

Anmeldungsdatum:
28. Juli 2011

Beiträge: 98

Hallo.

Ich habe vorhin aus versehen Orca aktiviert und was ich da zu hören bekommen habe klang wie auf meinem Amiga 500 im Jahr 1990. Kein Stück anders und besser schon gar nicht.

Wie sieht es eigentlich im GNU/Linux bzw. *BSD Lager mit Spracherkennung und Kontrolle aus? Läuft in dieser Richtung überhaupt etwas? Den Teil mit Julius und Pocket Sphinx für Ubuntu Phone habe ich mitbekommen. Taugt das richtig was bzw. ist auf dem Weg mal richtig zu rocken?

Anders gefragt: Wie weit sind wir hier noch von Samantha in 'Her' entfernt? Wobei ich die Frage ausdrücklich nicht auf den AI Part von OS1 beziehe sondern auf den voice Teil.

PS: 'Her' unbedingt im Original ansehen, oder besser, anhören. OMGScarlett.. 😛

Moderiert von rklm:

Verschoben aus dem Projekte-Forum, weil es hier eher um eine allgemeine Diskussion als ein konkretes eigenes Projekt geht.

trollsportverein

Avatar von trollsportverein

Anmeldungsdatum:
21. Oktober 2010

Beiträge: 5040

Also mit espeak gibt es deutlich Unterschiede in der Qualität der Sprachausgaben unter Ubuntu und FreeBSD zu hören. Ob es wohl an Pulseaudio liegt? FreeBSD läuft ohne Pulseaudio.

Edit: Mir ist gerade aufgefallen, dass Ubuntu Trusty Tahr beim abspielen von WAV Störungen macht. Auf FreeBSD ist auch die Ausgabe vom Hallo.Welt.Ubuntu.espeak.wav klar verständlich. Erstellt wurden beide WAV Dateien mit:

espeak -vde Text -w WAV.Datei

Das Ubuntu espeak ist also wohl nicht kaputt. Ist Pulseaudio der Störenfried? Die Störungen auf Ubuntu Trusty Tahr gibt es auch beim abspielen mit play aus dem SoX Paket, Testweise habe ich das gameover.wav vom Emilia Pinball Emulator mir nun mal angehört.

play /usr/share/games/pinball/tux/gameover.wav

Aber völlig eigenartig, die Störungen gibt es nicht bei jeder WAV Datei, diese hier wird auch unter Ubuntu Trusty Tahr einwandfrei abgespielt, auch mit play aus dem SoX Paket: https://soundcloud.com/zokoselektah/12-the-fugees-can-t-ride-the

Hallo.Welt.FreeBSD.espeak.wav (44.6 KiB)
Download Hallo.Welt.FreeBSD.espeak.wav
Hallo.Welt.Ubuntu.espeak.wav (42.2 KiB)
Download Hallo.Welt.Ubuntu.espeak.wav

Starfall

(Themenstarter)

Anmeldungsdatum:
28. Juli 2011

Beiträge: 98

Hallo Welt und trollsportverein.

Ja, das klingt doch alles grauenvoll.

Also ist hier in dieser Richtung rein garnichts am kochen?

Und wie sieht es eigentlich mit Siri aus? Mein letztes iPhone ist schon ein paar Tage her, da gab es Siri noch nicht in dieser Form. Taugt das richtig was? Die Siri Werbung von Apple sieht ja vielversprechend aus, das war allerdings auch bei meinem Apple TV der Fall und getaugt hat es leider genau nichts.

encbladexp Team-Icon

Ehemaliger
Avatar von encbladexp

Anmeldungsdatum:
16. Februar 2007

Beiträge: 17525

Siri macht Spracherkennung mit der Cloud, ebenso macht es auch Google Now. Die Offline Funktion von beiden ist sehr eingeschränkt.

mfg Stefan Betz

trollsportverein

Avatar von trollsportverein

Anmeldungsdatum:
21. Oktober 2010

Beiträge: 5040

Starfall schrieb:

Hallo Welt und trollsportverein.

Ja, das klingt doch alles grauenvoll.

Findest Du? Also ich meine, es würde gerüchtet, dass es Fernsehsender geben würde, die espeak verwenden, um Textnachrichten automatisch den Zuschauern vorzulesen, mit denen solche Sender viel Geld mit sehr wenig Aufwand verdienen. Siehe hier: http://www.youtube.com/watch?v=iMFrDmyzVeg und hier: http://www.youtube.com/watch?v=9M4tQtznnEk

Antworten |