ubuntuusers.de

Deutsche Sprachsteuerung für Ubuntu und Debian

Status: Gelöst | Ubuntu-Version: Nicht spezifiziert
Antworten |

NormanTUD

Anmeldungsdatum:
31. Mai 2020

Beiträge: 3

Hallo,

ich habe das Glück an einer großen Uni arbeiten zu dürfen und wir haben einen Superrechner. Ich arbeite dort an einem Programm zur automatischen Optimierung neuronaler Netze und habe wir dachten, es wäre cool, wenn man damit DeepSpeech auf Deutsch trainieren kann. Der Superrechner ist gerade leider down, aber ich habe mir die Arbeitszeit trotzdem mit einem Projekt vertreiben können, nämlich einer deutschen Spracherkennungs- und Computersteuerungssoftware basierend auf DeepSpeech.

Was sie jetzt schon kann:

Fenster wechseln, Texte markieren, vorlesen, kopieren, einfügen, neue Tabs öffnen, Text eingeben, (einfache) Formeln eingeben und Rechnungen machen vorlesen, welche Fenster aktiv sind, das aktuelle Wetter ausgeben (für Dresden und für andere Orte), den aktuellen Bitcoin-Preis ausgeben uvm.

Hier einige Videos in der Benutzung:

https://youtu.be/MGxneP4vVFQ

https://youtu.be/mm0DwkwonRo

https://youtu.be/wI2oa4NObYs

Der ganze Code steht unter der GPL und ist (inkl. Sprachmodelle) auf github.com/NormanTUD/LinuxVoiceControl verfügbar.

Was noch fehlt ist eine gute Doku (aktuell kriegt man alle Befehle nur übers Lesen des Quellcodes) und ein modulares System zum Einbauen von "Plugins".

Hat Jemand von euch Interesse an diesem Projekt? Ich würde mich sehr über Mitarbeit freuen und denke, dass das vielen Leuten helfen würde.

Ein Caveat aktuell noch: das deutsche Sprachmodell ist noch nicht zuende trainiert. Bei mir klappt es, wenn ich deutlich rede, ganz gut, aber bei anderen vielleicht noch nicht. Sobald der Großrechner wieder online ist werde ich dort aber weiter trainieren und neue, bessere Modelle weiterhin hochladen. Außerdem ist der Code aktuell noch etwas "hacky", aber ich bin gerade dabei, ihn etwas zu verbessern.

Antworten |