Moin in die Runde,
ich nutze nun seit ungefähr 18 Jahren Ubuntu auf dem Desktop und arbeite auch beruflich mit Linux (meist Debian) im Serverbereich. Ich finde es toll, wie dieses freie Betriebssystem einfach funktioniert und simpel ist im Gegensatz zu MacOS und Windows.
Leider bemerke ich zunehmend, dass ich in Sachen Produktivität gegenüber Android zurückfalle. Primär auf Grund der Texteingabe. Die Spracherkennung von Google ist inzwischen so gut geworden, dass man selbst längere Texte einfach diktiert und dann 1-2 Fehler korrigiert und fertig. Obwohl ich mit zehn Fingern schreiben kann und da gar nicht mal so langsam bin, ist das einfach eine Produktitivtätsbremse und eine vermeidbare Ermüdung. Ganz simples Beispiel: Ich ertappe mich mittlerweile dabei, wie ich E-Mails oder Whatsapp-Nachrichten lieber am Smartphone per Spracheingabe beantworte als am Rechner, obwohl ich gerade am Rechner sitze. Es ist einfach komfortabler und effizienter.
Der Linux-Way ist jetzt natürlich offline etwas laufen zu lassen, Datenschutz und so. Whisper AI kommt aber nicht annähernd in Punkto Geschwindigkeit und Genauigkeit an die Cloud heran und mir persönlich ist Datenschutz auch Schnuppe. Außerdem habe ich recht alte Hardware im Einsatz - Ubuntu läuft noch super auf meinem i7-3770K und mein Laptop hat auch 'ne lahme CPU.
Gibt es eine einfache Integration einer Cloud-Speech-to-Text-KI, die mir Sprache in Text umwandelt und wie eine Tastatureingabe an die Stelle schreibt, wo gerade der Focus und der Cursor sind? Ich würde gerne rumkopieren aus LLM-Apps wie Grok oder ChatGPT vermeiden, da ich inzwischen Texteingabe auch in Chats verwende und da nervt das rumkopieren dann. Gerne zahle ich auch ein paar € für die Cloudnutzung.
Ich hatte schon mal ChatGPT und Grok hierzu befragt, aber noch nicht so die für mich passende Lösung finden können.
Hat jemand eine Lösung oder coole Idee?
Viele Grüße Matthias