Spracherkennungssoftware für Kanzleien | Steuern

Karsten Zunke
Fachjournalist Digitalisierung, Berlin

Spracherkennungssoftware für Kanzleien — Bild: Photo by Jan Kolar / VUI Designer on Unsplash Siri, Alexa & Co. haben der Spracherkennung ein Revival verpasst.

Spracherkennungs-Lösungen sind eine gute Möglichkeit, den Zeitaufwand in Steuerkanzleien für lästigen Schreibarbeiten deutlich zu reduzieren. Die Software hat sich rasant weiterentwickelt und liefert heute qualitativ deutlich bessere Ergebnisse als noch vor fünf Jahren.

Spracherkennung erlebt ein Revival

Siri, Alexa & Co. haben der Spracherkennung ein Revival verpasst. Für jedermann verfügbar sind Spracherkennung und Sprachsteuerung damit auf bestem Wege, den Alltag der Menschen zu erobern. Laut Digital-Verband Bitkom nutzt bereits jeder achte Bundesbürger (13 Prozent) einen intelligenten Lautsprecher mit digitalem Sprachassistenten wie Amazon Echo, Google Home oder HomePod. Das entspricht 8,7 Millionen Menschen in Deutschland. Nicht nur einfache Fragen nach dem Wetter oder dem Weg werden von den Sprachassistenten problemlos verstanden und beantwortet. Auch können die kleinen Helfer auf Zuruf Musik abspielen, Online-Bestellungen auslösen oder elektrische Geräte steuern – zum Beispiel das Licht dimmen.

In Zukunft werden wir mit Computern sprechend kommunizieren.

Je besser die Systeme werden, desto stärker wächst das Vertrauen in diese neuen Technologien, wie eine aktuelle Bitkom-Studie zeigt: Jeder Dritte (34 Prozent) kann sich vorstellen, Überweisungen per Sprachbefehl zu tätigen. 17 Prozent der Befragten würden es auf jeden Fall machen. Es dürfte nur eine Frage der Zeit sein, bis Spracherkennung und Sprachausgabe sämtliche Ebenen des täglichen Lebens durchdrungen haben. Viele Marktbeobachter gehen bereits davon aus: In Zukunft werden wir mit Computern sprechend kommunizieren, anstatt einzelne Buchstaben über Tastaturen einzutippen oder mit Displays per Fingertipp zu interagieren.

Automatische Spracherkennung: Datensicherheit und Datenschutz an erster Stelle

Auch in der Berufswelt ist die automatische Spracherkennung auf dem Vormarsch – wenn auch unter anderen Vorzeichen. Per Sprache lassen sich Dokumente anlegen, Termine in Kalender eintragen, Texte schreiben und E-Mails versenden. Selbst fachspezifische Begriffe können moderne Lösungen verstehen und aus gesprochenen Worten Fachtexte erstellen.

Für den Alltag in Steuerkanzleien gilt ganz klar: Mandanteninformationen müssen vor dem Zugriff Dritter geschützt sein.

Die großen Herausforderungen für die geschäftliche Nutzung von Spracherkennungstechnologien sind jedoch Datensicherheit und Datenschutz. So unterliegen beispielswiese Berufsträger wie Steuerberater oder Rechtsanwälte der Verschwiegenheitspflicht. Diesem Anspruch können kostenfrei verfügbare Lösungen von Google, Amazon, Facebook und Apple nicht gerecht werden, da die Daten in die USA übertragen werden und dort teilweise sogar von Mitarbeitern abgehört werden, um die Qualität der Spracherkennung zu verbessern. Entsprechend sind diese Lösungen eher für den privaten Gebrauch geeignet.

Für den Alltag in Steuerkanzleien gilt ganz klar: Mandanteninformationen müssen vor dem Zugriff Dritter geschützt sein. Es gibt mittlerweile eine ganze Reihe von Software-Anbietern, die sich darauf spezialisiert haben, Unternehmen genau diese Sicherheiten zu bieten. Zu den bekannten Lösungen zählen zum Beispiel dns.comfort, BigHand Speech Recognition, Dragon Naturally Speaking, High Speech, Voice Pro oder DictaNet Spracherkennung.

Steuerberater nutzen Spracherkennung für Dokumentationszwecke

Im Bereich der geschäftlichen Anwendungen verläuft die Entwicklung von Branche zu Branche in unterschiedlicher Intensität. Während Spracherkennungstechnologien zum Beispiel im Bereich der Anwaltskanzleien bereits stark verbreitet sind, findet man sie bei Steuerberatern bisher seltener. Der Grund liegt auf der Hand: Steuerberater müssen nicht individuell umfangreiche Mandantenschreiben aufsetzen, die schriftliche Korrespondenz hält sich in Grenzen, nicht zuletzt sind viele Schreiben standardisiert. Nichtsdestotrotz können Spracherkennungslösungen auch die Prozesse innerhalb einer Steuerkanzlei spürbar beschleunigen.

„Steuerberater nutzen Spracherkennungslösungen vor allem für Dokumentationszwecke, beispielsweise Aktennotizen oder Gesprächsprotokolle. Auch E-Mail ist ein wichtiges Einsatzfeld“, erläutert Jens Müller, Marketing- und Vertriebs-Chef des Softwareanbieters datatronic beka technologies in Osnabrück. Das Unternehmen ist Datev-Softwarepartner und bietet unter anderem eine Diktiersoftware mit Spracherkennung. Mehr als 40 Prozent der Anwender dieser Lösung sind Steuerberater.

Auf steuerrechtlichen Wortschatz achten

Noch vor einigen Jahren mussten Spracherkennungslösungen stundenlang trainiert werden, bevor man mit ihnen arbeiten konnte. Der Nutzer musste der Anwendung langwierig vorgefertigte Texte vorlesen, um die Software an seine Sprache zu gewöhnen und zunächst ein Sprachprofil aufzubauen. Dies ist heute anders; die Technologie hat einen Quantensprung erfahren. Wer heute eine Spracherkennungssoftware einsetzen möchte, kann sofort mit seinem Diktat starten. Im Laufe der Nutzungszeit erstellt die Software das Sprachprofil. Gleichzeitig lernt sie mit jedem Diktat hinzu. Falsch verstandene Worte können manuell korrigiert werden und nach nochmaliger Prüfung in den Wortschatz übernommen werden. Von einer ungeprüften Übernahme neuer Wörter ins Stammvokabular raten Experten ab, um Folgefehler auszuschließen.

Bei der Auswahl der passenden Spracherkennungslösung sollten Steuerberater darauf achten, dass die Software bereits mit einem steuerrechtlichen Wortschatz ausgestattet ist. Zwar lässt sich auch jede Lösung mit allgemeinen Wortschatz nach und nach auf den beruflichen Stand bringen, aber jeden Fachbegriff händisch in den Wortschatz aufzunehmen, wäre sehr aufwendig und zeitintensiv. Ist die Lösung mit Fachvokabular ausgestattet, muss der Steuerberater weniger eingreifen. Das System kennt bereits die Fachbegriffe. Lediglich an seine Stimme muss es gewöhnt werden. Bei der Lösung von datatronic dauert es beispielsweise maximal eine Woche, bis eine Anwendung sich optimal auf die Stimme und Aussprache des Diktierenden eingestellt hat. „Meist ist dies sogar viel schneller der Fall, mitunter sogar sofort – je nachdem, wie stark die Stimme des Nutzers bereits dem vorprogrammierten Basis-Stimmprofil entspricht“, erläutert Sprachexperte Müller. Je größer die Ähnlichkeit, desto weniger muss sich die Software anpassen.

Spracherkennung – Learning by Doing

Soll an PC oder Laptop diktiert werden, empfehlen Experten entweder ein Diktiermikrofon zu benutzen, oder noch besser ein Headset, da hier der Abstand zwischen Mikro und Mund stets gleich ist und somit auch die Sprachqualität nicht schwankt. Um unterwegs zu diktieren, verwendet man üblicherweise ein Diktiergerät oder sein Smartphone. Das Smartphone fungiert dabei in der Regel nur als Diktiergerät, die Spracherkennung findet dann auf einem PC statt. Dazu verarbeitet die Spracherkennungssoftware die zuvor erstellte Diktatdatei. Manche Hersteller bieten auch eine Online-Spracherkennung an. In diesem Fall sollte darauf geachtet werden, dass sich der Serverstandort in Deutschland befindet und alle gesetzlichen Anforderungen in Bezug auf Datenschutz und Datensicherheit erfüllt werden.

Die Kosten für eine Spracherkennung können sehr unterschiedlich sein, da Lösungen oft nicht einzeln angeboten, sondern mit einer Diktiersoftware verknüpft werden. Einige Hersteller erheben eine Lizenzgebühr, andere Lösungen sind im monatlichen Abonnement erhältlich. Je nach Umfang der bisherigen Schreibarbeiten kann sich dies jedoch schnell rentieren. Laut Müller kann das Sekretariat einer Steuerkanzlei mit einer Spracherkennungslösung bis zu 50 Prozent der Zeit einsparen, die für ein händisches Abtippen von Diktaten nötig wäre. Sein Tipp, damit eine Spracherkennung optimal performt: Diktieren, diktieren, diktieren.

Karsten Zunke

Kleiner Alltagshelfer: Das kann eine Spracherkennungssoftware

Spracherkennung erlebt ein Revival

Automatische Spracherkennung: Datensicherheit und Datenschutz an erster Stelle

Steuerberater nutzen Spracherkennung für Dokumentationszwecke

Spracherkennung – Learning by Doing