Sie sind hier
E-Book

Speech Application SDK mit ASP.NET

Design und Implementierung sprachgestützter Web-Applikationen

AutorAchim Zeeck
VerlagSpringer-Verlag
Erscheinungsjahr2006
Seitenanzahl361 Seiten
ISBN9783540280866
FormatPDF
KopierschutzDRM
GerätePC/MAC/eReader/Tablet
Preis46,99 EUR

Das Speech Application SDK ermöglicht den Aufbau von sprachgestützten Web-Applikationen innerhalb des .NET-Frameworks.

Im vorliegenden Buch wird die Implementierung entsprechender Programme anhand fundierter und praxisnaher Code-Beispiele dargestellt. Als Werkzeuge werden das .NET Framework 1.1 und das aktuelle SASDK 1.0 zum Einsatz kommen, wobei die einzelnen Komponenten des Visual Studio 2003 ebenso beschrieben werden wie auch SML (Semantic Markup Language) und SALT (Speech Application Language Tags) sowie JScript/JScript.NET und C#. Hierbei soll das Verständnis dieser Technologien für den Aufbau und Einsatz von sprachgestützten, Web-basierten Applikationen im Vordergrund stehen.

Ferner werden Tipps und Tricks aufgezeigt, die bei der Implementierung unter ASP.NET zu beachten sind. Der Leser sollte nach der Lektüre des Buches in der Lage sein, selbständig sprachgesteuerte Web-Applikationen entwickeln zu können.



Studium der Betriebswirtschaft an der FH Mainz, Fachbereich Wirtschaftsinformatik,
Abteilung Wirtschaftswissenschaften. Abschluß: Diplom-Betriebswirt (FH)

Seit 1983 im IT-Umfeld tätig Sun Certified Java Programmer

Mehrjährige Tätigkeiten in deutschen und amerikanischen Unternehmen als Softwareentwickler, Projektleiter und Trainer, u.a. in den Bereichen Multimedia, Finanzsoftware, Content Management Programmierfokus: Java, C++, C#

Derzeit freiberuflicher Technologieberater, Trainer und Softwareentwickler mit dem Schwerpunkt .NET Fokussierung auf die Bereiche Mobility und Speech Sprecher auf Konferenzen

Veröffentlichung von Artikeln in einschlägigen Fachzeitschriften Co-Initiator und Co-Betreiber der .NET Usergroup Hamburg (INETA member)

Kaufen Sie hier:

Horizontale Tabs

Leseprobe

12 Voice-only Applikationen (S. 285-286)

Voice-only Applikationen sind die „klassische" Umsetzung, wenn es um ausschließlich sprachgestützte Anwendungen geht. Während multimodale Anwendungen derzeit noch nicht so sehr verbreitet sind (aber ein sehr großes Potential bergen), werden Ihnen sicher viele aktuelle Beispiele einfallen, in denen Sie sich schon einmal mithilfe Ihrer Stimme oder per Telefontastatur mit einem Sprachcomputer „unterhalten" haben (oder unterhalten mussten) – entweder bei Buchungen und Reservierungen (Flug/Zug), bei Banktransaktionen oder Serviceanfragen von IT-Dienstleistern. Für den Nutzer dieser Dienste ist es wichtig, komfortabel, sicher und vor allem schnell zum gewünschten Ergebnis zu kommen, da diese Systeme meistens nur unter kostenpflichtigen Servicerufnummern betrieben werden.

12.1 Betrachtung unterschiedlicher Systemtypen
Bei der Entwicklung sprachgestützter Webapplikationen lässt sich keine Aussage über ein pauschales Konzept treffen, sozusagen eine Blaupause, die immer und überall einsetzbar ist. Dazu gibt es zu viele unterschiedliche Einflussfaktoren und entsprechend zahlreiche Varianten für eine Umsetzung. Ein Parameter muss jedoch als Grundlage für die zu entwickelnde Anwendung feststehen: Der Systemtyp, dessen Festlegung maßgeblich Einfluss auf die weitere Gestaltung hat. Nachfolgend werden die wesentlichen Systemtypen des Oberbegriffs „Voice-only Applikation" betrachtet.

Dual tone multi frequency (DTMF)

Anwender, die in Kontakt mit einem DTMF-Interface treten, haben in der Regel nur über das Tastentelefon (bzw. dessen Töne) die Möglichkeit, innerhalb der Anwendung zu navigieren. Geführt werden Sie durch Sprachausgaben mit einer natürlich oder – immer seltener – synthetisch klingenden Stimme.

Interactive voice response (IVR)

Diese Systeme werden meistens mit DTMF-Anwendungen gleichgesetzt, auch sie reagieren auf Tastentöne und erlauben manchmal zusätzlich die Eingabe von Sprachbefehlen. Ein IVR ist normalerweise die Vorstufe zu einem Callcenter, um einerseits vor der Weiterleitung an einen Agenten (Sachbearbeiter) gezielte Informationen zu kanalisieren und andererseits die Mitarbeiter sowie die Vermittlung zu entlasten.

Natural language (NL)

Natürlichsprachliche Dialogsysteme (Konversationssysteme) sind die bislang am weitesten entwickelte Form der Mensch-Maschine-Kommunikation auf sprachlicher Basis. Der größte Vorteil ist der – wie der Name bereits ausdrückt – natürliche Austausch von Informationen, genauer gesagt, die Art und Weise, wie Mensch und Maschine miteinander umgehen. Durch entsprechend umfangreiche Grammatikbibliotheken sind die NLSysteme (oder auch NDS) in der Lage, aus längeren Sätzen die relevanten Kerninformationen herauszufiltern und zu verarbeiten. Im Gegenzug wird der Anwender nicht mit stakkatoartigen Befehlen oder Ansagen konfrontiert, sondern ebenfalls mit umgangssprachlichen Sätzen. Die Aufzeichnungen sind oft sehr hochwertig und von professionellen Sprechern vorbereitet, was diese Systeme zusätzlich aufwertet.

Multimodal open microphone

Die Zukunft wird sicherlich in der Nutzung multimodaler Anwendungen unter Einsatz völlig freier, umgangssprachlicher Sätze bestehen, und zwar zu jeder Zeit an jedem Ort mit jedem sprach- und webtauglichen (mobilen) Gerät. Bislang scheitet die Umsetzung sowohl an den Bandbreiten als auch an den zur Verfügung stehenden Geräten, außerdem sind viele technische Voraussetzungen noch unklar, unter anderem Sicherheitsaspekte (security options), Personalisierung, Transaktionsverwaltung (transaction handling) oder auch Sitzungsmanagement (session management). Doch durch die rapide Entwicklung in diesen Segmenten – zum Beispiel im Bereich Voice over IP (VoIP) oder drahtlosen Netzen (WLANs) – und der zunehmenden Miniaturisierung wird es diese Systeme wohl in absehbarerer Zukunft zu erschwinglichen Preisen und in tragbaren Kleidungsstücken eingenäht geben, vielleicht die Killerapplikation der nächsten Jahre?

Inhaltsverzeichnis
Widmung6
Vorwort8
Inhaltsverzeichnis10
1 Spracherkennung und Sprachsteuerung18
1.1 Entwicklung der Spracherkennungssysteme19
1.2 Desktopbasierte Sprachsteuerung20
1.3 Webbasierte Sprachsteuerung21
1.4 Erweiterungen von Webseiten durch SALT21
1.5 Vergleichende Betrachtung von SALT und VoiceXML23
Teil 1 Das Speech Application SDK ( SASDK)26
2 Entwicklungshistorie28
2.1 Von COM zu .NET28
2.2 Die Entwicklung des SASDK30
2.3 Microsoft Speech Server (SES, TAS und TIM)35
3 Überblick über die Einsatzmöglichkeiten38
3.1 Multimodale Applikationen38
3.2 Voice-only Applikationen40
3.3 DTMF-Applikationen45
4 Installation und Anpassung48
4.1 Hardware- und Softwarevoraussetzungen48
4.2 Installation von EIF und SASDK50
5 Speech Controls im Visual Studio .NET60
5.1 Basic Speech Controls60
5.2 Dialog Speech Controls73
5.3 Application Speech Controls95
5.4 Call Management Controls121
6 Wizards, Editors und andere Tools136
6.1 Erstellen des Applikationsgerüsts136
6.2 Integrierte Tools139
6.3 Externe Tools158
Teil 2 Programmieren mit dem SASDK172
7 Sprachverarbeitung und Debugging174
7.1 Speech Application Language Tags (SALT)174
7.2 Laufzeitobjekte182
7.3 Scriptfunktionen190
7.4 Debugging195
7.5 Benutzereingaben197
8 Überprüfen von Eingaben214
8.1 Integrierte Validierung214
8.2 Vergleichende Validierung221
8.3 Benutzerdefinierte Validierung222
9 Arbeiten mit Grammatiken226
9.1 Das XML Grammar Format226
9.2 Grammatikelemente und Zuordnungen227
9.3 Aufbau einer SML-Grammatikstruktur235
9.4 Testen und Zuordnen von Grammatiken241
9.5 SML-Struktur und XPath244
9.6 Die Speech Grammar Libraries246
10 Prompts und die Prompt-Datenbank248
10.1 Synthetische Prompts249
10.2 Natürlichsprachliche Prompts251
10.3 Arbeiten mit Prompt-Funktionen274
10.4 Prompt-Optionen in Speech Controls279
10.5 Verwendung spezieller Prompt Controls283
Teil 3 Designkriterien und Best Practices292
11 Multimodale Applikationen294
11.1 Unterschiede zu Telefonieapplikationen294
11.2 Typische Umsetzungsvarianten295
11.3 Zusätzliche Anwendungsoptionen295
11.4 Anforderungs- und Umsetzungskriterien296
12 Voice-only Applikationen300
12.1 Betrachtung unterschiedlicher Systemtypen300
12.2 Der Projektlebenszyklus301
12.3 Dialogorganisation und Dialogfluss306
13 Tuning, Tipps und Tricks316
13.1 TASim und die Speech Debugging Console316
13.2 Optimieren der Qualität natürlichsprachlicher Prompts316
13.3 Kompilieren von Grammatikdateien317
13.4 Weitere Einsatzmöglichkeiten bei Grammatiken319
13.5 Verbessern der Erkennungsrate321
13.6 Normalisierung von Daten325
13.7 Globale Applikationseinstellungen328
Anhang A Speech Controls Einstellungen und Parameter332
14 Timeouts334
14.1 InitialTimeout335
14.2 BabbleTimeout335
14.3 EndSilence336
14.4 MaxTimeout336
14.5 FirstInitialTimeout337
14.6 ShortInitialTimeout337
14.7 Timer338
15 Events340
15.1 Client-side events340
15.2 Server-side events351
16 Thresholds356
16.1 ConfirmThreshold356
16.2 ConfirmRejectThreshold357
16.3 RejectThreshold357
16.4 AcceptRejectThreshold358
16.5 DenyRejectThreshold358
16.6 AcceptCommandThreshold359
Anhang B Webverweise360
Anhang C Index364

Weitere E-Books zum Thema: Programmiersprachen - Softwareentwicklung

ASP.NET Shortcut

E-Book ASP.NET Shortcut
Format: PDF

Shortcut-Tipps für ASP.NET-Profis Die neue .NET-Version der Active Server Pages stellt eine Umgebung zur Entwicklung von Web-Applikationen im .NET-Framework bereit. Viele aus der Desktop-…

ASP.NET Shortcut

E-Book ASP.NET Shortcut
Format: PDF

Shortcut-Tipps für ASP.NET-Profis Die neue .NET-Version der Active Server Pages stellt eine Umgebung zur Entwicklung von Web-Applikationen im .NET-Framework bereit. Viele aus der Desktop-…

ASP.NET Shortcut

E-Book ASP.NET Shortcut
Format: PDF

Shortcut-Tipps für ASP.NET-Profis Die neue .NET-Version der Active Server Pages stellt eine Umgebung zur Entwicklung von Web-Applikationen im .NET-Framework bereit. Viele aus der Desktop-…

Programmieren lernen in PHP 5

E-Book Programmieren lernen in PHP 5
Format: PDF

Mit der Version 5 erreicht PHP einen bemerkenswerten Reifegrad, der PHP zu einer festen Größe in der Welt der Webprogrammierung macht. Gerade die leichte Erlernbarkeit macht PHP zur idealen…

Mathematik für Informatiker

E-Book Mathematik für Informatiker
Format: PDF

Die Informatik entwickelt sich in einer unglaublichen Geschwindigkeit. Häufig ist die Mathematik Grundlage von Neuerungen. Deshalb ist sie unverzichtbares Werkzeug jedes Informatikers und Pflichtfach…

Mathematik für Informatiker

E-Book Mathematik für Informatiker
Format: PDF

Die Informatik entwickelt sich in einer unglaublichen Geschwindigkeit. Häufig ist die Mathematik Grundlage von Neuerungen. Deshalb ist sie unverzichtbares Werkzeug jedes Informatikers und Pflichtfach…

Mathematik für Informatiker

E-Book Mathematik für Informatiker
Format: PDF

Die Informatik entwickelt sich in einer unglaublichen Geschwindigkeit. Häufig ist die Mathematik Grundlage von Neuerungen. Deshalb ist sie unverzichtbares Werkzeug jedes Informatikers und Pflichtfach…

Weitere Zeitschriften

Menschen. Inklusiv leben

Menschen. Inklusiv leben

MENSCHEN. das magazin informiert über Themen, die das Zusammenleben von Menschen in der Gesellschaft bestimmen -und dies konsequent aus Perspektive der Betroffenen. Die Menschen, um die es geht, ...

ARCH+.

ARCH+.

ARCH+ ist eine unabhängige, konzeptuelle Zeitschrift für Architektur und Urbanismus. Der Name ist zugleich Programm: mehr als Architektur. Jedes vierteljährlich erscheinende Heft beleuchtet ...

aufstieg

aufstieg

Zeitschrift der NaturFreunde in Württemberg Die Natur ist unser Lebensraum: Ort für Erholung und Bewegung, zum Erleben und Forschen; sie ist ein schützenswertes Gut. Wir sind aktiv in der Natur ...

caritas

caritas

mitteilungen für die Erzdiözese FreiburgUm Kindern aus armen Familien gute Perspektiven für eine eigenständige Lebensführung zu ermöglichen, muss die Kinderarmut in Deutschland nachhaltig ...

DULV info

DULV info

UL-Technik, UL-Flugbetrieb, Luftrecht, Reiseberichte, Verbandsinte. Der Deutsche Ultraleichtflugverband e. V. - oder kurz DULV - wurde 1982 von ein paar Enthusiasten gegründet. Wegen der hohen ...

building & automation

building & automation

Das Fachmagazin building & automation bietet dem Elektrohandwerker und Elektroplaner eine umfassende Übersicht über alle Produktneuheiten aus der Gebäudeautomation, der Installationstechnik, dem ...

filmdienst#de

filmdienst#de

filmdienst.de führt die Tradition der 1947 gegründeten Zeitschrift FILMDIENST im digitalen Zeitalter fort. Wir begleiten seit 1947 Filme in allen ihren Ausprägungen und Erscheinungsformen.  ...