Dzwoniłeś kiedyś do Biura Obłsugi Klienta swojego banku, aby dowiedzieć się jakie masz saldo konta? Ja wielokrotnie miałem tą przyjemność. Niegdyś taka operacja trwała dość długo. W dzisiejszych czasach bardzo szybko możemy dowiedzieć się jakie jest aktualne saldo naszego konta dzięki zastosowaniu syntezy mowy, ale o tym napiszę na końcu. Wpierw przedstawię jak to działało w przeszłości.

Kiedyś odbywało to się w ten sposób, że należało zadzwonić do BOK i cierpliwie czekać, aż ktoś “z tamtej strony” odbierze nasz telefon. Następnie przychodził czas na autoryzację, czyli podawanie numeru PESEL, seria i nr dowodu osobistego oraz nazwisko panieńskie matki. Dopiero po tych zmaganiach Konsultant czytał przez telefon kwotę salda widniejącą w systemie. Nie wiem czy jeszcze są banki, które jeszcze tak robią, miejmy nadziej, że nie.

Spotkałem się również z rozwiązaniem opartym na nagraniach lektorskich. Polega to na tym, że tworzymy nagrania, w których lektor czyta ciągi cyfr. Następnie ta baza plików audio są dzielone na małe fragmenty i sklejane przy odczytywaniu salda konta, np. kwotę 1234 taki system przeczyta nam jako 4 osobne cyfry - ‘tysiąc’ ‘dwieście’ ‘trzydzieści’ ‘cztery’. Niestety to daje bardzo mizerny efekt.

Czas na syntezator mowy opisany na początku- jakie daje możliwości w stosunku do powyższego? Na pewno jest rozwiązaniem jakościowo znacznie lepszym, o czym możecie się przekonać na stronie say.expressivo.com gdzie można przetestować tą technologię na dowolnym tekście.

Warto również dodać, że text-to-speech (TTS) daje ogromną elastyczność, ponieważ program ten przeczyta dowolny tekst, naprawdę dowolny! Dla testów wpisz na powyższej stronie słowo “kasztypki”lub “na koncie masz 1200356 złotych” ;)

Jakie są inne korzyści? Najważniejszą korzyścią dla firm wykorzystujących tą technologie w biurach obsługi klienta to odciążenie agentów siedzących w CallCenter, ponieważ gro ich obowiązków przejmuje właśnie zautomatyzowany system obsługi klienta korzystający z TTS. Oprócz salda konta można wykorzystać tą technologię do czytania ostatnich operacji na koncie (daty, odbiorcy) czy też odczytać informację o wszczęciu postępowania egzekucyjnego. Możliwości jest od groma, a ide jedna - zaoszczędzony czas agentów przeznaczyć na inne czynności.

Od strony technicznej wygląda to w następujący sposób. Potrzebujemy platformę IVR (Interactive Voice Response), która jest podłączona do różnych baz danych w banku. Następnie integrujemy z IVRem na przykład syntezator mowy IVONA Telecom i dzięki temu w telefonicznym biurze obsługi klient możemy odczytać przez telefon… tak naprawdę wszystko.

Dodam jeszcze, że taki system jest niesamowicie skalowalny dzięki zastosowaniu protokołu MRCP, ale o tym innym razem.