Jean Carlos Cunha

.:: Diferente e eficiente::.

Aplicações de Reconhecimento de Voz

Aqui vai um post sobre biometria .: aplicações de reconhecimento de voz..

A tecnologia de reconhecimento de voz tornou-se disponível em meados dos anos 90, finalmente se consolidando comercialmente e possibilitando sua utilização no mercado atual através de uma excelente relação custo/benefício. Este fato está fortemente atrelado a uma série de características que tornam o emprego desta nova tecnologia altamente atrativa.Com a disponibilidade de algoritmos que permitem o reconhecimento de linguagem, aliados às plataformas de alta disponibilidade e escaláveis – com funcionamento ininterrupto 24 horas por dia, 7 dias por semana, e a precisão nos acessos tanto via telefone fixo como celulares -, as empresas estão percebendo que é necessário uma inovação no seu atendimento para se destacar diante dos concorrentes.

No Brasil, existem aproximadamente 20 sistemas em produção utilizando o reconhecimento de voz. Destes, cerca de 1/3 são portais de voz, o que acaba causando uma certa confusão de nomenclatura.

Por definição, portais de voz são aplicações que acessam dados no mundo da Internet de maneira transparente (como ouvir seu e-mail por telefone), sua navegação utiliza comandos de browser, como palavras chaves e ataclhos, e, em uma única ligação, o usuário acessa várias informações e dados. Nem sempre todas aplicações podem ser chamadas de portais de voz.

Uma pesquisa do Evans Group, realizada com 250 clientes da Nuance, apontou que 83% dos usuários preferiam utilizar o reconhecimento de voz a discar e que 74% preferiam atendimentos dirigidos com utilização de reconhecimento de voz, em vez de falar com um atendente.

Uma consultoria do Reino Unido, a Ovum, estimou que o mercado global para sistemas de voz atingirá US$ 26 bilhões em 2005. Já o Kelsey Group calcula que apenas nos EUA este mercado será de US$ 12 bilhões em 2005.

O funcionamento básico do reconhecimento de voz resulta da integração entre uma placa com processadores digitais que realiza a captura e o tratamento do áudio falado, com um algoritmo especializado que ‘quebra” este áudio em pequenos pedaços: os fonemas (por isso deve existir um algoritmo especializado para cada linguagem, mesmo que haja aparentemente pequenas diferenças como o inglês americano e o britânico). Assim, cada som individual pode ser identificado e comparado a uma lista pré-definida de palavras ou frases que o usuário pode dizer.

O uso do reconhecimento de voz como interface de atendimento exibe uma série de vantagens em relação a outras tecnologias existentes.

A primeira, mais imediata, é o fato de a fala ser inerente ao ser humano e sua comunicação com o mundo exterior ser também natural e simples. Logo, por paralelismo, a utilização de sistemas de reconhecimento de voz é natural e simples. Além disso, a informação obtida pela máquina é diretamente introduzida nos computadores, eliminando a necessidade de uma interface pessoal e, conseqüentemente, o risco de introduzir erros nas informações e dados obtidos.

Outra vantagem é permitir um uso mais inteligente das árvores de atendimento, eliminando as limitações características das soluções que usam discagem (conhecidas como URAs). Basta a pessoa falar o comando necessário, sem a necessidade de haver menus com opção de discagem 1 para serviço X, 2 para serviço Y etc.

Geralmente, em uma plataforma de atendimento automatizada, são utilizados três algoritmos. O primeiro é o reconhecimento da fala (em inglês ASRAutomatic Speech Recognition), o “coração” da solução, sendo classificado em dois tipos:

  • Sistemas dependentes do usuário (speaker dependent), no qual reconhecem apenas a fala de determinado indivíduo (como os usados em agendas de telefones celulares);
  • Sistemas independentes do usuário (speaker independent), no qual reconhecem padrões aplicáveis a diversos indivíduos, sendo adequados para utilização no atendimento a inúmeras pessoas.O segundo algoritmo é a autenticação de voz, que possibilita identificar quem é o usuário, sem a necessidade do uso de senhas e PINs. A voz é uma biometria humana e sua autenticação baseia-se na análise de padrões harmônicos e não simplesmente na comparação entre reproduções de uma mesma fala, sendo uma alternativa segura contra tentativas de fraude.

    Por último, o text-to-speech (texto-para-voz) é o algoritmo que permite a “verbalização” de textos. Isto viabiliza, por exemplo, ouvir um e-mail através do telefone. Existem duas técnicas básicas de conversão de texto em voz:

    1 – Sintetização, o algoritmo analisa o conjunto de palavras do texto e sintetiza os sons correspondentes aos fonemas necessários para a verbalização;

    2 – Concatenação, o algoritmo analisa o texto submetido e define uma seqüência de fonemas pré-gravados que, quando concatenados, reproduzem em som o texto em questão.

    A automação do atendimento pode ser empregada em uma série de aplicações. Na área de entretenimento e informação é possível constatar a criação de produtos que disponibilizam conteúdos, utilizando menus de fácil navegação e grande interatividade entre usuário e sistema (como, por exemplo, leitura de e-mail, acesso a agendas, discagem ativada por voz, horóscopo, previsão de tempo, notícias e novelas).

    Outro tipo de aplicação é o acesso à informação, na qual o usuário pode saber, por exemplo, os horários de vôos e partidas de ônibus/aviões. Outros exemplos típicos são os produtos bancários, voice-commerce, preenchimento de fichas de visitas para vendedores e outros serviços que registram e consultam informações em bases de dados.

    As possibilidades e flexibilidades do reconhecimento de voz têm levado uma série de empresas, de diversos setores, a optar por esta tecnologia em seus sistemas de atendimento.

    A facilidade do uso da voz como interface pode resultar em inúmeros desdobramentos positivos, tais como redução de custos operacionais, aumento da segurança, criação de novos produtos, maior fidelização do cliente, criação/manutenção de imagem de modernidade, avanço tecnológico e, por fim, aumento de receitas.

  • Click nas dicas abaixo.
    Apostilas gratis
    Livros Gratis
    Tutorias Gratis

    Uma resposta para “Aplicações de Reconhecimento de Voz

    1. Suza 31 de março de 2009 às 5:06 pm

      Estou fazendo a minha monografia sobre APLICAÇÃO DO RECONHECIMENTO DE VOZ, gostaria de saber se alguem tem artigos ou algum material sobre esse assunto se tiverem por favor enviem pra mim, no email suzamaramoura@yahoo.com.br.E muito obrigada por essas informações!!!!!!!!

    Deixe uma resposta

    Preencha os seus dados abaixo ou clique em um ícone para log in:

    Logotipo do WordPress.com

    Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

    Imagem do Twitter

    Você está comentando utilizando sua conta Twitter. Sair / Alterar )

    Foto do Facebook

    Você está comentando utilizando sua conta Facebook. Sair / Alterar )

    Foto do Google+

    Você está comentando utilizando sua conta Google+. Sair / Alterar )

    Conectando a %s

    %d blogueiros gostam disto: