Efagundes.com Projetos Ecoeficientes


Qual o estágio do reconhecimento de voz?

O amadurecimento da tecnologia de reconhecimento de voz gerará novas aplicações empresariais, principalmente na área de CRM – Customer Relationship Management. Existem várias soluções que demonstram a viabilidade da tecnologia e são ofertadas através de tecnologias proprietárias. Isso poderá trazer incompatibilidade e ineficiência na integração com outros produtos no futuro. As empresas que decidirem implementar soluções de reconhecimento de voz, sem um plano estratégico, adquirirão um grande número de produtos e plataformas e investir em treinamento. E apesar de tudo, provavelmente, terão produtos incompatíveis no futuro. Entretanto, adquirirão uma forte experiência no uso da tecnologia que será importante quando a tecnologia estiver pronta para uso em larga escala. A solução para proteger o investimento é definir uma estratégia de implementação da tecnologia de reconhecimento de voz dentro de uma abordagem consistente.

O problema é que ainda não existe uma abordagem consistente para ser adotada. Cada empresa possui seus próprios requerimentos e isso exige soluções diferenciadas.  A melhor alternativa no momento é criar um grupo técnico para acompanhar o desenvolvimento da tecnologia e ir adotando soluções que convirja para um padrão, mesmo que interno, que garanta a compatibilidade entre as aplicações.  Esse grupo deve ter representantes de várias da empresa, principalmente de pessoas do departamento responsável pelo CRM.  Esse grupo multifuncional será importante para disseminar a tecnologia dentro da empresa, além de quebrar barreiras internas de implementação, principalmente na substituição de funções que hoje são feitas manualmente.   Esse grupo deve estar atento aos novos lançamentos do mercado e a evolução da tecnologia. 

O desenvolvimento e manutenção de aplicações de reconhecimento de voz exigem um grande conhecimento técnico. Esse conhecimento, num primeiro estágio, deve ser transferido do fornecedor do produto para os especialistas internos. Essa experiência é importante para garantir a integração das aplicações internas dentro da empresa. 

O desenvolvimento interno deve ser considerado em empresas de grande porte ou onde o reconhecimento de voz seja considerado “core business”.  Para as empresas menores uma alternativa é o uso de consultorias ou empresas de outsourcing. 

As empresas devem definir uma arquitetura de reconhecimento de voz e um plano de curto, médio e longo prazo.  Esse plano de contemplar ações para um e dois anos e, se possível, para os próximos três anos.  Um ponto chave a ser definido é se a empresa adotará um padrão aberto internacional ou se apoiará na estratégia de um fornecedor.

A vantagem da adoção de um único fornecedor é a garantia, na maioria dos casos, de compatibilidade na integração das aplicações. Entretanto, a estratégia de um único fornecedor pode limitar a adoção de novas aplicações que exijam outras tecnologias não desenvolvidas pelo fornecedor escolhido. Porém, adotar uma estratégia de padrão aberto requer um grande esforço, experiência e investimento por parte da empresa. 

Um ponto importante na estratégia é definir a infra-estrutura necessária para suportar o reconhecimento de voz. Isso incluir: URA – Unidade de Reconhecimento Audível, portais na Internet com suporte a voz, aplicações sem fio, PABX, áudio conferência, atendimento automático de chamadas, auxilio à lista telefônica e as tecnologias de troca de mensagens (e-mail, correio de voz e serviços integrados de mensagens – unified messaging).

Existem vários padrões de reconhecimento de voz em desenvolvimento, que incluem o VoiceXML,.  Esse padrão permite que múltiplas aplicações possam usar um mesmo browser com recursos de voz.  Outro padrão, ainda no estágio inicial de desenvolvimento, é o CCXML (Call Control XML) que permite o controle das chamadas dentro de uma rede de voz sobre IP, e o SALT (Speech Application Language Tags), um padrão que pretende ser adotado em vários tipos de equipamentos de voz.

O reconhecimento de voz é uma tecnologia complexa e deverá ser utilizada para integrar a voz em várias aplicações empresariais.  Isso requererá experiência para o desenvolvimento dessas aplicações.  As empresas deverão fazer investimentos para melhorar a infra-estrutura para uma integração total das aplicações e ter consciência que as soluções pontuais poderão ser de curto prazo, sem proteger os investimentos.