Apesar de todos os avanços na tecnologia, a desestruturação dos dados continua a ser uma preocupação para muitos negócios. A verdade é que esta desestruturação é, no fundo, uma oportunidade que ainda não foi totalmente explorada. E é precisamente aqui que entra o processamento de linguagem natural ou natural language processing (NLP).
Desestruturação dos dados: uma oportunidade por explorar
Todos os dias, em todo o mundo, são produzidos mais de 2,5 quintiliões de novos dados. Dados, na sua maioria, desestruturados.
Apesar das inúmeras possibilidades de utilização, estes dados são subutilizados devido à sua complexidade de análise. No final das contas, conclui-se que as empresas apenas aproveitam 8% dos dados gerados.
Um dos principais motivos para a desestruturação dos dados é o chamado texto em linguagem natural que as máquinas até então não tinham capacidade para entender. Textos de blogs, textos de publicações em redes sociais e até textos de e-mails são alguns exemplos. A produção deste tipo de texto nas mais variadas plataformas digitais está a aumentar de dia para dia, situação que representa uma oportunidade de ouro para as empresas – nomeadamente empresas digitalmente mais avançadas.
Mas como podem as empresas acrescentar valor ao negócio através desta desestruturação de dados potenciada pelo texto em linguagem natural? É o que me proponho a responder ao longo deste artigo.
O processamento de linguagem natural
O processamento de linguagem natural ou natural language processing (NLP) é um dos ramos da inteligência artificial focado na análise da linguagem natural. A linguagem natural, ou humana, refere-se ao tipo de linguagem que utilizamos no nosso dia-a-dia.
Pensemos no processamento de linguagem natural da seguinte forma:
Todos os dias as pessoas proferem milhares e milhares de palavras que outras pessoas interpretam no sentido de tomarem uma determinada ação. Na teoria, e porque somos humanos, assumimos este processo como um processo de comunicação simples que não exige qualquer ginástica mental. No entanto, a verdade é que as palavras e as construções frásicas são muito mais profundas e têm muito mais poder que um simples processo de comunicação em que o recetor recebe uma mensagem e toma uma ação.
A comunicação diária levada a cabo pelas pessoas varia imenso, quer pelo seu contexto, pela linguagem não verbal, pelo tom de voz ou até quer pela frequência com que se repetem palavras ou expressões. E esta comunicação, desde o aparecimento da Internet, tem sido transportada a uma grande escala para o digital.
O processamento de linguagem natural (ainda) não se baseia no tom de voz, mas sim em padrões contextuais. Como podemos observar na imagem seguinte, através de uma simples mensagem, a máquina conseguiu identificar sete informações úteis e que irá usar para responder da forma mais ajustada.
E se os computadores interpretassem textos? Da utopia à realidade
Desde o primeiro computador da história, que os programadores inventam e reinventam códigos que sirvam para simplificar processos e otimizar o trabalho das pessoas. Fazer com que os computadores interpretassem textos era, há uns anos, algo inconcebível e impossível de alcançar. Hoje, e graças ao processamento de linguagem natural, o caso muda de figura!
No entanto, e no campo do entendimento da linguagem humana, os computadores nunca irão ultrapassar os humanos.
Como funciona o processamento de linguagem natural?
Como já referi acima, o processamento de linguagem natural é um dos ramos da inteligência artificial que analisa e interpreta a linguagem natural das pessoas.
Esta tecnologia está baseada em sistemas cognitivos como o Watson (IBM), a Alexa (Amazon), a Siri (Apple), a Cortana (Microsoft) ou o Google Assistant (Google). É a partir da sua estrutura baseada em inteligência artificial que se processa a NLP. Contudo, e muito importante, estes sistemas cognitivos não são autónomos sendo que precisam de ser ensinados por nós, humanos, numa primeira fase da sua aprendizagem. Isto é, têm a capacidade de aprendizagem mas não têm o conhecimento.
De uma forma mais conceptual, estas são as principais diretrizes pelas quais o processamento de linguagem natural se baseia, por ordem.
- 1. Segmentação frásica: o primeiro passo é a divisão do bloco de texto em frases. Um dos “códigos” mais comuns que alertam para a mudança de frase é o ponto final. Fácil, menos para os textos de José Saramago.
- 2. Separação de palavras: o segundo passo passa por isolar as palavras. Este é, igualmente, um básico. Sempre que existir um espaço entre caracteres (pontuação incluída) significa que foi detetada uma palavra.
- 3. Previsão do discurso: este é o passo que marca a passagem do básico para o rebuscado. É o passo em que o computador analisa cada palavra de forma a conhecer o seu papel na frase como um todo – se é um nome, um substantivo, um pronome, um verbo, etc. É aqui que começamos a perceber o tema do qual se está a falar.
- 4. Ir à raiz da palavra: tecnicamente chamado o processo de lemmatization, este é um passo crucial para o real entendimento da mensagem. Nesta fase, o computador avalia todas as variantes de uma só palavra como, por exemplo, conjugação de verbos e plurais (“anel” e “anéis” são tecnicamente palavras diferentes mas, na prática, significam o mesmo).
- 5. Eliminação de ruído: o computador deve reconhecer as palavras que, efetivamente, vão passar uma mensagem (as stop words) e eliminar todas as que apenas estão para dar sentido (normalmente “o”, “a”, “que”, “de”, etc.). Um exemplo prático: “Lisboa é a capital de Portugal” – “é”, “a” e “de” são ruído.
- 6. Encontrar dependências: o sexto passo passa por descobrir como todas as palavras que compõem a frase se relacionam umas com as outras. No exemplo acima, o verbo ser (“é”) está relacionado com o nome próprio (“Lisboa”).
- 7. Reconhecimento e identificação de entidades: é aqui que dizemos adeus à gramática e começamos a extrair ideias e significados. Por exemplo, “Lisboa” e “Portugal” representam dois lugares reais, logo, seriam identificados como uma entidade geográfica. O objetivo deste reconhecimento não passa apenas pelo aumento do campo lexical do computador, como para a realização de estatísticas no âmbito do estudo de como e em que contexto as palavras são utilizadas. Como sabemos, palavras iguais em contextos diferentes podem não significar o mesmo.
- 8. Identificar referências: a língua portuguesa (e não só) utiliza imensos pronomes – “ela”, “ele”, “lá”, “isso”, etc. Os pronomes existem para que não tenhamos de estar constantemente a utilizar os nomes em cada frase. Este é um exercício simples para um humano que rapidamente consegue identificar sobre o quê ou quem se está a falar, uma vez que está contextualizado. Sendo que um computador apenas analisa uma frase de cada vez, este é um exercício extremamente complicado… mas possível. Este passo está baseado em outra vertente da inteligência artificial, o deep learning, ainda em processo de otimização.
Como usar o processamento de linguagem natural em benefício dos negócios?
O que acontece quando está a escrever uma mensagem no seu smartphone? A partir do momento em que insere a primeira letra, a palavra que quer escrever não aparece sugerida quase como por magia? Este é um exemplo prático e comum daquilo que o processamento de linguagem natural pode fazer por nós, pessoas.
Na verdade, é algo que assumimos como garantido e que não trocaríamos por nada. Afinal, usamos esta funcionalidade dos nossos smartphones quase sem nos apercebermos. Este é um dos muitos motivos que fazem do processamento de linguagem natural algo tão importante!
E é essa importância e essa cultura de simplificação associada à NLP que tem captado a atenção dos negócios. Enquanto consultor ligado à transformação digital nas empresas, identifiquei alguns dos benefícios e utilidade que a NLP traz aos negócios.
1. Diferenciação
Para mim, um dos mais importantes. Os negócios destacam-se pela sua diferenciação e o processamento de linguagem natural, com um toque de criatividade à mistura e aliado à estratégia certa, pode resultar em ações que efetivamente se destaquem.
2. Personalização do atendimento
Se pensarmos no consumidor atual (e qui foco-me mais em negócios B2C), conseguimos perceber que, a par dos seus hábitos cada vez mais digitais, é muito mais exigente e impaciente. O consumidor atual quer os seus problemas resolvidos na hora e não admite perder tempo com formulários de apoio ao cliente ou chamadas para linhas de apoio que, na maioria das vezes, nem resolvem o problema à primeira. O processamento de linguagem natural surge como uma solução ao atendimento ao cliente no sentido de que pode aprender a identificar as principais necessidades dos clientes e resolvê-las na hora – a longo prazo de forma totalmente autónoma.
3. Otimização da experiência do utilizador (UX)
Na mesma ótica de pensamento da personalização do atendimento, um bot interativo poderá ser uma melhor experiência do que um formulário que necessita de preenchimento. E não serve só para o atendimento, serve para vendas, pós-venda e até angariação de novos clientes.
4. Redução de custos
Para que serve a tecnologia? Para simplificar processos. Ao simplificar processos estamos, certamente, a rentabilizar recursos, quer técnicos como humanos. Já pensou como a recolha de dados se pode tornar muito mais auto-suficiente do que uma equipa inteira a rever documentos, processos e folhas intermináveis de excel?
5. Satisfação do cliente
Novamente no seguimento dos pontos 2 e 3, hoje em dia os consumidores querem tratar de tudo o mais rápido possível e, de preferência, sem muito esforço. Usado de forma inteligente, como por exemplo um chatbot que eleve a capacidade da NLP ao extremo – para além de entender as intenções, entende sentimentos, – estará a contribuir positivamente para a satisfação dos seus clientes.
6. Disponibilização de dados
Recorda-se de mencionar a desestruturação dos dados como um dos grandes desafios da era digital para as empresas? Pois bem, a recolha de dados mais reais e mais credíveis, capazes de ditar a melhor estratégia para o seu negócio, é possível com NLP.
7. Motivação de equipas
Sim, leu bem. O processamento de linguagem natural retira a responsabilidade de trabalhos mais mecânicos permitindo que as equipas realizem trabalhos mais interessantes e mais produtivos.
“Só quando as máquinas entenderem a ironia”
Não é segredo que existe um sentimento de receio e desconfiança perante os robôs. Na verdade, o principal receio prende-se com a ideia de que os robôs estão cá para ficarem com os nossos empregos. O que eu costumo dizer sempre que me confrontam com esta situação é “só quando as máquinas entenderem a ironia”. Aí sim, podemos temer.
Até lá devemos aproveitar ao máximo aquilo que a tecnologia nos oferece e este é sem dúvida um dos avanços mais satisfatórios que beneficiam não só os negócios, como as pessoas quer sejam clientes, colaboradores, fornecedores ou administradores.