“Nos últimos anos, a PNL tem testemunhado vários avanços na ajuda aos computadores na compreensão da linguagem humana”, segundo Leand Romaf, engenheiro de software e perito em IA.
Natural Language Processing, uma das tecnologias mais avançadas que ajudam os computadores a compreender a linguagem humana. No entanto, o processo de ensinar máquinas a compreender a nossa forma de comunicação é bastante técnico e desafiante.
No entanto, aqueles que trabalham na área da inteligência artificial esforçam-se por tornar o processo menos pesado e mais eficiente para melhorar as aplicações comuns relacionadas com as pesquisas e traduções de voz.
O objectivo deste artigo é introduzir o Processo de Aprendizagem Natural, as suas utilizações, e formas de o superar.
O que é o Processo de Aprendizagem Natural (PNL)?
Um subcampo da Inteligência Artificial, Processamento de Linguagem Natural, centra-se na interacção entre computadores e seres humanos. Para isso, os engenheiros de software concebem uma linguagem comum conhecida como linguagem natural para melhorar a comunicação entre as máquinas e o homo sapiens.
Através da PNL, as máquinas, mais especificamente, os computadores podem ler, interpretar, compreender, e compreender a linguagem humana da forma como o fazemos para obter resultados mais valiosos. O processamento, tipicamente, é baseado no nível de inteligência da máquina de descodificar mensagens humanas em comunicação significativa.
Uma PNL padrão requer os seguintes passos para progredir a interacção entre humanos e máquinas. Segue-se um processo de 7 passos:
- Fala-se com a máquina
- Grava o áudio
- Converte áudio em texto
- Decifra os dados do texto
- Responde aos dados
- Converte os resultados em áudio
- Reproduz os dados áudio para responder à interacção humana
Porque é que precisamos de Processamento de Linguagem Natural?
É uma das ferramentas mais poderosas para operar várias aplicações de máquinas, mas muito comuns, tais como tradutores em linha e outras respostas baseadas na voz. Tipicamente, estas incluem:
- Ferramentas de tradução de línguas, incluindo Google Translate
- MS palavra, gramática e outras ferramentas linguísticas utilizadas para verificar a precisão gramatical
- Ferramentas de mensagens de voz geradas automaticamente que são utilizadas principalmente em centros de chamadas e departamentos de atendimento ao cliente
- Ferramentas de assistente móveis ou baseadas na web, tais como Siri, OK Google, e Alexa.
O que torna a PNL tão dura?
A PNL é considerada uma das tecnologias mais desafiantes das ciências informáticas, devido à natureza complexa da comunicação humana. Não é fácil para as máquinas compreenderem o contexto da informação ditada.
Pode ser um meio bastante abstracto, o que muda o significado e a compreensão do comando. O exemplo mais comum são as observações sarcásticas utilizadas para passar informação.
Além disso, os plurals com “s” também criam por vezes confusão; assim, a máquina precisa de decifrar as palavras, bem como o significado contextual para compreender toda a mensagem.
Devido à nossa inteligência de alto nível, os seres humanos podem facilmente dominar uma linguagem à medida que tentamos primeiro compreender a situação em que a frase é utilizada. Mas as línguas naturais baseiam-se em características ambíguas e imprecisas, o que dificulta a utilização de PNL pelas máquinas.
Algoritmo — A espinha dorsal do Processamento de Línguas Naturais
O Processamento de Linguagem Natural baseia-se em algoritmos para traduzir dados ambíguos em informação abrangente para que as máquinas construam entendimento. Estes algoritmos utilizam várias regras da linguagem natural para realizar a tarefa.
Quando a informação é fornecida ao computador, este utilizará outro conjunto de algoritmos para compreender o significado contextual associado ao comando e depois recolher os dados relevantes necessários para a consulta.
No entanto, por vezes, o computador fornece resultados obscuros com base no facto de não ter compreendido o significado contextual do comando. Por exemplo, as mensagens no Facebook normalmente não traduzem correctamente devido a algoritmos deficientes.
Muitas vezes, lêem-se mensagens humorísticas (traduzidas) em vários grupos do Facebook, apenas porque a linguagem natural do Facebook não consegue ligar o significado associado de cada palavra ou frase.
Um dos incidentes públicos mais citados foi em 195os, quando alguma mensagem bíblica russa foi traduzida em inglês.
A mensagem russa, “O espírito está disposto, mas a carne é fraca”, foi traduzida para “a vodka é boa, mas a carne está podre”. Ainda se podem encontrar traduções tão hilariantes, uma vez que as máquinas não são capazes de dominar completamente a interacção humana.
Como funciona a PNL?
O Processamento da Linguagem Natural utiliza duas técnicas principais: análise sintáctica e análise semântica para realizar todas as tarefas. Vamos rever cada técnica em detalhe para compreender o desempenho da PNL:
- Análise sintáctica/sintáctica
Trata da colocação das palavras para assegurar a precisão gramatical. Este algoritmo analítico organiza as palavras para uma frase coesa sem qualquer erro de composição.
A técnica avalia o alinhamento da linguagem natural com as regras gramaticais para uma compreensão sem falhas. Os algoritmos extraem um grupo de palavras e implicam regras gramaticais para derivar o seu significado.
Poucas são as técnicas de sintaxe comuns:
- Lemmatização: é um processo linguístico que agrupa palavras moduladas que podem ser analisadas com um único termo, caracterizado sob um lema (forma de dicionário).
- Segmentação morfológica: quebra um grupo de palavras em frases com significado ou morfemas
- Segmentação de palavras: trata da divisão das frases estruturadas em palavras componentes.
- Marcação de partes de fala: o processo identifica as partes de fala em cada frase para aplicar regras gramaticais.
- Parcialização: (Parcing) trata da realização de análise gramatical em cada frase.
- Quebra de frase: o processo separa uma frase da outra, estabelecendo assim limites para um conjunto de palavras.
- Corte (Stemming): trabalha na associação da palavra inflectida com a sua forma de raiz, tal como consulta, consultor, consultivo, e os consultores serão associados à palavra de raiz “consultar”.
- Análise Semântica: Refere-se ao processo de focalização sobre o significado contextual das palavras. Sendo a parte mais difícil do Processamento de Aprendizagem Natural, a técnica está ainda nas suas fases de desenvolvimento.
O processo utiliza algoritmos para extrair o significado para decifrar palavras e sentenças de acordo com as estruturas. Os métodos comuns que a análise semântica utiliza são:
- Reconhecimento de Entidade Nomeada (NER): o processo trata da identificação e categorização de palavras em certos grupos, tais como nomes de pessoas ou lugares.
- Desambiguação do sentido da palavra: trata de acrescentar significado contextual à palavra com base no quadro de frases.
- Geração de Linguagem Natural: utiliza uma base de dados para decifrar o significado lógico do texto da palavra e converter a informação recolhida em linguagem humana.
Conclusão:
O Processamento da Linguagem Natural é fundamental para a comunicação homem-máquina e utiliza várias técnicas para melhorar as tarefas.
Está ainda na sua fase de evolução e, por conseguinte, requer grandes avanços para tornar as máquinas mais inteligentes e alcançar o perfeccionismo na interacção humana. Já alguma vez confiou em alguma das técnicas de PNL para melhorar a funcionalidade das suas aplicações?