Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

“Nos últimos anos, a PNL tem testemunhado vários avanços na ajuda aos computadores na compreensão da linguagem humana”, segundo Leand Romaf, engenheiro de software e perito em IA.

Natural Language Processing, uma das tecnologias mais avançadas que ajudam os computadores a compreender a linguagem humana. No entanto, o processo de ensinar máquinas a compreender a nossa forma de comunicação é bastante técnico e desafiante.

No entanto, aqueles que trabalham na área da inteligência artificial esforçam-se por tornar o processo menos pesado e mais eficiente para melhorar as aplicações comuns relacionadas com as pesquisas e traduções de voz.
O objectivo deste artigo é introduzir o Processo de Aprendizagem Natural, as suas utilizações, e formas de o superar.

O que é o Processo de Aprendizagem Natural (PNL)?

Um subcampo da Inteligência Artificial, Processamento de Linguagem Natural, centra-se na interacção entre computadores e seres humanos. Para isso, os engenheiros de software concebem uma linguagem comum conhecida como linguagem natural para melhorar a comunicação entre as máquinas e o homo sapiens.

Através da PNL, as máquinas, mais especificamente, os computadores podem ler, interpretar, compreender, e compreender a linguagem humana da forma como o fazemos para obter resultados mais valiosos. O processamento, tipicamente, é baseado no nível de inteligência da máquina de descodificar mensagens humanas em comunicação significativa.

Uma PNL padrão requer os seguintes passos para progredir a interacção entre humanos e máquinas. Segue-se um processo de 7 passos:

  1. Fala-se com a máquina
  2. Grava o áudio
  3. Converte áudio em texto
  4. Decifra os dados do texto
  5. Responde aos dados
  6. Converte os resultados em áudio
  7. Reproduz os dados áudio para responder à interacção humana

Porque é que precisamos de Processamento de Linguagem Natural?

É uma das ferramentas mais poderosas para operar várias aplicações de máquinas, mas muito comuns, tais como tradutores em linha e outras respostas baseadas na voz. Tipicamente, estas incluem:

  • Ferramentas de tradução de línguas, incluindo Google Translate
  • MS palavra, gramática e outras ferramentas linguísticas utilizadas para verificar a precisão gramatical
  • Ferramentas de mensagens de voz geradas automaticamente que são utilizadas principalmente em centros de chamadas e departamentos de atendimento ao cliente
  • Ferramentas de assistente móveis ou baseadas na web, tais como Siri, OK Google, e Alexa.

O que torna a PNL tão dura?

A PNL é considerada uma das tecnologias mais desafiantes das ciências informáticas, devido à natureza complexa da comunicação humana. Não é fácil para as máquinas compreenderem o contexto da informação ditada.
Pode ser um meio bastante abstracto, o que muda o significado e a compreensão do comando. O exemplo mais comum são as observações sarcásticas utilizadas para passar informação.

Além disso, os plurals com “s” também criam por vezes confusão; assim, a máquina precisa de decifrar as palavras, bem como o significado contextual para compreender toda a mensagem.

Devido à nossa inteligência de alto nível, os seres humanos podem facilmente dominar uma linguagem à medida que tentamos primeiro compreender a situação em que a frase é utilizada. Mas as línguas naturais baseiam-se em características ambíguas e imprecisas, o que dificulta a utilização de PNL pelas máquinas.

Algoritmo — A espinha dorsal do Processamento de Línguas Naturais

O Processamento de Linguagem Natural baseia-se em algoritmos para traduzir dados ambíguos em informação abrangente para que as máquinas construam entendimento. Estes algoritmos utilizam várias regras da linguagem natural para realizar a tarefa.

Quando a informação é fornecida ao computador, este utilizará outro conjunto de algoritmos para compreender o significado contextual associado ao comando e depois recolher os dados relevantes necessários para a consulta.
No entanto, por vezes, o computador fornece resultados obscuros com base no facto de não ter compreendido o significado contextual do comando. Por exemplo, as mensagens no Facebook normalmente não traduzem correctamente devido a algoritmos deficientes.

Muitas vezes, lêem-se mensagens humorísticas (traduzidas) em vários grupos do Facebook, apenas porque a linguagem natural do Facebook não consegue ligar o significado associado de cada palavra ou frase.
Um dos incidentes públicos mais citados foi em 195os, quando alguma mensagem bíblica russa foi traduzida em inglês.
A mensagem russa, “O espírito está disposto, mas a carne é fraca”, foi traduzida para “a vodka é boa, mas a carne está podre”. Ainda se podem encontrar traduções tão hilariantes, uma vez que as máquinas não são capazes de dominar completamente a interacção humana.

Como funciona a PNL?

O Processamento da Linguagem Natural utiliza duas técnicas principais: análise sintáctica e análise semântica para realizar todas as tarefas. Vamos rever cada técnica em detalhe para compreender o desempenho da PNL:

  • Análise sintáctica/sintáctica

Trata da colocação das palavras para assegurar a precisão gramatical. Este algoritmo analítico organiza as palavras para uma frase coesa sem qualquer erro de composição.

A técnica avalia o alinhamento da linguagem natural com as regras gramaticais para uma compreensão sem falhas. Os algoritmos extraem um grupo de palavras e implicam regras gramaticais para derivar o seu significado.
Poucas são as técnicas de sintaxe comuns:

  • Lemmatização: é um processo linguístico que agrupa palavras moduladas que podem ser analisadas com um único termo, caracterizado sob um lema (forma de dicionário).
  • Segmentação morfológica: quebra um grupo de palavras em frases com significado ou morfemas
  • Segmentação de palavras: trata da divisão das frases estruturadas em palavras componentes.
  • Marcação de partes de fala: o processo identifica as partes de fala em cada frase para aplicar regras gramaticais.
  • Parcialização: (Parcing) trata da realização de análise gramatical em cada frase.
  • Quebra de frase: o processo separa uma frase da outra, estabelecendo assim limites para um conjunto de palavras.
  • Corte (Stemming): trabalha na associação da palavra inflectida com a sua forma de raiz, tal como consulta, consultor, consultivo, e os consultores serão associados à palavra de raiz “consultar”.
  • Análise Semântica: Refere-se ao processo de focalização sobre o significado contextual das palavras. Sendo a parte mais difícil do Processamento de Aprendizagem Natural, a técnica está ainda nas suas fases de desenvolvimento.

O processo utiliza algoritmos para extrair o significado para decifrar palavras e sentenças de acordo com as estruturas. Os métodos comuns que a análise semântica utiliza são:

  • Reconhecimento de Entidade Nomeada (NER): o processo trata da identificação e categorização de palavras em certos grupos, tais como nomes de pessoas ou lugares.
  • Desambiguação do sentido da palavra: trata de acrescentar significado contextual à palavra com base no quadro de frases.
  • Geração de Linguagem Natural: utiliza uma base de dados para decifrar o significado lógico do texto da palavra e converter a informação recolhida em linguagem humana.

Conclusão:

O Processamento da Linguagem Natural é fundamental para a comunicação homem-máquina e utiliza várias técnicas para melhorar as tarefas.
Está ainda na sua fase de evolução e, por conseguinte, requer grandes avanços para tornar as máquinas mais inteligentes e alcançar o perfeccionismo na interacção humana. Já alguma vez confiou em alguma das técnicas de PNL para melhorar a funcionalidade das suas aplicações?

línguas

Weekly newsletter

No spam. Just the latest releases and tips, interesting articles, and exclusive interviews in your inbox every week.