Do blog

Início / Blog / Um mergulho mais profundo no processamento de linguagem natural

Um mergulho mais profundo no processamento de linguagem natural

Uma rede de pontos conectados, visualizando o processamento de linguagem natural

Alexis Alulema - A primeira vez que alguém ouve falar em Processamento de Linguagem Natural (PLN), geralmente não o considera muito complicado. No entanto, depois de algumas considerações adicionais, a pessoa perceberá o quanto a comunidade de IA tem trabalhado no assunto. A tecnologia está até aparecendo em manchetes como esta, apresentada no site sciencealert.com: A IA do Google aprendeu a se tornar "altamente agressiva" em situações estressantes.

Como sugere o artigo acima, essa tecnologia pode se tornar perigosa nas mãos erradas ou se for gerenciada incorretamente. No entanto, acredito que, se compreendermos melhor os detalhes básicos da PNL, concluiremos que não há nada de "mágico" por trás dela. Em vez disso, há um corpo crescente e rigoroso de trabalho científico na criação de algoritmos melhores para processar dados e gerar soluções impressionantes.

As redes neurais começaram a se tornar onipresentes desde que a aprendizagem profunda experimentou um crescimento considerável com big data, computação em nuvem e o surgimento de estruturas de aprendizagem profunda como TensorFlow ou PyTorch. Esses avanços são visíveis em áreas como a visão computacional (CV), em que as previsões são incrivelmente precisas e atingem uma precisão de 95-98%. Essa precisão está no centro de avanços impressionantes na detecção de faces, geração de faces artificiais, carros autônomos e muitas outras implementações.

Processamento de linguagem natural

Em comparação, a NLP atualmente atinge taxas de precisão de cerca de 80%. À primeira vista, pode parecer que a PNL não é tão boa quanto a CV. No entanto, não acredito que essa seja uma avaliação justa, pois o idioma é ambíguo e está vinculado ao contexto. Por exemplo, um falante nativo de um idioma pode, com frequência, usar e entender gírias regionais e expressões idiomáticas com facilidade. Em comparação, um falante não nativo pode ter dificuldade para entender essas expressões e pode expressar ideias semelhantes de uma maneira diferente. Esses e outros fatores criam uma tarefa enorme para os algoritmos de previsão, que precisam tentar entender as expressões idiomáticas e muito mais devido à complexidade do idioma. Os algoritmos mais bem avaliados, como o GPT-2, exigem mais de 150 GB de dados para treinar o algoritmo; para fins de contexto, 150 GB de dados de treinamento significam dias de treinamento de algoritmos de redes neurais em supercomputadores.

Peço que você se aprofunde nesse tópico, analisando meu artigo publicado recentemente, Métodos de aprendizagem profunda no processamento de linguagem natural. No artigo, tento classificar os métodos de Deep Learning de PNL mais relevantes para entender como usá-los e identificar quais situações são mais adequadas para métodos específicos de PNL.

Quem se beneficiaria com esse conteúdo

Este documento é um estado da arte que servirá como ponto de partida para pesquisadores ou desenvolvedores que desejam se familiarizar com o amplo espectro de técnicas de PNL e como aplicá-las de forma ideal em diferentes cenários.



Alexis Alulema
Arquiteto de software sênior e engenheiro de aprendizado de máquina

Encontre Alexis Alulema no LinkedIn
Encontre Alexis Alulema no Twitter
Visite alexisalulema.com

Vamos trabalhar juntos

Forneça suas informações para conversar com um executivo de contas da number8 sobre suas necessidades de desenvolvimento hoje mesmo e sinta como é ser ouvido antes de ser vendida uma solução.

Permita-nos ajudá-lo a agregar profissionais altamente qualificados, desenvolvedores versáteis para a sua equipe.

Direitos autorais © 2023-2024 number8. Todos os direitos reservados.