A Inteligência Artificial está ainda mais próxima de se tornar “humana”

O desenvolvimento da inteligência artificial depende da aprendizagem das máquinas. De certa forma, as máquinas precisam “aprender a aprender”. E se a melhor forma de aprender é através dos nossos erros, estão no caminho certo.

Um novo algoritmo permite que a Inteligência Artificial (IA) aprenda com seus próprios erros, quase como os seres humanos fazem.

O avanço acontece graças ao novo algoritmo de código aberto chamado Hindsight Experience Replay (HER), desenvolvido por pesquisadores da empresa OpenAI, com sede nos EUA. Nos últimos meses, pesquisadores da OpenAI têm se concentrado no desenvolvimento do processo de aprendizagem da inteligência artificial.

O algoritmo ajuda um agente de IA a “olhar para trás” em retrospectiva, por assim dizer, à medida que completa uma tarefa. De acordo com a OpenAI, a máquina passa a interpretar as falhas como sucessos, para chegar ao resultado pretendido no início da tarefa.

“O ponto chave de HER é algo o que os humanos fazem intuitivamente: mesmo que não tenhamos sucesso em um objetivo específico, pelo menos conseguimos um objetivo diferente. Então, por que não apenas fingir que queríamos atingir esse objetivo desde o começo, em vez do que pretendíamos alcançar originalmente?”, explicam os pesquisadores.

“Ao fazer a substituição, o algoritmo de aprendizagem de reforço pode obter um sinal de aprendizagem, uma vez que alcançou um objetivo, mesmo que não fosse esse o que pretendia originalmente. Se repetirmos esse processo, eventualmente aprenderemos a alcançar objetivos arbitrários, incluindo os objetivos que realmente queríamos alcançar”, assinalam.

Isso significa que todas as tentativas fracassadas da inteligência artificial funcionam como outro objetivo “virtual” não planejado.

Acontece algo parecido conosco quando aprendemos. Quando tentamos andar de bicicleta pela primeira vez, não conseguimos nos equilibrar corretamente. Mesmo assim, as tentativas nos ensinam o que fazer e o que evitar. Cada fracasso nos aproxima do objetivo. É assim que os seres humanos aprendem – e agora as máquinas também.

Com o HER, o OpenAI quer que suas inteligências artificiais aprendam da mesma forma. Ao mesmo tempo, o método se tornará uma alternativa ao sistema de recompensas comum envolvido em modelos de reforço de aprendizagem.

Para ensinar a IA a aprender por conta própria, ela tem que trabalhar com um sistema de recompensas. Os sistemas usados hoje ou dão “cookies” para a inteligência artificial quando ela alcança o objetivo – e não dão nada quando não alcança, ou dão cookies dependendo de quão perto a IA está de atingir o objetivo.

Nenhum dos métodos é perfeito. O primeiro não dá espaço para a aprendizagem, enquanto o segundo pode ser bastante complicado de implementar.

Ao tratar cada tentativa como um objetivo em retrospectiva, HER dá a um agente de IA uma recompensa mesmo quando na verdade ele não conseguiu realizar a tarefa especificada. Isso ajuda a inteligência artificial a aprender mais rápido e com maior qualidade.

No vídeo abaixo, é possível ver como isso funciona na prática. São mostradas diversas tarefas feitas por HER e por outra inteligência artificial. A aprendizagem do novo sistema tem resultados muito melhores.

O método não significa que HER facilita completamente a aprendizagem. “Aprender com HER em robôs reais ainda é difícil, pois ainda requer uma quantidade significativa de amostra”, aponta Matthias Plappert, da OpenAI.

Em qualquer caso, como as simulações da OpenAI demonstraram, ela pode ser bastante útil para “encorajar” os agentes de IA para aprender com seus erros.

Ciberia // HypeScience / ZAP

COMPARTILHAR

DEIXE UM COMENTÁRIO:

Como é feito o café descafeinado? A bebida é realmente livre de cafeína?

O café é uma das bebidas mais populares do mundo, e seus altos níveis de cafeína estão entre os principais motivos. É um estimulante natural e muito popular que dá energia. No entanto, algumas pessoas preferem …

“Carros elétricos não são a solução para a transição energética”, diz pesquisador

Peter Norton, autor do livro “Autonorama”, questiona marketing das montadoras e a idealização da tecnologia. Em viagem ao Brasil para o lançamento de seu livro “Autonorama: uma história sobre carros inteligentes, ilusões tecnológicas e outras trapaças …

Método baseado em imagens de satélite se mostra eficaz no mapeamento de áreas agrícolas

Modelo criado no Inpe usa dados da missão Sentinel-2 – par de satélites lançado pela Agência Espacial Europeia para o monitoramento da vegetação, solos e áreas costeiras. Resultados da pesquisa podem subsidiar políticas agroambientais Usadas frequentemente …

Como o Brasil ajudou a criar o Estado de Israel

Ao presidir sessão da Assembleia Geral da ONU que culminou no acordo pela partilha da Palestina em dois Estados, Oswaldo Aranha precisou usar experiência política para aprovar resolução. O Brasil teve um importante papel no episódio …

O que são os 'círculos de fadas', formações em zonas áridas que ainda intrigam cientistas

Os membros da tribo himba, da Namíbia, contam há várias gerações que a forte respiração de um dragão deixou marcas sobre a terra. São marcas semicirculares, onde a vegetação nunca mais cresceu. Ficou apenas a terra …

Mosquitos modificados podem reduzir casos de dengue

Mosquitos infectados com a bactéria Wolbachia podem estar associados a uma queda de 97% nas infecções de dengue em três cidade do vale de Aburra, na Colômbia, segundo o resultado de um estudo realizado pelo …

Chile, passado e presente, ainda deve às vítimas de violações de direitos humanos

50 anos após a ditadura chilena, ainda há questões de direitos humanos pendentes. No último 11 de setembro, durante a véspera do 50° aniversário do golpe de estado contra o presidente socialista Salvador Allende, milhares de …

Astrônomos da NASA revelam caraterísticas curiosas de sistema de exoplanetas

Os dados da missão do telescópio espacial Kepler continuam desvendando mistérios espaciais, com sete exoplanetas de um sistema estelar tendo órbitas diferentes dos que giram em torno do Sol. Cientistas identificaram sete planetas, todos eles suportando …

Em tempos de guerra, como lidar com o luto coletivo

As dores das guerras e de tantas tragédias chegam pelas TV, pelas janelinhas dos celulares, pela conversa do grupo, pelos gritos ou pelo silêncio diante do que é difícil assimilar e traduzir. Complicado de falar …

Pesquisa do Google pode resolver problemas complexos de matemática

O Google anunciou uma série de novidades para melhorar o uso educativo da busca por estudantes e professores. A ferramenta de pesquisa agora tem recursos nativos para resolver problemas mais complexos de matemática e física, inclusive …