A Inteligência Artificial está ainda mais próxima de se tornar “humana”

O desenvolvimento da inteligência artificial depende da aprendizagem das máquinas. De certa forma, as máquinas precisam “aprender a aprender”. E se a melhor forma de aprender é através dos nossos erros, estão no caminho certo.

Um novo algoritmo permite que a Inteligência Artificial (IA) aprenda com seus próprios erros, quase como os seres humanos fazem.

O avanço acontece graças ao novo algoritmo de código aberto chamado Hindsight Experience Replay (HER), desenvolvido por pesquisadores da empresa OpenAI, com sede nos EUA. Nos últimos meses, pesquisadores da OpenAI têm se concentrado no desenvolvimento do processo de aprendizagem da inteligência artificial.

O algoritmo ajuda um agente de IA a “olhar para trás” em retrospectiva, por assim dizer, à medida que completa uma tarefa. De acordo com a OpenAI, a máquina passa a interpretar as falhas como sucessos, para chegar ao resultado pretendido no início da tarefa.

“O ponto chave de HER é algo o que os humanos fazem intuitivamente: mesmo que não tenhamos sucesso em um objetivo específico, pelo menos conseguimos um objetivo diferente. Então, por que não apenas fingir que queríamos atingir esse objetivo desde o começo, em vez do que pretendíamos alcançar originalmente?”, explicam os pesquisadores.

“Ao fazer a substituição, o algoritmo de aprendizagem de reforço pode obter um sinal de aprendizagem, uma vez que alcançou um objetivo, mesmo que não fosse esse o que pretendia originalmente. Se repetirmos esse processo, eventualmente aprenderemos a alcançar objetivos arbitrários, incluindo os objetivos que realmente queríamos alcançar”, assinalam.

Isso significa que todas as tentativas fracassadas da inteligência artificial funcionam como outro objetivo “virtual” não planejado.

Acontece algo parecido conosco quando aprendemos. Quando tentamos andar de bicicleta pela primeira vez, não conseguimos nos equilibrar corretamente. Mesmo assim, as tentativas nos ensinam o que fazer e o que evitar. Cada fracasso nos aproxima do objetivo. É assim que os seres humanos aprendem – e agora as máquinas também.

Com o HER, o OpenAI quer que suas inteligências artificiais aprendam da mesma forma. Ao mesmo tempo, o método se tornará uma alternativa ao sistema de recompensas comum envolvido em modelos de reforço de aprendizagem.

Para ensinar a IA a aprender por conta própria, ela tem que trabalhar com um sistema de recompensas. Os sistemas usados hoje ou dão “cookies” para a inteligência artificial quando ela alcança o objetivo – e não dão nada quando não alcança, ou dão cookies dependendo de quão perto a IA está de atingir o objetivo.

Nenhum dos métodos é perfeito. O primeiro não dá espaço para a aprendizagem, enquanto o segundo pode ser bastante complicado de implementar.

Ao tratar cada tentativa como um objetivo em retrospectiva, HER dá a um agente de IA uma recompensa mesmo quando na verdade ele não conseguiu realizar a tarefa especificada. Isso ajuda a inteligência artificial a aprender mais rápido e com maior qualidade.

No vídeo abaixo, é possível ver como isso funciona na prática. São mostradas diversas tarefas feitas por HER e por outra inteligência artificial. A aprendizagem do novo sistema tem resultados muito melhores.

O método não significa que HER facilita completamente a aprendizagem. “Aprender com HER em robôs reais ainda é difícil, pois ainda requer uma quantidade significativa de amostra”, aponta Matthias Plappert, da OpenAI.

Em qualquer caso, como as simulações da OpenAI demonstraram, ela pode ser bastante útil para “encorajar” os agentes de IA para aprender com seus erros.

Ciberia // HypeScience / ZAP

COMPARTILHAR

DEIXE UM COMENTÁRIO:

Como brasileiros driblam a alta dos preços dos alimentos

Inflação mudou os itens nos carrinhos de supermercado e chegou a afetar a popularidade de Lula. Famílias de diferentes bairros de São Paulo contam sobre sua forma de lidar com a situação. "Driblar os preços." É …

Como Alzheimer deixou ator Gene Hackman sozinho em seus últimos dias: 'Era como se vivesse em um filme que se repetia'

O ator Gene Hackman estava sozinho em sua casa, na cidade de Santa Fé, Novo México, nos EUA, quando faleceu. A estrela de Hollywood, com duas estatuetas do Oscar, não fez uma única ligação e não …

Fenômeno misterioso no centro de galáxia pode revelar nova matéria escura

Pesquisadores do King's College London apontaram, em um novo estudo, que um fenômeno misterioso no centro da nossa galáxia pode ser o resultado de um tipo diferente de matéria escura. A matéria escura é um dos …

ONU caminha para 80 anos focando em reformas e modernização

O líder das Nações Unidas, António Guterres, anunciou o lançamento da iniciativa ONU 80 que quer atualizar a organização para o século 21. Na manhã desta quarta-feira, ele falou a jornalistas na sede da ONU que …

Premiê português cai após denúncia de conflito de interesses

Luís Montenegro perdeu voto de confiança no Parlamento, abrindo caminho para novas eleições. Denúncia envolve pagamentos de uma operadora de cassinos a empresa de consultoria fundada por político. O primeiro-ministro de Portugal, Luís Montenegro, e sua …

Como a poluição do ar em casa afeta a saúde e piora doenças respiratórias

Um levantamento feito em 2024 pela associação Santé Respiratoire France, a pedido da empresa francesa Murprotec, uma das maiores do setor, mostrou que a poluição em ambientes fechados é até nove vezes maior do …

1ª mulher presidente no STM: “Se chegarem denúncias sobre o 8 de janeiro, vamos julgá-las”

Em entrevista à Agência Pública, Maria Elizabeth Rocha, fala de golpe, Justiça Militar e extremismo nas Forças Armadas. O caminho da ministra do Superior Tribunal Militar (STM) Maria Elizabeth Rocha até a presidência da Corte, no …

Fim do Skype: veja 7 apps para fazer chamadas de vídeo

A Microsoft anunciou que o Skype será desativado em 5 de maio de 2025, depois de mais de 20 anos de serviço. Depois do encerramento da plataforma, os usuários poderão migrar para o Microsoft Teams …

O que aconteceu nos países que não fizeram lockdown na pandemia de covid

Em março de 2020, bilhões de pessoas olhavam pelas janelas para um mundo que não reconheciam mais. De repente, confinadas em suas casas, suas vidas haviam se reduzido abruptamente a quatro paredes e telas de …

Iniciativa oferece 3,1 mil bolsas para mulheres em programação e dados

Confederações de bancários e Febraban anunciaram vagas em três cursos. A Federação Brasileira de Bancos (Febraban) e as confederações de bancários – como a Contraf e o Contec – anunciaram nesta terça-feira (11) a oferta …