Embora seja uma tarefa fácil para um ser humano, treinar robôs para preparar e servir alimentos é ainda algo muito difícil, pois exige delicadeza e uma expertise que aprendemos ao longo do tempo.
Agora, contudo, pesquisadores da Universidade de Boston desenvolveram um autômato com uma inteligência artificial (IA) que consegue pegar uma salsicha, colocar na grelha, deixar cozinhar no tempo certo, posicionar no pão, inserir ao menos um condimento e oferecer o cachorro-quente de forma gentil.
Os cientistas utilizaram um sistema de tentativa e erro conhecido como Aprendizado por Reforço (RL, na sigla em inglês) e conseguiram melhorar as ações a cada nova análise. A IA foi testada em simulações de computador antes da operação com braços robóticos e conseguiu chegar a um status “autoconsciente”, ou seja, capaz de compreender onde estão os erros e iniciar novamente, até que o objetivo seja alcançado.
O segredo por trás do sucesso dessa empreitada está na simplicidade da linguagem desenvolvida pela equipe, que conseguiu assim dividir cada parte da tarefa em ações menores.
Dessa forma, foi possível prever vários cenários em sequências curtas, a exemplo de “eventualmente ligue a churrasqueira, depois escolha a salsicha e coloque-a na churrasqueira”. Limitando as possibilidades da IA, foi mais fácil chegar aos resultados desejados.
Segundo Zachary Serlin, um dos pesquisadores envolvidos no projeto, a maneira como as frases são dispostas é essencial para o sucesso do robô. “Na nossa IA, como você tem essa bela estrutura de frases, pode colocar coisas como: ‘Você não pode pegar duas coisas ao mesmo tempo’. Esse é o conhecimento prévio que você tem”, diz.
O robô não apenas precisou aprender a preparar e servir adequadamente o cachorro-quente para uma pessoa que espera com um prato, mas também garantir que não estivesse cometendo erros de segurança.
“Há também esse nível de segurança, chamado de funções de barreira de controle. Você deixa o algoritmo rodar normalmente com esse conhecimento prévio e com a frase que você fornece. Há uma camada que não permite fazer coisas inseguras. Isso permite que ele tenha esse nível de segurança sem precisar experimentá-lo”, explica.
Em vez de o braço robótico tentar pegar o cachorro-quente da churrasqueira e forçar acidentalmente seus agarradores na mesma, essa camada de segurança obriga ao autômato saber que só pode ficar tão perto da churrasqueira enquanto tenta concluir essa parte da tarefa.
Serlin adianta que continuará trabalhando nessa tecnologia para ver como eles podem ensinar o robô a concluir atividades mais complexas.
// CanalTech