No contexto: as histórias de ficção científica geralmente retratam robôs capazes de interações confiáveis com humanos, e o Google está trabalhando para aproximar um pouco mais esse sonho futurista da realidade. Os engenheiros de Mountain View desenvolveram um novo modelo de IA que ajuda a robótica a entender e executar ações seguras para humanos.
O Google descreve o Robotics Transformer 2, ou RT-2 para abreviar, como um modelo de visão-linguagem-ação (VLA). O novo modelo de IA foi treinado em texto e imagens coletadas da web, permitindo gerar “ações robóticas”. Em contraste, os chatbots generativos baseados em IA são projetados para produzir trechos de texto que desenvolvem ideias e conceitos.
A equipe DeepMind do Google desenvolveu o RT-2 para transferir o conhecimento da web para o controle robótico. Ao contrário dos chatbots, os robôs exigem aterramento do mundo real para serem úteis para os humanos. O Google reconhece que alcançar isso sempre foi um esforço hercúleo, pois os robôs devem lidar com tarefas complexas e abstratas em ambientes altamente variáveis e desconhecidos.
Modelos de treinamento como o RT-2 são uma tarefa significativamente mais complexa em comparação com o treinamento de modelos de linguagem grande (LLM) para chatbots. De acordo com o Google, o conhecimento de um robô deve ir além de simplesmente saber sobre uma maçã. Ele precisa reconhecer uma maçã dentro de um contexto, diferenciá-la de uma bola vermelha, entender como pegá-la e realizar diversas tarefas relacionadas.
Historicamente, treinar robôs práticos da "vida real" exigiu bilhões de pontos de dados sobre o mundo físico. No entanto, o RT-2 apresenta uma abordagem nova e mais eficiente. Aproveitando a capacidade do RT-1 de generalizar informações entre sistemas, o RT-2 pode criar um único modelo capaz de "raciocínio complexo" com apenas uma pequena quantidade de dados de treinamento de robôs. Essa abordagem mais leve significa um avanço notável nos métodos de treinamento de robôs.
O Google afirma que o RT-2 pode transferir conhecimento de um vasto corpus de dados da web e lidar com situações complexas e solicitações feitas por humanos, como descartar um "pedaço de lixo". A IA compreende o conceito de "lixo" e sabe como descartá-lo, mesmo sem uma programação explícita para aquela ação específica. Essa habilidade mostra a capacidade do modelo de aprender e executar tarefas além de seu treinamento inicial.
Os engenheiros do Google conduziram mais de 6.000 "testes robóticos" do modelo RT-2. Nas tarefas baseadas nos dados usados para treinamento, os modelos tiveram desempenho igual ao modelo da geração anterior (RT-1). No entanto, o desempenho do RT-2 melhorou significativamente em cenários novos e desconhecidos, dobrando da taxa de conclusão de 32 por cento do RT-1 para impressionantes 62 por cento. Essa adaptabilidade aprimorada em situações desconhecidas aumenta substancialmente as capacidades do modelo.
De acordo com o Google, o RT-2 exemplifica como os avanços na tecnologia generativa de IA e LLM estão influenciando rapidamente a robótica, oferecendo grande potencial para robôs de uso geral mais práticos e versáteis. Embora reconheça que ainda há muito trabalho a ser feito, a equipe da DeepMind está otimista quanto ao caminho a seguir.
Veja a noticia completa em: https://www.techspot.com/news/99609-google-new-rt-2-ai-model-allows-robots.html
Fonte: https://www.techspot.com/
Achou esse artigo interessante? Siga canalfsociety em
Instagram,
Facebook,
Telegram,
Twitter,
App Boletim Tec e
App Mr Robot Sticker para ler mais conteúdo exclusivo que postamos.
#samirnews #samir #news #boletimtec #o #novo #modelo #rt2 #ai #do #google #permite #que #os #robôs #descubram #como #concluir #tarefas #sem treinamento
Postar um comentário