Quer apoiar meu projeto de divulgação de noticias? E ainda divulgar suas redes sociais
Agora é possivel Veja a noticia completa em: https://www.techspot.com/news/99473-when-comes-next-generation-ai-models-synthetic-data.html
Fonte: https://www.techspot.com/
Achou esse artigo interessante? Siga canalfsociety em
Instagram,
Facebook,
Telegram,
Twitter,
App Boletim Tec e
App Mr Robot Sticker para ler mais conteúdo exclusivo que postamos. #samirnews #samir #news #boletimtec #quando #se #trata #de #modelos #de #ia #de #próxima #geração, #os #dados #sintéticos #são #o #caminho #a #percorrer
Uma batata quente: depois de vasculhar toda a web para construir seus modelos generativos, as empresas de IA agora estão trabalhando em um novo paradigma de treinamento baseado em dados feitos por computador. A síntese digital é melhor do que o conteúdo feito pelo homem para a evolução da IA, ao que parece. E não deve apresentar problemas com direitos autorais e violação de privacidade.
Um loop de feedback de IA está ameaçando destruir o futuro dos algoritmos de IA generativos, então grandes corporações de tecnologia estão lutando para encontrar uma solução que possa fornecer aos modelos LLM os dados certos para crescer e evoluir. O futuro do treinamento de IA está aparentemente ligado a "dados sintéticos", que é uma maneira menos onanista de dizer que os algoritmos devem conversar entre si se quiserem manter uma mente sã (digital).
De acordo com um relatório recente do Financial Times, a Microsoft, a OpenAI e a startup LLM Cohere são algumas das empresas que já estão testando o uso dos dados sintéticos mencionados acima. Em comparação com as informações "naturais" fornecidas por humanos escassos, os dados sintéticos são gerados por um algoritmo de computador, enquanto supervisores humanos fornecem feedback e preenchem as lacunas. Um processo conhecido como aprendizado por reforço por feedback humano (RLHF).
Com os algoritmos de IA generativos se tornando cada vez mais sofisticados, mesmo as empresas mais ricas baseadas em IA (Microsoft, Google etc.) não têm uma maneira fácil de obter novo conteúdo de "qualidade" para continuar treinando seus modelos de linguagem ampla (LLM). De acordo com o CEO da Cohere, Aidan Gomez, a web é "tão barulhenta e confusa" que não pode fornecer os dados de que as empresas de IA precisam.
Gomez disse que, para aumentar o desempenho dos LLMs de hoje em lidar com desafios de ciência, saúde ou negócios, os esforços de treinamento exigirão "conjuntos de dados exclusivos e sofisticados" criados por especialistas de nível mundial. No entanto, esse tipo de dado criado por humanos é "extremamente" caro, então as empresas de IA estão empregando algoritmos de IA para… treinar algoritmos de IA.
Modelos básicos de IA já estão sendo desenvolvidos com o único objetivo de produzir texto, código ou outras informações "complexas" relacionadas à saúde ou fraudes financeiras. Essas informações "sintéticas" podem, por sua vez, ser usadas para treinar uma nova geração de LLMs avançados para fornecer aos clientes ainda mais "inteligência" e proficiência em geração de texto.
Gomez disse que Cohere está trabalhando em um modelo de IA para matemática avançada, com dois modelos distintos conversando entre si e atuando como tutor de matemática ou aluno. Os dois modelos têm uma "conversa sobre trigonometria", disse Gomez, e são todos sintéticos. Os humanos podem verificar mais tarde se o modelo disse algo errado ou completamente inventado.
Os modelos de IA conversando entre si também fornecem uma solução potencial para os problemas cada vez mais perturbadores de privacidade e direitos autorais enfrentados por corporações LLM como a OpenAI. Conjuntos de dados sintéticos bem elaborados podem remover vieses e desequilíbrios nos dados existentes, afirmou Ali Golshan, embora o CEO da startup de IA Gretel admita que o treinamento puramente sintético também pode impedir o progresso. A web já está repleta de informações geradas por IA, o que, por sua vez, levará à degradação do chatbot e ao "conhecimento regurgitado" ao longo do tempo, conforme previsto no processo de loop de feedback da IA.
Postar um comentário