O modelo foi integrado ao Bard, rival do ChatGPT, e chegará a outros produtos do Google, como Busca e Chrome, nos próximos meses.
O Google lançou nesta quarta-feira (6) o Gemini, modelo de inteligência artificial (IA) que é tratado pela empresa como o mais poderoso já criado por sua equipe. Ele já pode ser testado no Bard, rival do ChatGPT, mas, por enquanto, apenas em inglês. Segundo o Google, o Gemini superou a capacidade humana em um teste de conhecimento e solução de problemas que combina 57 temas, incluindo matemática, física e história. A empresa também diz que ele se saiu melhor nesse teste do que o GPT-4, modelo da OpenAI usado no ChatGPT.
O QUE É E O QUE FAZ O GEMINI?
O Gemini é um modelo de IA multimodal, ou seja, ele consegue entender ao mesmo tempo diferentes formatos, como textos, imagens, áudios e códigos. Isso o torna capaz de realizar tarefas que exigem mais capacidade de raciocínio, como:
- Ajudar programadores com códigos complexos;
- Auxiliar estudantes com a lição de casa;
- Gerar resumos de textos;
- Traduzir idiomas;
- Criar conteúdo criativo, como poemas, histórias e músicas;
- Responder perguntas de forma informativa;
- Resolver problemas;
- Gerar ideias.
COMO FUNCIONA O GEMINI?
O Gemini é o modelo de IA mais flexível já desenvolvido pelo Google. A ideia é que ele consiga rodar tanto em infraestruturas grandes, como as de data centers, quanto em dispositivos mais limitados, como celulares. Para atender a esse objetivo, a nova inteligência artificial terá três versões:
- Gemini Ultra: maior e mais poderoso, voltado para tarefas altamente complexas;
- Gemini Pro: voltado para rodar uma ampla gama de tarefas e atender a usuários, a partir desta quarta no Bard, e a desenvolvedores, a partir de 13 de dezembro;
- Gemini Nano: criado para dispositivos móveis, vai rodar diretamente no dispositivo, o que lhe permite funcionar mesmo quando não há internet.
QUANDO ESTARÁ DISPONÍVEL?
O primeiro contato de muitos usuários com o Gemini deverá ser com a versão Pro, que vai melhorar raciocínio, planejamento e compreensão do Bard. A partir desta quarta, o robô do Google já vai usar a nova IA em respostas em inglês (outros idiomas receberão a atualização em breve). No início de 2024, o Google vai lançar o Bard Advanced, que fará o Gemini Ultra estar disponível no Bard. E, ainda segundo a empresa, produtos como Busca e Chrome se integrarão ao Gemini nos próximos meses. A partir de 13 de dezembro, desenvolvedores e empresas poderão usar o Gemini Pro por meio das plataformas de inteligência artificial Google AI Studio e Google Cloud Vertex AI. E o Gemini Ultra vai passar por mais verificações de segurança antes de ser liberado para todos em 2024.
O QUE TORNA O GEMINI PODEROSO?
O Google diz que a abordagem para desenvolver o Gemini foi um pouco diferente da adotada em outros modelos de inteligência artificial multimodais. Normalmente, a criação de modelos de IA envolve “treinamentos” separados, com foco em cada formato. Em uma segunda etapa, o aprendizado de texto é reunido com o de imagem, por exemplo, e tudo é “empacotado” em apenas um produto. Na avaliação do Google, esse método permite realizar algumas tarefas, como descrever imagens, mas tem limitações nos casos que exigem mais raciocínio. O Gemini, por outro lado, foi treinado de uma forma mais integrada, o que permite que ele compreenda melhor as relações entre os diferentes formatos de dados.
É CONFIÁVEL O GEMINI?
O Google admite que, como toda inteligência artificial, o Gemini também está sujeito ao problema de alucinação, um erro que faz a resposta de um robô incluir informações incorretas, tendenciosas ou sem sentido. Mas a empresa diz que o Gemini é capaz de fazer as melhores avaliações de segurança de uma IA já criada por sua equipe. O objetivo é que ele seja capaz de evitar conteúdo violento ou estereotipado, por exemplo. A criação do Gemini envolveu ainda o treinamento sobre o que não deve ser exibido aos usuários a partir de um conjunto de 100 mil frases consideradas tóxicas retiradas da internet. Um grupo de especialistas independentes também trabalha para testar os limites da nova IA.
O Gemini é um importante avanço na tecnologia de inteligência artificial. Ele tem o potencial de transformar a maneira como interagimos com computadores e nos ajuda a resolver problemas complexos. Ainda é cedo para dizer como o Gemini será usado.