Gemini, a resposta do Google ao GPT-4, já está disponível.
O Google apresentou Gemini, referindo-se a ele como seu “modelo de inteligência artificial mais avançado e poderoso”.
Na quarta-feira, o laboratório de pesquisa de inteligência artificial Google DeepMind apresentou o modelo altamente aguardado que, segundo relatos, supera o GPT-4 da OpenAI em importantes testes.
Desde que o ChatGPT foi lançado pela OpenAI há um ano, as principais empresas de tecnologia têm competido por avanços na área de IA. Até o momento, a Microsoft tem tido uma leve vantagem devido ao seu acesso aos modelos da OpenAI como um grande investidor na empresa de IA. Por outro lado, o Google tem estado mais discreto. O lançamento inicial do Bard, concorrente do ChatGPT, foi complicado. O Google tem bloqueado versões da OpenAI e Microsoft com o Bing e Copilot. No entanto, o Google Gemini pode representar um avanço significativo o bastante para colocá-lo à frente da OpenAI.
Qual é a definição de Gemini?
De acordo com o Google, a Gemini se destaca por suas capacidades multimodais, raciocínio avançado e habilidades avançadas de codificação. Ao contrário de outros modelos de IA multimodais, que inicialmente são construídos com foco em texto e depois incorporam dados de imagem, a Gemini é nativamente multimodal, o que significa que foi treinada em modalidades de áudio, imagem e texto desde o início. Isso permite que a Gemini compreenda e raciocine sobre diferentes tipos de entradas de forma mais eficaz do que os modelos multimodais existentes, conforme anunciado.
Gemini obteve uma pontuação de 90%, enquanto o GPT-4 alcançou 86,4% no MMLU (compreensão multitarefa maciça), que avalia conhecimento diversificado e habilidades de resolução de problemas.
Sabemos que a Gemini recebeu avaliações positivas, mas como isso se traduz na prática? Estamos prestes a descobrir. O Google adaptou a Gemini para três tamanhos distintos: Gemini Ultra, o maior modelo para tarefas altamente complexas, Gemini Pro, um modelo intermediário capaz de lidar com a maioria das tarefas, e Gemini Nano, um modelo compacto e eficiente que pode ser facilmente integrado ao seu telefone.
Falando nisso, a partir de agora, o Gemini Nano estará funcionando no Google Pixel 8 Pro. Inicialmente, o Gemini Nano suportará dois recursos no aparelho. Ele terá a capacidade de resumir transcrições no aplicativo de Gravação e também fornecer sugestões de respostas inteligentes para o teclado do telefone (Gboard).
Mesmo que não utilize um dispositivo Android, é possível experimentar o Gemini no Google Bard a partir de agora. Você pode perceber uma melhoria na sua capacidade de raciocínio, planejamento e compreensão. O Gemini Pro estará disponível no Bard, mas apenas com sugestões de texto.
Em um futuro próximo, a multimodalidade será introduzida. No ano seguinte, o Google pretende lançar uma nova versão aprimorada do Bard, que será impulsionada pelo Gemini Ultra.
Google – Suporte técnico para dispositivos informáticos