Pesquisar
Close this search box.

Gemini Impressiona ao Superar Humanos : Nova IA do Google

Gemini

Diferença entre Gêmeos e GPT

Ontem, o Google apresentou o Gemini, um novo modelo de IA que utiliza recursos multimodais. Embora o GPT 4 seja um modelo de preenchimento automático impressionante, o Gemini dá um passo adiante. Gemini foi projetado para raciocinar e processar várias entradas, como texto, imagens, vídeos, áudio e código. Ao contrário do GPT, que converte entradas de áudio em prompts de texto, o Gemini é treinado diretamente com áudio, permitindo compreender o tom e as nuances da fala. Isto é particularmente útil para diferenciar emoções ou aprender línguas tonais como o mandarim.

O que o CEO do Google compartilhou

O CEO do Google, Sundar Pichai, compartilhou um vídeo mostrando as capacidades do Gemini. No vídeo, Gêmeos identifica corretamente os objetos que estão sendo desenhados e ainda entende o jogo “pedra, papel, tesoura” apenas observando o visual. Isso demonstra a capacidade do Gemini de reconhecer e interpretar imagens em tempo real sem a necessidade de avisos de áudio.

Vantagens de Gêmeos

Atualmente, Gemini já ultrapassou os benchmarks estabelecidos por outros modelos de IA. Seus recursos multimodais permitem raciocinar e gerar código de alta qualidade em várias linguagens de programação, incluindo Python, Java, C++ e Go. Com a adição do toque e de outros reconhecimentos de entrada, a Gemini pretende expandir suas capacidades também em robótica.

Impacto na indústria de IA

O desenvolvimento do Gemini, treinado usando Unidades de Processamento Tensor (TPUs) do Google, poderia impactar potencialmente a indústria de IA. Como o Gemini prova ser um modelo mais avançado, pode desafiar o domínio da NVIDIA no mercado de GPU, o que é crucial para o treinamento de modelos de IA como o GPT. O Google já anunciou planos para integrar o Gemini em dispositivos Android, ampliando ainda mais seu alcance.

Desempenho de Gêmeos em benchmarks

Embora o Gemini Ultra, uma das três versões do Gemini (ao lado do Pro e Nano), alcançou resultados impressionantes em benchmarks acadêmicos. Superou especialistas humanos em vários domínios, alcançando uma pontuação de 90% em benchmarks de compreensão linguística multitarefa que envolvem assuntos complexos como matemática, física, história, direito, medicina e ética.

Comparação com outros modelos

No entanto, quando comparado ao GPT 4, o Gemini se destaca pela abordagem de resolução de problemas. Embora o GPT 4 tivesse tentativas limitadas de resolver problemas, o Gemini Ultra utilizou um método chamado “Cadeia de Pensamentos”, que envolveu 32 iterações para alcançar o resultado desejado. Esta abordagem iterativa permite a IA do Google realizar um raciocínio mais detalhado, contribuindo para o seu desempenho superior em benchmarks.

Código alfa 2 e ajuste fino

No relatório técnico divulgado pelo Google DeepMind, intitulado “Relatório Técnico do Código Alfa 2”, são destacados avanços significativos na geração de código. Alpha Code 2 superou 85% dos concorrentes em competições de programação, um salto substancial em relação ao Alpha Code original, que alcançou uma taxa de sucesso de 50%. Demonstrou proficiência em desafios matemáticos e teóricos complexos da ciência da computação, utilizando técnicas avançadas como programação dinâmica.

Potenciais Desafios e Expectativas

Embora a IA do Google e Alpha Code 2 mostrem grande potencial, eles ainda enfrentam desafios. Operar o Alpha Code 2 em escala pode ser caro devido às extensas tentativas e erros e à filtragem de amostras de código de baixa qualidade. No entanto, a migração para uma versão mais capaz do Gemini, como o Ultra, poderia mitigar alguns desses desafios. O futuro da IA ​​e o seu impacto na indústria continuam entusiasmantes, e o hardware necessário para estes avanços continuará a impulsionar a inovação.

Você também pode gostar

Próximo >>

Este blog utiliza cookies para garantir uma melhor experiência. Se você continuar assumiremos que você está satisfeito com ele.