A DeepSeek lançou nesta semana o Janus-Pro-7B, seu modelo de IA generativa de imagens. Segundo a empresa, com dados de benchmarkings, o desempenho da sua IA para imagens supera concorrentes como Dall-E 3 da OpenAI e Stable Diffusion da Stable AI. O Janus-Pro-7B é uma atualização do Janus, lançado pela DeepSeek no passado — e mostrando um grande salto de desempenho.
O modelo de imagem generativa da DeepSeek pode ser baixado no Hugging Face, uma espécie de GitHub para projetos de inteligência artificial e machine learning. É necessário ter um certo conhecimento de programação para rodar o Janus-Pro-7B, visto que ele não é disponibilizado em uma interface fácil de ser usada como DeepSeek, ChatGPT e Copilot.
Além de gerar imagens, o Janus-Pro-7B é capaz de analisar arquivos visuais. Essa funcionalidade é similar ao que faz o Gemini Live e o Google Lens, permitindo que você traduza um texto ou compreenda aquele placa com uma fonte de péssima legibilidade.
Como o Janus-Pro-7B foi treinado?
Segundo a Reuters, que teve acesso à parte da documentação técnica do Janus-Pro-7B, parte do treinamento do modelo usou 72 milhões de imagens sintéticas de alta qualidade. A equipe da DeepSeek então combinou a análise dessas fotos geradas por IA com dados reais.
A empresa destaca que esse método permite a criação de imagens mais realistas e mais ricas em detalhes.
O que é a DeepSeek?
A DeepSeek é uma empresa de inteligência artificial chinesa que está abalando o mercado dessa tecnologia. A empresa afirma que desenvolveu a sua IA generativa gastando menos de US$ 6 milhões (R$ 36 milhões). Esse valor é muito inferior aos US$ 100 milhões (R$ 600 milhões) captados pela OpenAI para desenvolver o LLM GPT-4.
O LLM usado pela DeepSeek é o R1, que teve seu código aberto. A empresa chinesa diz que o desempenho do modelo está no mesmo nível dos LLM da OpenAI e Anthropic (criadora do Claude). Porém, assim como as IAs continuam engatinhando (apesar dos avanços nos últimos anos), os sistemas de benchmarking não são padronizados, o que afeta a confiabilidade de testes — não é como pegar uma GPU e rodar o 3DMark.
Esses relatos de menor custo na fabricação fez cair as ações de diversas empresas americanas, principalmente da Nvidia. A fabricante é a maior fornecedora de placas aceleradoras para o desenvolvimento de IAs, o que a tornou uma das empresas mais valiosas do ramo.
Com a possibilidade de gerar LLMs mais baratos levantada pela DeepSeek, o mercado entendeu que a Nvidia pode não ter todo esse poderio no ramo de placas para IAs.
Com informações de Live Science e Reuters
DeepSeek apresenta Janus-Pro-7B, novo gerador de imagens de IA
You must be logged in to post a comment.