Inteligência Artificial
O avanço em modelos de geração de vídeo
Alibaba quer superar ferramentas como Sora em qualidade e velocidade na criação de vídeos com IA.
26/02/2025, 20:05
Se você acompanha o mundo da inteligência artificial, já deve ter percebido que os avanços estão acontecendo em velocidade impressionante. A cada semana, uma nova ferramenta surge prometendo mudar a forma como criamos conteúdo. Mas o que o Alibaba trouxe agora vai além das promessas: o Wan2.1 é um conjunto de modelos de geração de vídeo em código aberto que não só supera gigantes como o Sora, mas também torna a produção mais acessível e rápida.
O Wan2.1 surge como uma resposta às limitações que ainda persistem em modelos de IA para vídeo. Enquanto muitos sistemas sofrem com artefatos visuais, movimentos instáveis ou renderização imprecisa de texto, o novo lançamento do Tongyi Lab promete eliminar esses problemas — e ainda oferecer recursos inéditos para criadores.
Desempenho Superior em Benchmarks
O coração do Wan2.1 é o modelo Wan2.1T2V14B, que lidera o ranking do VBench — um padrão internacional para avaliar a qualidade de vídeos gerados por IA.
Ele se destaca em três áreas críticas:
Dinâmica de movimento complexa: Cenas com múltiplos elementos em ação, como pessoas dançando ou veículos em movimento, são renderizadas com naturalidade.
Simulação de física realista: Efeitos como água, fogo ou interações entre objetos seguem as leis do mundo real.
Geração de texto integrada: Pela primeira vez, um modelo consegue inserir legendas em inglês e chinês diretamente nos vídeos, sem distorções.
Essas capacidades colocam o Wan2.1 à frente até mesmo de modelos fechados, como o Sora da OpenAI, que até então era considerado o mais avançado.
Velocidade que impulsiona a produtividade
Enquanto outros sistemas levam minutos (ou horas) para gerar clipes curtos, o Wan2.1 opera 2,5 vezes mais rápido. Um vídeo de 5 segundos em 480p, por exemplo, pode ser criado em apenas 4 minutos usando uma placa de vídeo RTX 4090. Isso abre portas para profissionais que precisam de agilidade, como produtores de conteúdo digital ou equipes de marketing.
Ferramentas intuitivas para criadores
Além de gerar vídeos a partir de texto ou imagens, o Wan2.1 oferece funções de edição avançadas:
Pintura interna e externa: Corrija detalhes em partes específicas do vídeo sem afetar o restante da cena.
Referência a múltiplas imagens: Use fotos diferentes como base para manter consistência visual.
Manutenção de personagens e estruturas: Garanta que elementos-chave, como um protagonista ou cenário, permaneçam estáveis em cenas longas.
Essas inovações são especialmente valiosas para quem busca personalização sem precisar de softwares caros ou conhecimentos técnicos profundos.
Democratização do acesso à IA
Um dos pontos mais impactantes do lançamento é a versão leve de 1.3B, projetada para hardware comum. Mesmo usuários sem equipamentos profissionais podem experimentar a tecnologia, algo raro em modelos de alta performance. Essa abordagem reforça o compromisso do Alibaba com o código aberto, permitindo que universidades, pequenas empresas e entusiastas explorem o potencial da IA.
O cenário competitivo da IA em 2025
O Wan2.1 não é apenas mais um lançamento; é um sinal claro de que a China está liderando a corrida opensource em inteligência artificial. Junto com outros projetos do Alibaba, como o Qwen (focado em linguagem natural), a empresa está criando um ecossistema integrado e acessível.
Para usuários comuns, isso significa:
Menor dependência de plataformas pagas.
Mais opções para personalizar ferramentas conforme suas necessidades.
Aceleração na inovação, já que a comunidade global pode contribuir com melhorias.
Impacto prático no dia a dia
Imagine um pequeno empreendedor que quer criar anúncios em vídeo sem contratar uma produtora. Com o Wan2.1, ele pode descrever a cena em texto, ajustar detalhes via edição por IA e ter um resultado profissional em minutos. Ou um professor que usa vídeos customizados para aulas, incorporando explicações em texto diretamente nas imagens. As possibilidades são infinitas e agora, ao alcance de todos.
O futuro da criação de vídeos está mais aberto que nunca
O Wan2.1 representa mais do que um avanço técnico; é um convite para que criadores de todos os níveis explorem novas formas de contar histórias. Ao combinar alta qualidade, velocidade e acessibilidade, o Alibaba não está apenas competindo com gigantes como Google ou OpenAI, está redefinindo as regras do jogo.
Se você está curioso para experimentar, os modelos já estão disponíveis publicamente.
Quem sabe sua próxima ideia não vira um vídeo incrível em questão de minutos?
Fonte: Wanx AI