Tecnologia & IA
HappyHorse 1.0: Alibaba entra pesado na disputa contra Seedance, Kling e Veo
Depois de aparecer anonimamente no topo de rankings internacionais, o HappyHorse 1.0 foi assumido pela Alibaba e agora entra em fase de testes, prometendo geração de vídeo em 720p a partir de 0,44 yuan por segundo e mirando publicidade, e-commerce, redes sociais e produção audiovisual de baixo custo.
A corrida mundial dos vídeos gerados por inteligência artificial acaba de ganhar mais um competidor com nome de mascote, ambição de big tech e cheiro forte de guerra comercial. A Alibaba iniciou, em 27 de abril, a fase de testes do HappyHorse 1.0, seu novo modelo de geração e edição de vídeo com IA. Segundo o Science and Technology Daily, veículo estatal chinês de tecnologia, a plataforma foi aberta para criadores profissionais e clientes corporativos pelo site do HappyHorse e pela plataforma Alibaba Cloud Bailian; usuários comuns podem experimentar o recurso pelo app Qwen, conhecido na China como Tongyi Qianwen/千问.
A promessa que chama atenção é simples: vídeo com IA mais acessível. A tabela divulgada pela imprensa chinesa informa preço de referência de 0,9 yuan por segundo para vídeos em 720p, mas, com plano profissional e desconto temporário, esse valor cai para 0,44 yuan por segundo. Em conversão aproximada pela cotação de 29 de abril de 2026, isso dá algo perto de US$ 0,064 por segundo ou R$ 0,32 por segundo — ainda não é “de graça”, mas já começa a transformar vídeo generativo em custo operacional de creator, não em orçamento de produtora cinematográfica.
O modelo chega com as funções esperadas de um sistema moderno de vídeo com IA: texto para vídeo, imagem para vídeo, geração a partir de múltiplas imagens de referência e ferramentas de edição para retrabalhar o material gerado. A Alibaba afirma que o HappyHorse suporta narrativas de até 15 segundos com múltiplos planos, adaptação para diferentes proporções de tela e saída com super-resolução em 1080p. A empresa também destaca qualidade de imagem, iluminação, movimentos de câmera, transições, realismo humano e estilos visuais que vão de pintura chinesa a stop motion de argila.
O ponto mais interessante para quem trabalha com clipe, publicidade e audiovisual curto é que o HappyHorse não está sendo vendido apenas como um brinquedo de prompt. A estratégia parece mirar diretamente o pipeline de produção: publicidade, e-commerce, short dramas, conteúdo social e peças audiovisuais de alto giro. Em outras palavras: aquele território onde agências, marcas, creators e produtoras pequenas vivem espremidos entre a vontade de fazer cinema e a planilha dizendo “meu filho, baixa esse orçamento aí”.
Mas o HappyHorse não apareceu do nada. No início de abril, o modelo surgiu de forma anônima no ranking da Artificial Analysis, uma das plataformas de benchmark mais acompanhadas no setor de IA generativa. Sem paper, sem marca oficial e sem muita explicação, ele começou a liderar comparações às cegas em vídeo. Depois, em 10 de abril, a Alibaba confirmou que o HappyHorse havia sido desenvolvido pela unidade de inovação ligada ao Alibaba Token Hub — ATH, novo grupo interno que reúne frentes como Tongyi Lab, Qwen, MaaS, Wukong e outras iniciativas de IA.
Essa entrada “primeiro ranking, depois revelação” tem cara de campanha calculada. Em vez de uma apresentação tradicional, a Alibaba deixou o modelo circular como “cavalo preto” — ou, no jargão inglês, dark horse — e só depois colocou a marca na sela. O resultado foi óbvio: curiosidade, especulação e manchetes. Para um mercado saturado de demos bonitas e promessas grandiloquentes, aparecer vencendo teste às cegas é muito mais eficiente do que soltar vídeo institucional com executivo de blazer falando “nova era da criatividade”.
Nos rankings atuais da Artificial Analysis, o HappyHorse aparece em posição de destaque. A plataforma informa que o modelo lidera a categoria texto para vídeo com áudio, com Elo 1231, e também a categoria texto para vídeo sem áudio, com Elo 1368. A metodologia da Artificial Analysis se baseia em comparações cegas: usuários veem dois vídeos gerados a partir do mesmo prompt e escolhem o melhor, sem saber qual modelo produziu cada resultado.
Mesmo assim, ranking não é produto. E produto não é só vídeo bonito em demo. A imprensa chinesa especializada já aponta que o HappyHorse talvez não seja exatamente o “matador de preços” que alguns esperavam. Segundo análise do TMTPost, o preço do modelo é competitivo, mas não necessariamente destrutivo: em 720p, a vantagem sobre concorrentes como Seedance 2.0 existiria, mas não seria grande o suficiente para implodir a tabela do mercado.
O mesmo texto levanta uma questão mais importante: para clientes comerciais, o problema não é apenas preço. É estabilidade, previsibilidade de entrega, taxa de acerto e consistência visual. Quem já passou horas “puxando carta” em modelo de vídeo sabe: às vezes a IA entrega cinema; às vezes entrega um personagem com mão de siri, física de sonho febril e expressão de quem acabou de ver a fatura do cartão corporativo. Em produção real, cada erro vira custo.
Segundo avaliações citadas pela mídia chinesa, o HappyHorse se destaca visualmente, especialmente em lentes, movimentos de câmera, atmosfera e redução daquele “cheiro de IA” que denuncia muitos vídeos generativos. Mas ainda haveria pontos a melhorar em áudio, naturalidade de fala, física e estabilidade de resultados. Ou seja: é uma máquina promissora, mas ainda não é a câmera definitiva do pós-cinema.
A jogada da Alibaba também precisa ser lida dentro de uma estratégia maior. O HappyHorse não é apenas um modelo para disputar likes em comunidade de IA. Ele é uma peça da tentativa da empresa de transformar modelos generativos em receita de nuvem, API e ecossistema. A plataforma deve se conectar ao Alibaba Cloud Bailian e a outros agentes/plataformas, enquanto a imprensa chinesa informa que APIs estavam previstas para abertura em 30 de abril.
Esse detalhe é crucial. Diferentemente de ferramentas que começam fechadas em aplicativos próprios, o HappyHorse já nasce com vocação de infraestrutura. Se a Alibaba conseguir atrair desenvolvedores, plataformas de vídeo, e-commerces, agências e estúdios de short drama, o modelo deixa de ser “mais uma IA legal” e passa a ser uma camada de produção audiovisual distribuída. É aí que a briga fica séria.
A disputa também revela uma característica cada vez mais clara do mercado chinês de IA: a velocidade com que modelos saem do laboratório e entram no uso comercial. ByteDance, Kuaishou, Alibaba, Tencent e outras gigantes não estão apenas tentando criar “o melhor modelo”. Elas estão tentando prender o criador dentro de ecossistemas completos: app, nuvem, pagamento, API, template, comunidade e distribuição. A IA de vídeo não é só ferramenta criativa. É infraestrutura de plataforma.
Para o mercado global, o HappyHorse reforça uma tendência inevitável: vídeo generativo vai baratear, acelerar e se tornar cotidiano. O que hoje ainda parece truque técnico começa a virar unidade de produção. Uma peça de social media, um anúncio de e-commerce, um clipe curto, uma cena de teste, um storyboard animado ou uma versão alternativa de campanha poderão nascer em minutos, não em semanas.
Para o Brasil, isso tem duas leituras. A primeira é óbvia: mais uma ferramenta poderosa chegando para pressionar custos, prazos e modelos tradicionais de produção. A segunda é mais estratégica: países periféricos criativamente fortes, mas historicamente estrangulados por orçamento, podem ganhar uma janela rara. Se antes a distância entre uma ideia brasileira e uma execução visual de alto nível era medida em dinheiro, diária, equipe, locação, câmera, render e pós-produção, agora parte dessa distância começa a ser medida em prompt, direção criativa e domínio de workflow.
E é aí que o HappyHorse interessa diretamente ao ecossistema da MVAI. Não porque todo modelo novo de vídeo mereça fogos de artifício. Mas porque cada nova plataforma competitiva acelera a mesma transformação: a do audiovisual como linguagem cada vez mais acessível, iterativa e industrializada. O videoclipe, a publicidade, o conteúdo de rede, o curta, o teaser e o experimento visual entram numa fase em que a barreira principal deixa de ser equipamento e passa a ser direção.
O HappyHorse ainda precisa provar consistência, acesso internacional, qualidade em escala e utilidade real fora da bolha chinesa. Mas o recado já foi dado: a corrida do vídeo com IA não será vencida só por quem fizer a demo mais bonita. Será vencida por quem combinar qualidade, preço, velocidade, API, comunidade, ecossistema e uso comercial.
A Alibaba colocou seu cavalo na pista. Agora resta saber se o HappyHorse é só um bom nome de benchmark — ou se vai mesmo galopar por cima da velha indústria audiovisual.
Tecnologia & IA
Suno capta US$ 400 milhões e mostra que a música por IA virou negócio bilionário
A Suno, uma das startups mais conhecidas de geração musical por inteligência artificial, anunciou uma nova rodada de investimento de mais de US$ 400 milhões. Com o aporte, a empresa passa a ser avaliada em US$ 5,4 bilhões, consolidando-se como uma das companhias mais valiosas no setor de música generativa.
A rodada Série D foi liderada pela Bond Capital e contou com a participação de IVP, Forerunner, Union Square Ventures, Alkeon e Quiet. Investidores já presentes na companhia, como Matrix, Lightspeed, Menlo Ventures e Schroders Capital, também acompanharam o novo financiamento.
A Suno permite que usuários criem músicas completas a partir de comandos de texto, incluindo letra, voz, arranjos e instrumentação. A proposta seduziu milhões de usuários, de curiosos que fazem músicas para ocasiões pessoais a produtores e compositores profissionais interessados em incorporar ferramentas de IA ao fluxo criativo.
Segundo a empresa, o novo capital será usado para ampliar a plataforma, desenvolver modelos musicais mais avançados e lançar novos serviços. A Suno também afirma que pretende começar a disponibilizar, nos próximos meses, seu primeiro modelo musical desenvolvido em parceria com a indústria fonográfica.
Esse ponto é central para entender a nova fase da companhia. A Suno cresceu rapidamente em um ambiente marcado por entusiasmo, mas também por forte resistência de gravadoras, editoras e artistas. Empresas de música generativa como Suno e Udio foram acusadas de treinar seus modelos com obras protegidas por direitos autorais sem autorização ou compensação aos titulares.
Nos últimos anos, a tensão entre inteligência artificial e indústria musical passou dos debates abstratos para os tribunais. Grandes gravadoras e artistas independentes moveram ações contra plataformas de música generativa, questionando a legalidade do uso de catálogos protegidos no treinamento de modelos. O argumento das empresas de IA costuma se apoiar em interpretações de “uso justo”, enquanto titulares de direitos defendem que o treinamento sem licença constitui exploração comercial não autorizada.
Ao mesmo tempo, parte da indústria começa a buscar acordos em vez de apenas litígios. Em 2025, a Suno anunciou uma parceria com a Warner Music Group para desenvolver experiências de criação musical baseadas em conteúdo licenciado e em participação opt-in de artistas. A ideia é permitir que nomes, vozes, imagens, composições e estilos sejam usados em novas experiências de IA apenas quando houver autorização, controle e compensação.
A movimentação não acontece isoladamente. Spotify e Universal Music Group também anunciaram acordos de licenciamento para permitir a criação de covers e remixes por IA dentro de um modelo pago e controlado. Na prática, o mercado parece testar uma transição: da IA musical vista como ameaça pirata para uma infraestrutura licenciada de criação, remixagem e engajamento de fãs.
Para os investidores, a aposta é clara. A música por IA pode abrir uma nova camada da economia do entretenimento, baseada não apenas no consumo passivo de faixas, mas na participação ativa dos usuários. Em vez de apenas apertar o play, o público passa a criar, adaptar, brincar e compartilhar músicas personalizadas.
Para artistas e gravadoras, o dilema é mais delicado. Há potencial de novas receitas, novas formas de interação com fãs e expansão criativa. Mas há também riscos evidentes: substituição de trabalho humano, diluição de identidade artística, uso indevido de vozes e estilos, além da dificuldade de rastrear autoria, remuneração e consentimento em escala.
O novo aporte da Suno mostra que, apesar das disputas legais, o capital de risco segue convencido de que a música generativa será uma das grandes frentes comerciais da inteligência artificial. A pergunta já não é se a IA vai participar da cadeia musical, mas em quais condições: com licença, transparência e remuneração — ou em uma guerra permanente entre inovação tecnológica e direitos autorais.
A próxima etapa da Suno será decisiva. Se a empresa conseguir migrar para modelos treinados com acordos industriais robustos, poderá se apresentar como uma ponte entre tecnologia e mercado musical. Se não conseguir, continuará sendo símbolo de uma contradição cada vez mais visível: uma plataforma capaz de democratizar a criação musical, mas construída sobre uma disputa ainda aberta sobre quem deve ser pago quando a máquina aprende a cantar.
Fonte: Silicon Angle
Tecnologia & IA
Novo Gemini Omni leva edição conversacional para vídeos com IA
O Google apresentou, durante o Google I/O 2026, o Gemini Omni, uma nova família de modelos de inteligência artificial voltada à criação multimodal. A promessa é ambiciosa: permitir que usuários criem conteúdos a partir de diferentes tipos de entrada — texto, imagem, vídeo e áudio — começando pela geração e edição de vídeos. A empresa define o Omni como um passo na direção de uma IA capaz de “criar qualquer coisa a partir de qualquer entrada”.
O primeiro modelo da família é o Gemini Omni Flash, que chega com foco em vídeos curtos. Segundo o Google, ele será capaz de gerar vídeos de até 10 segundos, criar áudio sintético nativo, transformar até cinco fotos em vídeo, editar cenas em múltiplas etapas e trabalhar com avatares personalizados. A novidade exige assinatura de um plano Google AI, com disponibilidade variando por região e faixa de produto.
Na prática, o Omni aproxima a criação de vídeo da lógica de uma conversa. Em vez de depender de softwares complexos de edição, o usuário poderá pedir alterações em linguagem natural: trocar cenário, modificar estilo visual, ajustar personagens, transformar uma foto em clipe ou refinar uma sequência já gerada. O próprio Google descreve a ferramenta como uma espécie de “Nano Banana para vídeos”, em referência ao seu modelo de geração e edição de imagens.
A mudança também marca uma reorganização importante dentro do ecossistema de mídia generativa do Google. O Gemini Omni deve substituir o Veo no app Gemini, combinando a inteligência central do Gemini com recursos avançados de geração de mídia. Enquanto o Veo era mais associado à geração de vídeo a partir de prompts, o Omni amplia o conceito ao permitir que vídeos, imagens e outros elementos sirvam como referência para novas criações.
Para criadores, publicitários e produtores de conteúdo, o ponto mais relevante talvez não seja apenas a geração de vídeos, mas a edição conversacional. O Google afirma que o Omni Flash melhora a consistência de personagens, preservando identidade e voz ao longo de diferentes cenas. Esse tipo de recurso pode ser decisivo para campanhas, narrativas seriadas, vídeos educacionais e conteúdos de marca, áreas em que a coerência visual costuma ser uma das maiores limitações dos modelos generativos.
Outro destaque é a criação de avatares de IA. A ferramenta permite que usuários criem versões digitais de si mesmos para aparecer em vídeos gerados artificialmente. Segundo a Wired, o processo envolve capturar rosto e voz pelo celular, com movimentos de cabeça e leitura de uma sequência de números. A proposta inicial do Google é permitir que usuários gerem vídeos de si próprios, não de terceiros.
Essa funcionalidade, porém, reacende o debate sobre deepfakes, autenticidade e transparência. O Google afirma que vídeos criados com Omni terão marca d’água digital SynthID, tecnologia usada para identificar conteúdos gerados por IA. A Associated Press também registrou que a empresa pretende expandir ferramentas de verificação de credenciais de conteúdo no Gemini e, futuramente, no Chrome.
O lançamento acontece em um momento de corrida acelerada pela liderança em vídeo generativo. OpenAI, Runway, Luma AI, ByteDance e outros competidores disputam espaço em um mercado que interessa tanto a criadores independentes quanto a estúdios, marcas e plataformas sociais. O diferencial do Google é tentar integrar a geração de mídia diretamente ao Gemini, ao YouTube Shorts e ao Google Flow, criando um fluxo que vai da ideia ao vídeo final dentro do próprio ecossistema da empresa.
No Google Flow, o Omni Flash será usado em conjunto com recursos de agente criativo. A empresa afirma que o Flow Agent poderá ajudar em brainstorming, criação, edição em lote, organização de arquivos e desenvolvimento de ferramentas personalizadas por linguagem natural. O Google também anunciou que o Omni será integrado ao Flow Music, permitindo criar vídeos musicais a partir de orientação conversacional.
Apesar do entusiasmo, ainda há limites claros. A versão inicial trabalha com vídeos curtos, de até 10 segundos, e alguns recursos dependem de assinatura, plataforma, país e idade mínima. O próprio Google informa que funcionalidades podem variar por nível de plano e região.
Ainda assim, o Gemini Omni sinaliza uma virada estratégica. O vídeo com IA deixa de ser apenas uma ferramenta de geração a partir de texto e passa a se aproximar de um ambiente de produção completo, no qual o usuário conversa, edita, refina, reaproveita referências e mantém personagens consistentes. Para o mercado criativo, isso pode reduzir barreiras técnicas. Para a sociedade, amplia a urgência de discutir autoria, consentimento, identificação de conteúdo sintético e confiança nas imagens que circulam online.
No fim, o Google não está apenas lançando mais um modelo de vídeo. Está tentando transformar o Gemini em uma plataforma de criação multimodal — e, ao mesmo tempo, disputar o futuro da produção audiovisual com IA.
Tecnologia & IA
Google testa ferramenta que pode transformar o Gemini em estúdio de vídeo com IA
O Google pode estar prestes a dar mais um passo na disputa pelo futuro do vídeo gerado por inteligência artificial. Um novo modelo chamado Gemini Omni apareceu para alguns usuários dentro do Gemini, com uma descrição que promete criação de vídeos, remixagem, edição direta no chat e uso de templates. A descoberta foi relatada pela 9to5Google nesta segunda-feira, 11 de maio de 2026, e reforçada por publicações especializadas que acompanham testes e vazamentos de produtos de IA.
A frase exibida na interface era direta: “Create with Gemini Omni”. Segundo os relatos, o Google descreve o recurso como um novo modelo de geração de vídeo capaz de remixar vídeos, editar conteúdos por conversa e partir de modelos prontos. Ainda não está claro se o Omni será um modelo totalmente novo, uma camada de produto sobre o Veo ou uma evolução integrada da estratégia multimodal do Gemini.
As primeiras demos chamaram atenção por dois motivos. A primeira mostrava um professor escrevendo uma prova matemática em um quadro, um tipo de cena difícil para modelos de vídeo porque exige coerência visual, texto legível e continuidade de movimento. A segunda brincava com um teste clássico de IA generativa: pessoas comendo espaguete, referência ao famoso meme dos primeiros vídeos gerados artificialmente, quando mãos, bocas, talheres e comida viravam um pequeno carnaval de horrores digitais. Segundo a 9to5Google, os resultados ainda têm sinais visíveis de geração por IA, mas já mostram avanço considerável em realismo e aderência ao prompt.
O ponto mais importante para criadores, videomakers e produtores independentes não é apenas a geração de vídeo a partir de texto. O diferencial sugerido pelo vazamento está na edição conversacional: trocar objetos, remixar cenas, editar vídeos diretamente no chat e trabalhar a partir de templates. O TestingCatalog afirma que os testes iniciais indicam desempenho especialmente forte em tarefas de edição, incluindo substituição de elementos e reescrita de cenas por instruções em linguagem natural.
Esse detalhe é estratégico. A geração bruta de vídeo já virou território disputado por Google, OpenAI, ByteDance, Runway, Luma e outras empresas. Mas a próxima fronteira pode ser menos “crie um vídeo do zero” e mais “pegue este material e transforme em outra coisa”. Para a indústria criativa, isso muda o jogo: o modelo deixa de ser apenas um gerador de clipes e começa a se comportar como um assistente de pós-produção.
Também apareceu para alguns usuários uma aba de uso, indicando que a criação de vídeos com Omni pode consumir rapidamente os limites diários de planos pagos. A própria página de suporte do Google já trata geração de vídeo como recurso sujeito a limites por plano e afirma que os limites podem mudar com frequência por demanda e capacidade.
O vazamento chega poucos dias antes do Google I/O 2026, marcado oficialmente para 19 e 20 de maio. A página do evento promete keynotes, sessões e novidades com foco em IA, Gemini, Android, Chrome e Cloud. O blog de desenvolvedores do Google também afirma que a conferência trará avanços de IA e atualizações de modelos Gemini, o que torna o evento o palco mais provável para uma explicação oficial sobre o Omni, caso o produto esteja realmente pronto para anúncio.
Por enquanto, convém tratar o Gemini Omni como um vazamento forte, não como lançamento oficial. O Google ainda não apresentou publicamente o produto nem explicou como ele se encaixará na família Veo. Mas a direção é clara: a Big Tech quer que o Gemini deixe de ser apenas um chatbot multimodal e se torne um ambiente completo de criação — texto, imagem, vídeo, edição e talvez, em breve, fluxo de produção audiovisual.
Para creators, artistas visuais, diretores de clipes, agências pequenas e produtores independentes, a promessa é sedutora: um estúdio criativo dentro de uma conversa. Para o mercado, o recado é menos poético e mais brutal: a guerra do vídeo com IA ainda nem começou direito, e o Google parece disposto a colocar seu exército dentro do Gemini.
Fonte: 9to5Google
-
Videoclipe2 semanas atrásNeural Frames mira US$ 5 milhões ao transformar músicas em videoclipes com IA
-
Cinema2 semanas atrásDreams of Violets: Feito por IA, drama sobre o Irã estreia em Tribeca e reacende debate no cinema
-
Cinema1 semana atrásScorsese leva a IA para o storyboard — e reacende a guerra cultural em Hollywood
-
Tecnologia & IA1 semana atrásSuno capta US$ 400 milhões e mostra que a música por IA virou negócio bilionário
-
Cinema2 dias atrásTribeca indica o caminho: IA no cinema precisa de autoria humana
-
Cinema2 dias atrás“Dreams of Violets” é o marco zero do cinema de guerrilha com IA
-
Videoclipe14 horas atrásAos 65, Boy George lança versão de Karma Chameleon com inteligência artificial