Tecnologia & IA

Google Flow Music tenta enfrentar a Suno, mas chega atrasado à revolução da música com IA

Promptado, editado e publicado

2 meses atrás

29 de abril de 2026

por

Entre Lyria 3, Veo, Flow, Gemini e uma aposta bilionária na Anthropic, o Google parece finalmente ter entendido que a revolução da música com IA não é um “recurso experimental”. É uma nova indústria. O problema: a Suno entendeu isso antes.

Conteúdo

O Google acaba de colocar mais uma peça no seu tabuleiro de inteligência artificial criativa: o chamado Google Flow Music, uma plataforma que promete funcionar como um estúdio all-in-one para criar músicas, remixar faixas, gerar clipes com IA, editar trechos, separar stems, publicar criações e até “vibe-codear” instrumentos, plugins, jogos musicais e DAWs customizadas. No papel, parece o tipo de ferramenta que um império tecnológico com dinheiro infinito deveria lançar. Na prática, o cheiro é outro: o de uma gigante correndo atrás de uma cena que explodiu sem pedir licença — e onde a Suno já virou linguagem, ferramenta, comunidade e cultura.

Segundo a própria página pública do Flow Music, a plataforma permite conversar com um agente chamado Producer, criar canções “full-length” com vocal dinâmico usando Lyria 3, dirigir videoclipes com o modelo Veo, remixar áudio, aplicar efeitos, dividir stems e criar ferramentas musicais dentro de espaços próprios. A proposta é bonita: um estúdio IA de bolso. Só que a execução, pelo menos nesse primeiro impacto, parece aquele velho Google pós-2010: tecnicamente poderoso, conceitualmente atrasado, emocionalmente frio e com cara de produto feito por comitê.

A comparação inevitável é com a Suno, e é aí que a coisa pega fogo.

O Google descobriu a música com IA depois que a pista já estava lotada

A Suno não é apenas uma ferramenta de geração musical. Ela virou, para muita gente, o primeiro contato real com a ideia de que uma pessoa sem banda, sem estúdio, sem produtor e sem gravadora pode criar uma música com letra, voz, melodia, arranjo e estrutura em minutos. A própria Wikipedia define a Suno como uma plataforma de IA generativa voltada à criação musical, capaz de gerar música com vocais e instrumentação a partir de prompts de texto ou áudio. A plataforma está amplamente disponível desde dezembro de 2023 e chegou a ser integrada ao Microsoft Copilot.

Isso é importante porque a Suno não chegou como “feature”. Ela chegou como instrumento cultural.

O Google, por outro lado, vem empilhando nomes: MusicLM, MusicFX, Music AI Sandbox, Lyria, Gemini, Flow, Veo, agora Flow Music. É IA criativa em modo gaveta corporativa. Cada gaveta tem uma plaquinha bonita, uma página institucional elegante, um vídeo de demonstração impecável — e pouca sensação de que há ali uma comunidade musical viva, suando, errando, criando atrocidades maravilhosas às três da manhã.

A Suno tem defeitos? Tem. Tem polêmica jurídica? Tem. Tem som plastificado em várias gerações? Tem também. Mas ela tem uma coisa que o Google raramente consegue fabricar: tesão de uso.

O que é o Flow Music?

O Flow Music aparece como uma plataforma de criação musical com IA que mistura geração de faixas, remixagem, edição, publicação e criação de videoclipes. A página do serviço fala em músicas completas com “musicalidade rica” e vocais dinâmicos, usando o modelo Lyria 3. Também promete usar o Veo para transformar músicas em videoclipes, dando ao usuário controle sobre personagens, estética e detalhes visuais.

Além disso, a documentação pública do Flow Music apresenta o Producer como uma espécie de parceiro de estúdio, um agente com quem o usuário conversa para produzir música.

Reportagens recentes no Brasil também descreveram o Flow Music como uma evolução ou rebatismo de um produto chamado ProducerAI, com funções de geração por prompt, recursos sociais e ferramentas como vibe-code para plugins, jogos musicais e DAWs personalizadas. O Canaltech, por exemplo, descreveu o acesso via navegador, com comando de texto no campo “Ask producer”.

A proposta, portanto, é clara: não é só gerar música. É criar um ambiente completo para composição, edição, remixagem, publicação e audiovisual. Em tese, o Google quer juntar o que hoje está espalhado entre Suno, Udio, DAWs, Runway, Luma, Kling, CapCut, plugins de áudio e plataformas sociais.

Bonito. Ambicioso. Mas também perigosamente “Google demais”.

O problema: o Google ainda parece pensar como engenheiro, não como músico

O Google tem modelos fortíssimos. O Lyria 3, integrado ao Gemini, já permite criar músicas por texto ou imagem. A página oficial do Gemini informa que o Lyria 3 gratuito cria faixas de até 30 segundos, enquanto o Lyria 3 Pro pode gerar músicas de até 3 minutos em planos pagos do Google AI Plus, Pro e Ultra.

Em fevereiro de 2026, o Google anunciou oficialmente que o Gemini passaria a criar músicas com o Lyria 3 em beta, com faixas de 30 segundos, capa gerada por IA e marca d’água SynthID para identificação de áudio criado por IA.

Ou seja: tecnologia existe. Modelo existe. Infraestrutura existe. O problema é outro.

Música não é só fidelidade. Música é acidente, sujeira, decisão errada que vira estética, refrão que gruda, timbre que machuca, grave que entra no peito, vocal imperfeito que parece humano porque quase cai do trilho. A Suno, com todos os seus vícios, entendeu isso melhor que o Google. Ela vende uma sensação: “eu fiz uma música”. O Google vende uma arquitetura.

E arquitetura, meu querido, não dança.

Suno: a máquina que virou brinquedo sério

A Suno vem evoluindo numa velocidade que explica o desespero tardio do Google. Em março de 2026, a empresa lançou a Suno v5.5, com foco em identidade musical, incluindo Voices, Custom Models e My Taste. A própria Suno descreve a v5.5 como seu modelo “mais expressivo”, com recursos para capturar voz, treinar modelos personalizados e adaptar gerações ao gosto do usuário.

A Suno também se vende como um ambiente completo para criação musical. Em material próprio atualizado em 2026, a empresa afirma que permite criar músicas, letras, beats, vocais e edições em um só lugar, além de destacar o Suno Studio como uma DAW nativa de IA, com edição em timeline, camadas, exportação MIDI e geração instantânea de vocais, bateria e sintetizadores.

Isso muda o jogo.

A briga não é mais “quem gera uma música engraçadinha por prompt”. A briga agora é: quem vira o Pro Tools da geração IA? Quem vira o Logic da garotada sintética? Quem vira o Ableton de uma geração que compõe conversando com modelo?

A Suno está tentando ocupar esse lugar por dentro da cultura musical. O Google está tentando ocupar por cima, pela força da infraestrutura.

O Veo é o que salva a operação

Se tem uma parte realmente forte na aposta do Google, ela se chama Veo.

O Flow, lançado pelo Google em maio de 2025, foi apresentado como uma ferramenta de produção cinematográfica com IA construída especialmente para os modelos Veo, Imagen e Gemini. O Google descreveu o Flow como um ambiente para criadores explorarem ideias, criarem cenas e clipes cinematográficos, com o Gemini ajudando na interpretação de prompts e o Veo entregando vídeo com física, realismo e aderência ao comando.

O próprio Google DeepMind afirma que o Veo 3 permite adicionar efeitos sonoros, ruído ambiente e diálogo gerados nativamente, além de entregar qualidade de vídeo com forte aderência ao prompt, realismo e física.

Aqui, sim, o Google tem uma carta pesada.

Para a MVAI, que pensa música, videoclipe e audiovisual como uma mesma cadeia criativa, o Veo é a parte realmente estratégica. Se o Flow Music conseguir costurar música e vídeo de forma orgânica, sem parecer uma gambiarra de produtos colados com fita dupla face, pode virar uma ferramenta relevante para videoclipes IA.

Mas esse é justamente o “se” gigante.

Porque música com IA sem cultura vira jingle de banco. Videoclipe com IA sem direção vira demo de benchmark. E plataforma all-in-one sem comunidade vira cemitério de produto Google.

Alô, Google Stadia. Alô, Google+. Alô, toda a ala de defuntos brilhantes do Google.

O Flow Music quer ser Suno, Runway, Ableton e YouTube ao mesmo tempo

O Flow Music parece nascer com uma ambição quase imperial: ser gerador musical, editor, remixador, rede social, estúdio de vídeo e ambiente de criação de ferramentas. Isso é, ao mesmo tempo, fascinante e suspeito.

Fascinante porque, se funcionar, pode encurtar drasticamente o caminho entre ideia, música, videoclipe e distribuição.

Suspeito porque o Google tem uma longa tradição de lançar produtos com nome bonito, matar produtos com frieza soviética e deixar criadores com cara de trouxa no acostamento.

Artista precisa confiar na ferramenta. Precisa acreditar que o projeto não vai desaparecer porque algum executivo achou que “não bateu OKR”. A Suno, por ser uma empresa nascida dentro do problema musical, parece ter mais clareza de missão. O Google parece ter mais capacidade computacional, mas menos alma.

E na música, alma ainda conta. Mesmo quando é alma sintética.

E os US$ 40 bilhões na Anthropic?

No mesmo tabuleiro, o Google também aparece aprofundando sua aposta na Anthropic. Segundo a Reuters, a Alphabet deve investir até US$ 40 bilhões na empresa criadora do Claude: US$ 10 bilhões em dinheiro agora, avaliando a Anthropic em US$ 350 bilhões, e mais US$ 30 bilhões condicionados a metas de performance.

A notícia é brutal porque mostra uma coisa: mesmo o Google, com DeepMind, Gemini, TPU, YouTube, Android, Search e dinheiro infinito, está comprando posição em concorrente. É o tipo de movimento que grita: “temos tudo, menos tranquilidade”.

E aí fica a pergunta: se o Google precisa colocar dezenas de bilhões na Anthropic para não perder o bonde dos modelos gerais, que confiança o mercado deve ter em mais uma plataforma criativa do Google tentando correr atrás da Suno?

É claro: Anthropic não é “plataforma duvidosa” no sentido técnico. Claude é forte, especialmente em código. A própria Reuters relata que o Claude Code ganhou tração entre desenvolvedores e que a receita anualizada da Anthropic ultrapassou US$ 30 bilhões em abril de 2026.

Mas estrategicamente, para o Google, a cena é esquisita: a empresa que prometia organizar a informação do mundo agora parece tentando organizar o próprio pânico.

Suno também tem telhado de vidro — mas está no lugar certo da revolução

Ser Team Suno não significa fingir que a Suno é santa. A plataforma foi processada por grandes gravadoras, junto com a Udio, em ações que acusam as empresas de uso indevido de gravações protegidas por copyright no treinamento de modelos. A Reuters noticiou em 2024 que as gravadoras pediam indenização de até US$ 150 mil por música supostamente copiada.

Também houve mudanças importantes no front jurídico: a Warner, uma das gravadoras que processava a Suno, fechou acordo de licenciamento com a empresa em 2025, encerrando sua parte no litígio e abrindo caminho para modelos mais licenciados. Segundo a Pitchfork, a parceria inclui compensação para artistas e compositores que optarem por acordos de IA, além da aquisição da Songkick pela Suno.

Ou seja, a Suno está no meio da guerra real: direito autoral, indústria fonográfica, criadores, modelos licenciados, comunidade, profissionalização. É um campo minado, mas é o campo minado certo.

O Google, por enquanto, parece mais preocupado em criar uma suíte elegante.

A Suno está brigando pela linguagem da música com IA. O Google está brigando pela dashboard.

A tese MVAI: ferramenta musical precisa nascer da música, não do PowerPoint

Para quem cria dentro da nova economia da IA audiovisual, o Flow Music é um sinal importante, mas não necessariamente uma ameaça imediata. Ele confirma a tese central da MVAI: música, vídeo, IA e distribuição vão virar uma cadeia única.

O que antes exigia compositor, banda, estúdio, produtor, câmera, locação, equipe de arte, editor, colorista e verba de gravadora agora começa a caber numa pilha de modelos generativos. Isso não elimina direção criativa — pelo contrário, torna direção criativa ainda mais importante.

Só que existe uma diferença entre plataforma e cultura.

A Suno já é usada como instrumento de composição popular. Já virou meme, laboratório, brinquedo, demo, ferramenta de artista independente, máquina de refrão, arma de provocação estética. O Google Flow Music chega com pinta de canivete suíço corporativo: cheio de lâminas, mas ainda sem sangue na ponta.

E música, desculpa, precisa sangrar um pouco.

Veredito: Flow Music pode ser útil, mas Suno ainda é a rua

O Google Flow Music merece atenção. Principalmente por causa da integração com Lyria 3 e Veo. Se o Google conseguir unir música e videoclipe com fluidez real, pode entregar uma ferramenta poderosa para criadores audiovisuais, publicitários, artistas independentes e produtoras IA.

Mas como concorrente direto da Suno, a largada é fraca.

Não porque o Google não tenha tecnologia. Tem até demais. O problema é que o Google parece continuar confundindo criatividade com capacidade computacional. Música não é só gerar áudio. É construir identidade, repertório, catarse, comunidade, vício de uso e desejo de voltar amanhã para fazer outra faixa.

A Suno, mesmo imperfeita, já entendeu isso.

O Google chegou com terno caro, modelo avançado e infraestrutura colossal. A Suno chegou com um refrão.

E na história da música popular, meu querido, quem tem o refrão geralmente vence.

Assuntos Relacionados:Google Flow Music Suno

Silnei L Andrade

Co-criador do Mochileiros.com, do Coletivo Mariachi e da MVAI. Pedreiro da web desde 1997, midiativista e lúmpen escrevinhador. Responsável pela inserção do verbete "Mochileiro" e "Midiativismo" na Wikipedia em Português.

Clique para comentar

Tecnologia & IA

Suno capta US$ 400 milhões e mostra que a música por IA virou negócio bilionário

Promptado, editado e publicado

6 dias atrás

9 de junho de 2026

por

Redação MVAI

A Suno, uma das startups mais conhecidas de geração musical por inteligência artificial, anunciou uma nova rodada de investimento de mais de US$ 400 milhões. Com o aporte, a empresa passa a ser avaliada em US$ 5,4 bilhões, consolidando-se como uma das companhias mais valiosas no setor de música generativa.

A rodada Série D foi liderada pela Bond Capital e contou com a participação de IVP, Forerunner, Union Square Ventures, Alkeon e Quiet. Investidores já presentes na companhia, como Matrix, Lightspeed, Menlo Ventures e Schroders Capital, também acompanharam o novo financiamento.

A Suno permite que usuários criem músicas completas a partir de comandos de texto, incluindo letra, voz, arranjos e instrumentação. A proposta seduziu milhões de usuários, de curiosos que fazem músicas para ocasiões pessoais a produtores e compositores profissionais interessados em incorporar ferramentas de IA ao fluxo criativo.

Segundo a empresa, o novo capital será usado para ampliar a plataforma, desenvolver modelos musicais mais avançados e lançar novos serviços. A Suno também afirma que pretende começar a disponibilizar, nos próximos meses, seu primeiro modelo musical desenvolvido em parceria com a indústria fonográfica.

Esse ponto é central para entender a nova fase da companhia. A Suno cresceu rapidamente em um ambiente marcado por entusiasmo, mas também por forte resistência de gravadoras, editoras e artistas. Empresas de música generativa como Suno e Udio foram acusadas de treinar seus modelos com obras protegidas por direitos autorais sem autorização ou compensação aos titulares.

Nos últimos anos, a tensão entre inteligência artificial e indústria musical passou dos debates abstratos para os tribunais. Grandes gravadoras e artistas independentes moveram ações contra plataformas de música generativa, questionando a legalidade do uso de catálogos protegidos no treinamento de modelos. O argumento das empresas de IA costuma se apoiar em interpretações de “uso justo”, enquanto titulares de direitos defendem que o treinamento sem licença constitui exploração comercial não autorizada.

Ao mesmo tempo, parte da indústria começa a buscar acordos em vez de apenas litígios. Em 2025, a Suno anunciou uma parceria com a Warner Music Group para desenvolver experiências de criação musical baseadas em conteúdo licenciado e em participação opt-in de artistas. A ideia é permitir que nomes, vozes, imagens, composições e estilos sejam usados em novas experiências de IA apenas quando houver autorização, controle e compensação.

A movimentação não acontece isoladamente. Spotify e Universal Music Group também anunciaram acordos de licenciamento para permitir a criação de covers e remixes por IA dentro de um modelo pago e controlado. Na prática, o mercado parece testar uma transição: da IA musical vista como ameaça pirata para uma infraestrutura licenciada de criação, remixagem e engajamento de fãs.

Para os investidores, a aposta é clara. A música por IA pode abrir uma nova camada da economia do entretenimento, baseada não apenas no consumo passivo de faixas, mas na participação ativa dos usuários. Em vez de apenas apertar o play, o público passa a criar, adaptar, brincar e compartilhar músicas personalizadas.

Para artistas e gravadoras, o dilema é mais delicado. Há potencial de novas receitas, novas formas de interação com fãs e expansão criativa. Mas há também riscos evidentes: substituição de trabalho humano, diluição de identidade artística, uso indevido de vozes e estilos, além da dificuldade de rastrear autoria, remuneração e consentimento em escala.

O novo aporte da Suno mostra que, apesar das disputas legais, o capital de risco segue convencido de que a música generativa será uma das grandes frentes comerciais da inteligência artificial. A pergunta já não é se a IA vai participar da cadeia musical, mas em quais condições: com licença, transparência e remuneração — ou em uma guerra permanente entre inovação tecnológica e direitos autorais.

A próxima etapa da Suno será decisiva. Se a empresa conseguir migrar para modelos treinados com acordos industriais robustos, poderá se apresentar como uma ponte entre tecnologia e mercado musical. Se não conseguir, continuará sendo símbolo de uma contradição cada vez mais visível: uma plataforma capaz de democratizar a criação musical, mas construída sobre uma disputa ainda aberta sobre quem deve ser pago quando a máquina aprende a cantar.

Fonte: Silicon Angle

Continuar lendo

Tecnologia & IA

Novo Gemini Omni leva edição conversacional para vídeos com IA

Promptado, editado e publicado

4 semanas atrás

20 de maio de 2026

por

Redação MVAI

O Google apresentou, durante o Google I/O 2026, o Gemini Omni, uma nova família de modelos de inteligência artificial voltada à criação multimodal. A promessa é ambiciosa: permitir que usuários criem conteúdos a partir de diferentes tipos de entrada — texto, imagem, vídeo e áudio — começando pela geração e edição de vídeos. A empresa define o Omni como um passo na direção de uma IA capaz de “criar qualquer coisa a partir de qualquer entrada”.

O primeiro modelo da família é o Gemini Omni Flash, que chega com foco em vídeos curtos. Segundo o Google, ele será capaz de gerar vídeos de até 10 segundos, criar áudio sintético nativo, transformar até cinco fotos em vídeo, editar cenas em múltiplas etapas e trabalhar com avatares personalizados. A novidade exige assinatura de um plano Google AI, com disponibilidade variando por região e faixa de produto.

Na prática, o Omni aproxima a criação de vídeo da lógica de uma conversa. Em vez de depender de softwares complexos de edição, o usuário poderá pedir alterações em linguagem natural: trocar cenário, modificar estilo visual, ajustar personagens, transformar uma foto em clipe ou refinar uma sequência já gerada. O próprio Google descreve a ferramenta como uma espécie de “Nano Banana para vídeos”, em referência ao seu modelo de geração e edição de imagens.

A mudança também marca uma reorganização importante dentro do ecossistema de mídia generativa do Google. O Gemini Omni deve substituir o Veo no app Gemini, combinando a inteligência central do Gemini com recursos avançados de geração de mídia. Enquanto o Veo era mais associado à geração de vídeo a partir de prompts, o Omni amplia o conceito ao permitir que vídeos, imagens e outros elementos sirvam como referência para novas criações.

Para criadores, publicitários e produtores de conteúdo, o ponto mais relevante talvez não seja apenas a geração de vídeos, mas a edição conversacional. O Google afirma que o Omni Flash melhora a consistência de personagens, preservando identidade e voz ao longo de diferentes cenas. Esse tipo de recurso pode ser decisivo para campanhas, narrativas seriadas, vídeos educacionais e conteúdos de marca, áreas em que a coerência visual costuma ser uma das maiores limitações dos modelos generativos.

Outro destaque é a criação de avatares de IA. A ferramenta permite que usuários criem versões digitais de si mesmos para aparecer em vídeos gerados artificialmente. Segundo a Wired, o processo envolve capturar rosto e voz pelo celular, com movimentos de cabeça e leitura de uma sequência de números. A proposta inicial do Google é permitir que usuários gerem vídeos de si próprios, não de terceiros.

Essa funcionalidade, porém, reacende o debate sobre deepfakes, autenticidade e transparência. O Google afirma que vídeos criados com Omni terão marca d’água digital SynthID, tecnologia usada para identificar conteúdos gerados por IA. A Associated Press também registrou que a empresa pretende expandir ferramentas de verificação de credenciais de conteúdo no Gemini e, futuramente, no Chrome.

O lançamento acontece em um momento de corrida acelerada pela liderança em vídeo generativo. OpenAI, Runway, Luma AI, ByteDance e outros competidores disputam espaço em um mercado que interessa tanto a criadores independentes quanto a estúdios, marcas e plataformas sociais. O diferencial do Google é tentar integrar a geração de mídia diretamente ao Gemini, ao YouTube Shorts e ao Google Flow, criando um fluxo que vai da ideia ao vídeo final dentro do próprio ecossistema da empresa.

No Google Flow, o Omni Flash será usado em conjunto com recursos de agente criativo. A empresa afirma que o Flow Agent poderá ajudar em brainstorming, criação, edição em lote, organização de arquivos e desenvolvimento de ferramentas personalizadas por linguagem natural. O Google também anunciou que o Omni será integrado ao Flow Music, permitindo criar vídeos musicais a partir de orientação conversacional.

Apesar do entusiasmo, ainda há limites claros. A versão inicial trabalha com vídeos curtos, de até 10 segundos, e alguns recursos dependem de assinatura, plataforma, país e idade mínima. O próprio Google informa que funcionalidades podem variar por nível de plano e região.

Ainda assim, o Gemini Omni sinaliza uma virada estratégica. O vídeo com IA deixa de ser apenas uma ferramenta de geração a partir de texto e passa a se aproximar de um ambiente de produção completo, no qual o usuário conversa, edita, refina, reaproveita referências e mantém personagens consistentes. Para o mercado criativo, isso pode reduzir barreiras técnicas. Para a sociedade, amplia a urgência de discutir autoria, consentimento, identificação de conteúdo sintético e confiança nas imagens que circulam online.

No fim, o Google não está apenas lançando mais um modelo de vídeo. Está tentando transformar o Gemini em uma plataforma de criação multimodal — e, ao mesmo tempo, disputar o futuro da produção audiovisual com IA.

Continuar lendo

Tecnologia & IA

Google testa ferramenta que pode transformar o Gemini em estúdio de vídeo com IA

Promptado, editado e publicado

1 mês atrás

11 de maio de 2026

por

Redação MVAI

O Google pode estar prestes a dar mais um passo na disputa pelo futuro do vídeo gerado por inteligência artificial. Um novo modelo chamado Gemini Omni apareceu para alguns usuários dentro do Gemini, com uma descrição que promete criação de vídeos, remixagem, edição direta no chat e uso de templates. A descoberta foi relatada pela 9to5Google nesta segunda-feira, 11 de maio de 2026, e reforçada por publicações especializadas que acompanham testes e vazamentos de produtos de IA.

A frase exibida na interface era direta: “Create with Gemini Omni”. Segundo os relatos, o Google descreve o recurso como um novo modelo de geração de vídeo capaz de remixar vídeos, editar conteúdos por conversa e partir de modelos prontos. Ainda não está claro se o Omni será um modelo totalmente novo, uma camada de produto sobre o Veo ou uma evolução integrada da estratégia multimodal do Gemini.

As primeiras demos chamaram atenção por dois motivos. A primeira mostrava um professor escrevendo uma prova matemática em um quadro, um tipo de cena difícil para modelos de vídeo porque exige coerência visual, texto legível e continuidade de movimento. A segunda brincava com um teste clássico de IA generativa: pessoas comendo espaguete, referência ao famoso meme dos primeiros vídeos gerados artificialmente, quando mãos, bocas, talheres e comida viravam um pequeno carnaval de horrores digitais. Segundo a 9to5Google, os resultados ainda têm sinais visíveis de geração por IA, mas já mostram avanço considerável em realismo e aderência ao prompt.

O ponto mais importante para criadores, videomakers e produtores independentes não é apenas a geração de vídeo a partir de texto. O diferencial sugerido pelo vazamento está na edição conversacional: trocar objetos, remixar cenas, editar vídeos diretamente no chat e trabalhar a partir de templates. O TestingCatalog afirma que os testes iniciais indicam desempenho especialmente forte em tarefas de edição, incluindo substituição de elementos e reescrita de cenas por instruções em linguagem natural.

Esse detalhe é estratégico. A geração bruta de vídeo já virou território disputado por Google, OpenAI, ByteDance, Runway, Luma e outras empresas. Mas a próxima fronteira pode ser menos “crie um vídeo do zero” e mais “pegue este material e transforme em outra coisa”. Para a indústria criativa, isso muda o jogo: o modelo deixa de ser apenas um gerador de clipes e começa a se comportar como um assistente de pós-produção.

Também apareceu para alguns usuários uma aba de uso, indicando que a criação de vídeos com Omni pode consumir rapidamente os limites diários de planos pagos. A própria página de suporte do Google já trata geração de vídeo como recurso sujeito a limites por plano e afirma que os limites podem mudar com frequência por demanda e capacidade.

O vazamento chega poucos dias antes do Google I/O 2026, marcado oficialmente para 19 e 20 de maio. A página do evento promete keynotes, sessões e novidades com foco em IA, Gemini, Android, Chrome e Cloud. O blog de desenvolvedores do Google também afirma que a conferência trará avanços de IA e atualizações de modelos Gemini, o que torna o evento o palco mais provável para uma explicação oficial sobre o Omni, caso o produto esteja realmente pronto para anúncio.

Por enquanto, convém tratar o Gemini Omni como um vazamento forte, não como lançamento oficial. O Google ainda não apresentou publicamente o produto nem explicou como ele se encaixará na família Veo. Mas a direção é clara: a Big Tech quer que o Gemini deixe de ser apenas um chatbot multimodal e se torne um ambiente completo de criação — texto, imagem, vídeo, edição e talvez, em breve, fluxo de produção audiovisual.

Para creators, artistas visuais, diretores de clipes, agências pequenas e produtores independentes, a promessa é sedutora: um estúdio criativo dentro de uma conversa. Para o mercado, o recado é menos poético e mais brutal: a guerra do vídeo com IA ainda nem começou direito, e o Google parece disposto a colocar seu exército dentro do Gemini.

Fonte: 9to5Google

Continuar lendo