Tecnologia & IA
Kling 3.0: a nova IA chinesa que promete revolucionar a criação de videoclipes
A corrida global pelas IAs de geração de vídeo acaba de ganhar mais um capítulo de peso. A empresa chinesa Kuaishou lançou a nova geração de sua plataforma de criação audiovisual baseada em inteligência artificial: Kling 3.0, um modelo multimodal que promete levar a produção de vídeo automatizada a um novo patamar.
A atualização marca um salto tecnológico importante para o ecossistema de criação audiovisual com IA, aproximando ferramentas automatizadas do nível de produção cinematográfica e ampliando a disputa com sistemas como Sora, da OpenAI, e outros modelos emergentes no mercado.
IA cada vez mais próxima do cinema
A nova geração do modelo permite gerar vídeos a partir de texto, imagens, áudio ou referências visuais, integrando todos esses elementos em um único fluxo de criação. A ideia é simplificar o processo criativo: em vez de usar várias ferramentas diferentes, o criador pode gerar, editar e estruturar uma narrativa audiovisual dentro do próprio sistema.
Entre as novidades técnicas estão:
- geração de clipes com até 15 segundos de duração,
- maior consistência de personagens e cenários entre quadros,
- sincronização nativa de áudio e imagem,
- melhoria significativa na qualidade fotográfica das cenas.
Na prática, isso significa que a IA consegue produzir pequenas sequências com estética cinematográfica, mantendo coerência visual e narrativa — algo que ainda era um desafio em modelos anteriores.
Do prompt ao filme
O sistema foi desenvolvido com uma arquitetura multimodal que unifica compreensão e geração de conteúdo audiovisual. Isso permite que o usuário envie texto, imagens, vídeos ou sons como referência, e o modelo transforme esses elementos em uma sequência de vídeo finalizada.
A proposta da Kuaishou é clara: tornar possível que qualquer criador se torne, ao menos em teoria, um “diretor assistido por IA”.
Em termos de produção cultural, isso pode impactar diretamente áreas como:
- videoclipes musicais
- conteúdo para redes sociais
- storytelling audiovisual
- publicidade digital
- animação experimental
A nova guerra das IAs de vídeo
O lançamento acontece em um momento de forte disputa no setor de vídeo generativo. Plataformas chinesas vêm acelerando lançamentos para competir com ferramentas ocidentais e dominar um mercado que deve crescer rapidamente nos próximos anos.
Nos últimos meses, modelos como Seedance 2.0, da ByteDance, e o próprio Kling vêm viralizando nas redes por gerar vídeos cada vez mais realistas e cinematográficos.
Essa evolução aponta para um cenário em que a criação audiovisual — inclusive na música e no cinema — pode se tornar cada vez mais híbrida, combinando direção humana com geração algorítmica.
O que isso significa para música e cultura pop
Para a indústria musical, ferramentas como o Kling 3.0 podem acelerar uma tendência que já vinha se consolidando: videoclipes produzidos total ou parcialmente por inteligência artificial.
Com prompts bem elaborados, artistas independentes podem criar narrativas visuais complexas sem depender de grandes orçamentos ou equipes técnicas.
Em outras palavras:
a IA começa a democratizar aquilo que antes era território exclusivo de grandes produtoras.
E, como sempre acontece quando uma nova tecnologia surge na arte, a pergunta deixa de ser “se” ela será usada — e passa a ser “como” os artistas vão transformá-la em linguagem estética.
Fonte: Sina
Tecnologia & IA
Suno capta US$ 400 milhões e mostra que a música por IA virou negócio bilionário
A Suno, uma das startups mais conhecidas de geração musical por inteligência artificial, anunciou uma nova rodada de investimento de mais de US$ 400 milhões. Com o aporte, a empresa passa a ser avaliada em US$ 5,4 bilhões, consolidando-se como uma das companhias mais valiosas no setor de música generativa.
A rodada Série D foi liderada pela Bond Capital e contou com a participação de IVP, Forerunner, Union Square Ventures, Alkeon e Quiet. Investidores já presentes na companhia, como Matrix, Lightspeed, Menlo Ventures e Schroders Capital, também acompanharam o novo financiamento.
A Suno permite que usuários criem músicas completas a partir de comandos de texto, incluindo letra, voz, arranjos e instrumentação. A proposta seduziu milhões de usuários, de curiosos que fazem músicas para ocasiões pessoais a produtores e compositores profissionais interessados em incorporar ferramentas de IA ao fluxo criativo.
Segundo a empresa, o novo capital será usado para ampliar a plataforma, desenvolver modelos musicais mais avançados e lançar novos serviços. A Suno também afirma que pretende começar a disponibilizar, nos próximos meses, seu primeiro modelo musical desenvolvido em parceria com a indústria fonográfica.
Esse ponto é central para entender a nova fase da companhia. A Suno cresceu rapidamente em um ambiente marcado por entusiasmo, mas também por forte resistência de gravadoras, editoras e artistas. Empresas de música generativa como Suno e Udio foram acusadas de treinar seus modelos com obras protegidas por direitos autorais sem autorização ou compensação aos titulares.
Nos últimos anos, a tensão entre inteligência artificial e indústria musical passou dos debates abstratos para os tribunais. Grandes gravadoras e artistas independentes moveram ações contra plataformas de música generativa, questionando a legalidade do uso de catálogos protegidos no treinamento de modelos. O argumento das empresas de IA costuma se apoiar em interpretações de “uso justo”, enquanto titulares de direitos defendem que o treinamento sem licença constitui exploração comercial não autorizada.
Ao mesmo tempo, parte da indústria começa a buscar acordos em vez de apenas litígios. Em 2025, a Suno anunciou uma parceria com a Warner Music Group para desenvolver experiências de criação musical baseadas em conteúdo licenciado e em participação opt-in de artistas. A ideia é permitir que nomes, vozes, imagens, composições e estilos sejam usados em novas experiências de IA apenas quando houver autorização, controle e compensação.
A movimentação não acontece isoladamente. Spotify e Universal Music Group também anunciaram acordos de licenciamento para permitir a criação de covers e remixes por IA dentro de um modelo pago e controlado. Na prática, o mercado parece testar uma transição: da IA musical vista como ameaça pirata para uma infraestrutura licenciada de criação, remixagem e engajamento de fãs.
Para os investidores, a aposta é clara. A música por IA pode abrir uma nova camada da economia do entretenimento, baseada não apenas no consumo passivo de faixas, mas na participação ativa dos usuários. Em vez de apenas apertar o play, o público passa a criar, adaptar, brincar e compartilhar músicas personalizadas.
Para artistas e gravadoras, o dilema é mais delicado. Há potencial de novas receitas, novas formas de interação com fãs e expansão criativa. Mas há também riscos evidentes: substituição de trabalho humano, diluição de identidade artística, uso indevido de vozes e estilos, além da dificuldade de rastrear autoria, remuneração e consentimento em escala.
O novo aporte da Suno mostra que, apesar das disputas legais, o capital de risco segue convencido de que a música generativa será uma das grandes frentes comerciais da inteligência artificial. A pergunta já não é se a IA vai participar da cadeia musical, mas em quais condições: com licença, transparência e remuneração — ou em uma guerra permanente entre inovação tecnológica e direitos autorais.
A próxima etapa da Suno será decisiva. Se a empresa conseguir migrar para modelos treinados com acordos industriais robustos, poderá se apresentar como uma ponte entre tecnologia e mercado musical. Se não conseguir, continuará sendo símbolo de uma contradição cada vez mais visível: uma plataforma capaz de democratizar a criação musical, mas construída sobre uma disputa ainda aberta sobre quem deve ser pago quando a máquina aprende a cantar.
Fonte: Silicon Angle
Tecnologia & IA
Novo Gemini Omni leva edição conversacional para vídeos com IA
O Google apresentou, durante o Google I/O 2026, o Gemini Omni, uma nova família de modelos de inteligência artificial voltada à criação multimodal. A promessa é ambiciosa: permitir que usuários criem conteúdos a partir de diferentes tipos de entrada — texto, imagem, vídeo e áudio — começando pela geração e edição de vídeos. A empresa define o Omni como um passo na direção de uma IA capaz de “criar qualquer coisa a partir de qualquer entrada”.
O primeiro modelo da família é o Gemini Omni Flash, que chega com foco em vídeos curtos. Segundo o Google, ele será capaz de gerar vídeos de até 10 segundos, criar áudio sintético nativo, transformar até cinco fotos em vídeo, editar cenas em múltiplas etapas e trabalhar com avatares personalizados. A novidade exige assinatura de um plano Google AI, com disponibilidade variando por região e faixa de produto.
Na prática, o Omni aproxima a criação de vídeo da lógica de uma conversa. Em vez de depender de softwares complexos de edição, o usuário poderá pedir alterações em linguagem natural: trocar cenário, modificar estilo visual, ajustar personagens, transformar uma foto em clipe ou refinar uma sequência já gerada. O próprio Google descreve a ferramenta como uma espécie de “Nano Banana para vídeos”, em referência ao seu modelo de geração e edição de imagens.
A mudança também marca uma reorganização importante dentro do ecossistema de mídia generativa do Google. O Gemini Omni deve substituir o Veo no app Gemini, combinando a inteligência central do Gemini com recursos avançados de geração de mídia. Enquanto o Veo era mais associado à geração de vídeo a partir de prompts, o Omni amplia o conceito ao permitir que vídeos, imagens e outros elementos sirvam como referência para novas criações.
Para criadores, publicitários e produtores de conteúdo, o ponto mais relevante talvez não seja apenas a geração de vídeos, mas a edição conversacional. O Google afirma que o Omni Flash melhora a consistência de personagens, preservando identidade e voz ao longo de diferentes cenas. Esse tipo de recurso pode ser decisivo para campanhas, narrativas seriadas, vídeos educacionais e conteúdos de marca, áreas em que a coerência visual costuma ser uma das maiores limitações dos modelos generativos.
Outro destaque é a criação de avatares de IA. A ferramenta permite que usuários criem versões digitais de si mesmos para aparecer em vídeos gerados artificialmente. Segundo a Wired, o processo envolve capturar rosto e voz pelo celular, com movimentos de cabeça e leitura de uma sequência de números. A proposta inicial do Google é permitir que usuários gerem vídeos de si próprios, não de terceiros.
Essa funcionalidade, porém, reacende o debate sobre deepfakes, autenticidade e transparência. O Google afirma que vídeos criados com Omni terão marca d’água digital SynthID, tecnologia usada para identificar conteúdos gerados por IA. A Associated Press também registrou que a empresa pretende expandir ferramentas de verificação de credenciais de conteúdo no Gemini e, futuramente, no Chrome.
O lançamento acontece em um momento de corrida acelerada pela liderança em vídeo generativo. OpenAI, Runway, Luma AI, ByteDance e outros competidores disputam espaço em um mercado que interessa tanto a criadores independentes quanto a estúdios, marcas e plataformas sociais. O diferencial do Google é tentar integrar a geração de mídia diretamente ao Gemini, ao YouTube Shorts e ao Google Flow, criando um fluxo que vai da ideia ao vídeo final dentro do próprio ecossistema da empresa.
No Google Flow, o Omni Flash será usado em conjunto com recursos de agente criativo. A empresa afirma que o Flow Agent poderá ajudar em brainstorming, criação, edição em lote, organização de arquivos e desenvolvimento de ferramentas personalizadas por linguagem natural. O Google também anunciou que o Omni será integrado ao Flow Music, permitindo criar vídeos musicais a partir de orientação conversacional.
Apesar do entusiasmo, ainda há limites claros. A versão inicial trabalha com vídeos curtos, de até 10 segundos, e alguns recursos dependem de assinatura, plataforma, país e idade mínima. O próprio Google informa que funcionalidades podem variar por nível de plano e região.
Ainda assim, o Gemini Omni sinaliza uma virada estratégica. O vídeo com IA deixa de ser apenas uma ferramenta de geração a partir de texto e passa a se aproximar de um ambiente de produção completo, no qual o usuário conversa, edita, refina, reaproveita referências e mantém personagens consistentes. Para o mercado criativo, isso pode reduzir barreiras técnicas. Para a sociedade, amplia a urgência de discutir autoria, consentimento, identificação de conteúdo sintético e confiança nas imagens que circulam online.
No fim, o Google não está apenas lançando mais um modelo de vídeo. Está tentando transformar o Gemini em uma plataforma de criação multimodal — e, ao mesmo tempo, disputar o futuro da produção audiovisual com IA.
Tecnologia & IA
Google testa ferramenta que pode transformar o Gemini em estúdio de vídeo com IA
O Google pode estar prestes a dar mais um passo na disputa pelo futuro do vídeo gerado por inteligência artificial. Um novo modelo chamado Gemini Omni apareceu para alguns usuários dentro do Gemini, com uma descrição que promete criação de vídeos, remixagem, edição direta no chat e uso de templates. A descoberta foi relatada pela 9to5Google nesta segunda-feira, 11 de maio de 2026, e reforçada por publicações especializadas que acompanham testes e vazamentos de produtos de IA.
A frase exibida na interface era direta: “Create with Gemini Omni”. Segundo os relatos, o Google descreve o recurso como um novo modelo de geração de vídeo capaz de remixar vídeos, editar conteúdos por conversa e partir de modelos prontos. Ainda não está claro se o Omni será um modelo totalmente novo, uma camada de produto sobre o Veo ou uma evolução integrada da estratégia multimodal do Gemini.
As primeiras demos chamaram atenção por dois motivos. A primeira mostrava um professor escrevendo uma prova matemática em um quadro, um tipo de cena difícil para modelos de vídeo porque exige coerência visual, texto legível e continuidade de movimento. A segunda brincava com um teste clássico de IA generativa: pessoas comendo espaguete, referência ao famoso meme dos primeiros vídeos gerados artificialmente, quando mãos, bocas, talheres e comida viravam um pequeno carnaval de horrores digitais. Segundo a 9to5Google, os resultados ainda têm sinais visíveis de geração por IA, mas já mostram avanço considerável em realismo e aderência ao prompt.
O ponto mais importante para criadores, videomakers e produtores independentes não é apenas a geração de vídeo a partir de texto. O diferencial sugerido pelo vazamento está na edição conversacional: trocar objetos, remixar cenas, editar vídeos diretamente no chat e trabalhar a partir de templates. O TestingCatalog afirma que os testes iniciais indicam desempenho especialmente forte em tarefas de edição, incluindo substituição de elementos e reescrita de cenas por instruções em linguagem natural.
Esse detalhe é estratégico. A geração bruta de vídeo já virou território disputado por Google, OpenAI, ByteDance, Runway, Luma e outras empresas. Mas a próxima fronteira pode ser menos “crie um vídeo do zero” e mais “pegue este material e transforme em outra coisa”. Para a indústria criativa, isso muda o jogo: o modelo deixa de ser apenas um gerador de clipes e começa a se comportar como um assistente de pós-produção.
Também apareceu para alguns usuários uma aba de uso, indicando que a criação de vídeos com Omni pode consumir rapidamente os limites diários de planos pagos. A própria página de suporte do Google já trata geração de vídeo como recurso sujeito a limites por plano e afirma que os limites podem mudar com frequência por demanda e capacidade.
O vazamento chega poucos dias antes do Google I/O 2026, marcado oficialmente para 19 e 20 de maio. A página do evento promete keynotes, sessões e novidades com foco em IA, Gemini, Android, Chrome e Cloud. O blog de desenvolvedores do Google também afirma que a conferência trará avanços de IA e atualizações de modelos Gemini, o que torna o evento o palco mais provável para uma explicação oficial sobre o Omni, caso o produto esteja realmente pronto para anúncio.
Por enquanto, convém tratar o Gemini Omni como um vazamento forte, não como lançamento oficial. O Google ainda não apresentou publicamente o produto nem explicou como ele se encaixará na família Veo. Mas a direção é clara: a Big Tech quer que o Gemini deixe de ser apenas um chatbot multimodal e se torne um ambiente completo de criação — texto, imagem, vídeo, edição e talvez, em breve, fluxo de produção audiovisual.
Para creators, artistas visuais, diretores de clipes, agências pequenas e produtores independentes, a promessa é sedutora: um estúdio criativo dentro de uma conversa. Para o mercado, o recado é menos poético e mais brutal: a guerra do vídeo com IA ainda nem começou direito, e o Google parece disposto a colocar seu exército dentro do Gemini.
Fonte: 9to5Google
-
Videoclipe2 semanas atrásNeural Frames mira US$ 5 milhões ao transformar músicas em videoclipes com IA
-
Cinema2 semanas atrásDreams of Violets: Feito por IA, drama sobre o Irã estreia em Tribeca e reacende debate no cinema
-
Cinema1 semana atrásScorsese leva a IA para o storyboard — e reacende a guerra cultural em Hollywood
-
Tecnologia & IA1 semana atrásSuno capta US$ 400 milhões e mostra que a música por IA virou negócio bilionário
-
Cinema2 dias atrásTribeca indica o caminho: IA no cinema precisa de autoria humana
-
Cinema2 dias atrás“Dreams of Violets” é o marco zero do cinema de guerrilha com IA
-
Videoclipe17 horas atrásAos 65, Boy George lança versão de Karma Chameleon com inteligência artificial