Tecnologia & IA
IA para Criar Música: A Nova Revolução Sonora Já Começou
De Suno IA a Udio e Producer.AI — conheça as ferramentas que estão transformando o modo de compor, produzir e imaginar a música no século XXI.
O Que é “IA para Criar Música”
IA para criar música se refere ao uso de inteligência artificial generativa para compor, arranjar, cantar e até mixar faixas completas.
A Era das Plataformas Criativas: Suno IA, Udio e Producer.AI
A explosão de plataformas voltadas à IA para criar música marca uma nova fase na indústria.
Vamos conhecer as principais:
Suno IA
A Suno é uma das mais completas plataformas de IA para criar música com voz e letra.
Com base em comandos de texto, ela gera faixas originais com vocais realistas, permitindo controlar gênero, andamento, emoção e até idioma.
Criadores do Brasil inteiro já estão usando o Suno Studio para dar vida a projetos autorais e até experimentar novos gêneros — do trap ao sertanejo anarquista, passando por hyperpop, lo-fi e dubstep nordestino.
Udio
O Udio (de “audio”, em inglês) é um dos concorrentes diretos da Suno.
Criado por ex-pesquisadores do Google DeepMind, o sistema oferece geração musical ultrarrápida, com foco em estética pop, eletrônica e cinematográfica.
A plataforma ganhou fama pela facilidade de uso: basta uma frase descritiva, como “balada indie melancólica com voz feminina suave”, e a IA compõe melodia, letra e instrumentais coerentes em segundos.
Além disso, o Udio possui camadas de remixagem e refinamento, permitindo ajustar a obra até o nível de produção profissional.
Producer.AI
Já o Producer.AI mira o público técnico — DJs, beatmakers e produtores.
Sua força está na geração de bases instrumentais, loops, stems isolados e mixagem automatizada.
A ferramenta se integra a softwares como Ableton e FL Studio, transformando o processo de produção em algo colaborativo entre humano e máquina.
É como ter um co-produtor 24 horas por dia, aprendendo seu estilo e antecipando suas ideias.
Como criar uma música na Suno AI: Passo a passo (rápido)
- Acesse e faça login
Entre na Suno, clique em Create. - Escolha o modo de criação
- Texto → Música (Text to Music): você descreve o estilo e a IA cria tudo.
- Custom / Lyrics: cole sua letra e descreva o estilo (gênero, bpm, instrumentos, vibe).

- Escreva um prompt claro
Inclua: gênero + subgênero, mood, BPM, tom (opcional), instrumentos, referências de clima (sem copiar melodia), idioma, voz (masc/fem/duo) e duração desejada. - (Opcional) Cole a letra com seções
Use marcações de estrutura (a Suno entende bem seções claras):[Intro] [Verse] [Pre-Chorus] [Chorus] [Post-Chorus] [Bridge] [Outro] - Gere e avalie
Clique em Generate. A Suno cria duas variações. Ouça, salve a melhor e, se quiser, use Remix/Regenerate com ajustes no prompt. - Refine
- Quer mais “refrão”? Reforce no prompt: “refrão forte e memorável, repete 2x”.
- Muito denso? Peça: “arranjo mais minimal, espaço para voz”.
- Precisa ficar mais longo? Use Continue/Extend para chegar a 2–4 min.
- Finalize e baixe
Quando estiver ok, baixe o áudio (mp3/wav) e, se quiser, copie a letra. Revise loudness e faça um remix final se necessário.
Criar música usando a Suno Studio
Como criar uma música na Udio: Passo a passo (rápido)
- Crie sua conta e entre
Acesse a Udio, faça login e clique em Create / New song. - Escolha o modo de criação
- Text-to-music: você descreve estilo, clima e referências.
- (Opcional) Lyrics: cole/edite a letra antes de gerar.
- (Opcional) Instrumental: marque se quiser sem voz.

- Escreva um prompt claro
Use: [Gênero principal] + [subgênero] + [clima] + [instrumentos] + [referências] + [andamento] + [produção].
Ex.: “Trap, forró eletrônico, clima nostálgico e dançante, zabumba + 808 + sanfona, refrão chiclete, mix moderno, punch no kick, 120 BPM.” - Defina voz e idioma (se houver vocal)
- Masculina/feminina/dueto/coral.
- Idioma da letra (pt-BR, es, en).
Dica: diga no prompt “vocal feminino suave em pt-BR” ou “dueto pt-BR”.
- Estrutura e letra
- Indique no prompt ou no campo de letra blocos como:
[Intro] [Verse] [Pre-Chorus] [Chorus] [Bridge] [Outro]. - Se não tiver letra, peça: “criar letra curta com tema X, refrão memorável e rimas simples.”
- Ajustes avançados (se disponíveis)
- BPM (ex.: 90, 120, 140).
- Tonalidade (ex.: Am, C#m).
- Duração inicial (escolha um trecho curto para testar).
- Gerar a prévia
Clique em Generate. Aguarde a renderização e ouça o resultado. - Refinar com variações
- Variations/Remix: peça “mais agressivo”, “menos reverb”, “+sanfona”, “+808”, “voz mais íntima”, etc.
- Edit Lyrics: ajuste palavras do refrão para grudar mais.
- Repita até acertar o vibe.
- Estender a música
Use Extend/Continue para aumentar o comprimento (adicionar novo verso, bridge, solo).
Dica: ao estender, adiante instruções: “novo verso com resposta do dueto; bridge com tensão e drop final.” - Exportar e organizar
- Baixe em MP3/WAV (e stems, se disponível na sua conta/plano).
- Nomeie: Artista — Título — Versão (BPM/Key).
- Guarde o prompt/lyrics usados (facilita remixes futuros).
Como criar uma música na Udio em 5 minutos: Tutorial (rápido)
Como criar na Producer.AI (Passo a passo)
1 – Faça o login
2 – Clique no botão “New Session”
3 – Escreva o que quiser no Prompt
O processo de criação na Producer.AI é muito parecido com o ChatGPT. O prompt é livre e você cria a música livremente passo a passo e pode utilizar tags de estrutura musical na letra, inserir livremente o estilo, o BPM, inserir camadas de instrumentos, etc

Minhas experiências criando músicas com IA
Nos últimos dois anos, mergulhei de cabeça na criação musical com inteligência artificial usando a Suno IA. Foram mais de 2.000 prompts gerados nesse período — e desse processo intenso nasceram 50 músicas autorais, todas com letras originais.
Minha técnica foi simples, mas exigiu paciência: gerar, ouvir, escolher e aprimorar. A cada nova tentativa, eu fazia uma espécie de curadoria criativa, selecionando as melhores versões e, muitas vezes, reescrevendo partes das letras ou ajustando os arranjos até chegar no resultado ideal. É um trabalho de experimentação contínua — onde cada prompt é um convite para descobrir algo novo.
O mais interessante é perceber que a IA não substitui o artista; ela amplia as possibilidades. A Suno IA virou uma espécie de instrumento digital que eu aprendi a “tocar” com palavras, transformando ideias em sons e sentimentos.
Se você também quer explorar esse universo, comece sem medo. Gere muito, ouça tudo e aprenda com o processo.
O que são essas “tags de estrutura musical”?
No site da wiki da SingGenix vemos que há um guia chamado “Song Structure Tags”, onde se explicita que além do quadro padrão verso-refrão, outras partes da música podem ser controladas via metatags no prompt ou na letra. wiki.singgenix.com+1
Ou seja: você escreve ou instrui a IA com tags como [Intro], [Hook], [Break], etc., para influenciar (mas não garantir) como a música vai se desdobrar. wiki.singgenix.com+1
Importante: “tendência” – ou seja, a IA pode ignorar ou dar uma “via própria”. wiki.singgenix.com+1
Então, pense nelas como alavancas de estruturação, não como promessas invioláveis.
Principais tags explicadas
Aqui vão as tags mais úteis, com o que fazem — use como checklist quando estiver escrevendo ou montando o prompt/estrutura.
| Tag | Função | Dica provocativa |
|---|---|---|
[Intro] ou [Short Instrumental Intro] | Seção inicial, muitas vezes instrumental. No site: “notoriamente pouco confiável” quando você espera controle total. wiki.singgenix.com+1 | Aquele momento pra fisgar o ouvinte antes dele sair pro TikTok. |
[Hook] ou [Catchy Hook] | Um trecho repetitivo, frase ou instrumental que “gruda”. Do guia: “repetir 2–4 vezes” ajuda. wiki.singgenix.com | “Hook” = o que vai ser o meme da faixa no seu canal YouTube. |
[Break] ou [Percussion Break] | Pausa ou interrupção no padrão principal: talvez o vocal suma, os instrumentos acompanhem. wiki.singgenix.com | Use quando quiser que o ouvinte “espere algo” — tipo suspense antes do drop sertanejo diferenciado. |
[Interlude] ou [melodic interlude] | Instrumental dentro da letra/estrutura. wiki.singgenix.com | Ideal para mostrar solo de viola-caipira com IA, enquanto o agronegócio se estremece. |
[Outro], [Refrain], [Big Finish] | Seções finais: preparar para o fim, loop para fade-out, etc. wiki.singgenix.com | Perfeito para seu “levantamento de munição” anárquica sonora. |
[End], [Fade Out], [Fade to End] | Marca o fim, melhor usado sozinho como “clip separado”. wiki.singgenix.com | Use quando quiser que a pista termine como um tiro de efeito. |
Além disso, o site também menciona as tags para Verse/Chorus, Pre-chorus/Bridge, etc. wiki.singgenix.com+1
Como montar uma estrutura musical típica com essas tags
A seguir, uma “receita” padrão que você pode usar — e modificar para seu estilo (sertanejo anarquista + IA) —, junto com exemplos de tags.
Exemplo de estrutura:
[Intro]
[Verse]
[Pre-Chorus]
[Chorus]
[Verse]
[Pre-Chorus]
[Chorus]
[Bridge]
[Chorus]
[Outro]
[End]
Tecnologia & IA
Kling no topo, Sora fora de cena: a nova guerra do cinema IA
Há uma cena acontecendo agora no porão luminoso da inteligência artificial: não é exatamente cinema, não é exatamente videoclipe, não é publicidade, não é televisão. É tudo isso passando junto num projetor febril, como se Glauber Rocha tivesse encontrado um servidor cheio de GPUs, Rogério Sganzerla tivesse ganhado uma arena de benchmarks e os Mutantes resolvessem ensaiar dentro de uma timeline de edição.
A página “Best AI for Video Generation in 2026”, publicada pela LLM Stats, chega como um daqueles cartazes de festival que reorganizam a conversa. O site ranqueia os principais modelos de geração de vídeo por IA a partir de votos humanos cegos: pessoas assistem aos vídeos sem saber qual modelo os criou e escolhem os melhores. Nesse baile mascarado dos algoritmos, a grife não entra no palco. O que vale é o plano, o movimento, a física, a permanência dos objetos, a capacidade de não transformar mão em polvo, cadeira em fumaça, rosto em carnaval involuntário.
No topo, segundo a LLM Stats, está o Kling v3, da Kuaishou. O dado chama atenção porque desloca o eixo simbólico da disputa. Durante muito tempo, a conversa pública sobre vídeo por IA foi dominada por nomes ocidentais: Sora, da OpenAI; Veo, do Google; Runway, a startup mais associada ao imaginário profissional de criação audiovisual; Luma, Pika e outros satélites dessa constelação. Mas o ranking aponta outra batida: a China não está apenas correndo atrás. Está puxando o refrão.
A vitória do Kling, no enquadramento da LLM Stats, parece menos um prêmio de beleza e mais um prêmio de corpo. O modelo é destacado por sua física de movimento, pela continuidade dos objetos e pelo custo competitivo. Em vídeo gerado por IA, isso é decisivo. A imagem parada já foi domesticada. O retrato bonito, o pôster fake, a capa de disco inexistente, tudo isso virou feira livre. O problema agora é o tempo. O problema é fazer o personagem atravessar a sala sem derreter. Fazer a câmera girar sem rasgar a anatomia. Fazer uma onda bater sem parecer gelatina sem memória. Fazer o cinema deixar de ser ilustração e começar a respirar.
É aí que a página da LLM Stats entra como termômetro de uma mudança maior. O ranking não mede apenas “qual ferramenta é melhor”. Ele mede uma virada cultural: a geração de vídeo por IA saiu da fase do truque e entrou na fase da linguagem. Antes, a pergunta era: “consegue gerar?”. Agora é: “consegue dirigir?”.
A arena como cineclube selvagem
O método usado pela LLM Stats segue a lógica das arenas de avaliação: prompts são enviados a diferentes modelos, os vídeos são exibidos sem identificação, e os usuários votam. É um cineclube selvagem, sem ficha técnica, sem tapete vermelho, sem assessoria de imprensa cochichando no ouvido. A obra aparece nua. A marca some. O modelo que sobrevive é aquele que convence no olho.
Esse tipo de avaliação tem seus limites. Voto humano não é verdade divina. Pode privilegiar brilho, realismo fácil, impacto imediato. Pode confundir “parece caro” com “é melhor”. Pode premiar estética de trailer, clipe de luxo, publicidade de perfume, enquanto ignora sutilezas narrativas. Mas, para uma tecnologia que pretende fabricar imagens em movimento para humanos, a preferência humana importa. Cinema também sempre viveu disso: sala escura, respiração coletiva, aplauso, vaia, silêncio.
O curioso é que rankings diferentes contam histórias diferentes. Em outros placares especializados, como os da Artificial Analysis, Seedance 2.0, HappyHorse, Kling e outros modelos aparecem alternando posições conforme o recorte: com áudio, sem áudio, texto-para-vídeo, imagem-para-vídeo, preço, velocidade, qualidade percebida. É como comparar escolas de samba: uma ganha bateria, outra ganha comissão de frente, outra leva enredo, outra perde no recuo. O campeão depende da avenida.
A LLM Stats, ao colocar Kling v3 na liderança geral, enfatiza uma combinação de realismo, movimento e custo. A Artificial Analysis, por sua vez, mostra como Seedance 2.0 e HappyHorse também ocupam o centro da disputa. O resultado não é uma tabela pacificada, mas uma cena em ebulição. O ranking é menos sentença e mais fotografia de um incêndio.
O fantasma de Sora e a saída pela esquerda
O nome ausente ou deslocado nessa nova conversa é Sora. Quando a OpenAI apresentou o Sora original, em 2024, a impressão foi de choque. A promessa era quase ontológica: não apenas gerar vídeo, mas simular mundo. Depois veio Sora 2, com som, diálogo, física mais robusta e ambição de aplicativo social. Era a IA tentando virar TikTok, estúdio, brinquedo e espelho ao mesmo tempo.
Mas a trajetória pública do produto Sora virou também uma parábola sobre custo, risco e controle. A OpenAI informa que o produto Sora deixou de estar disponível em abril de 2026. A imagem que fica é de um astro que entrou cedo demais no palco, provocou histeria, abriu caminho, mas deixou o show antes do bis. O modelo pode continuar como tecnologia, mas o produto social, aquele teatro de avatares, cameos e remixes, saiu de cena.
Isso tem peso simbólico. Porque Sora era mais do que ferramenta: era narrativa. Era a promessa de que a OpenAI repetiria no vídeo o que fez no texto com o ChatGPT. Mas vídeo é outra fera. Texto custa pouco, viaja leve. Vídeo pesa. Vídeo queima computação. Vídeo encosta em rosto, corpo, voz, celebridade, direito autoral, deepfake, cinema, televisão, sindicato, estúdio, medo. Cada segundo sintético traz junto uma mala de advogados.
A saída do produto Sora, portanto, não significa derrota técnica. Significa que o vídeo por IA é um território mais inflamável do que o chat. O algoritmo pode até aprender a filmar; o mundo ainda não aprendeu a conviver com o que ele filma.
Seedance, Hollywood e o pânico de quem viu o futuro no feed
Se Kling é o campeão do ranking da LLM Stats, Seedance 2.0 é o personagem que entrou chutando a porta da cultura pop. A ByteDance, dona do TikTok, apresentou um modelo capaz de trabalhar com texto, imagens, vídeo e áudio, criando clipes curtos com som sincronizado e controle multimodal. A repercussão especializada foi imediata porque Seedance toca num nervo que Hollywood conhece bem: a semelhança.
O caso que circulou como sinal de alerta foi um vídeo sintético com Tom Cruise e Brad Pitt em uma cena de luta. A reação de figuras da indústria não foi apenas curiosidade técnica. Foi pânico profissional. A frase “acabou para nós”, dita em tom de assombro por um roteirista de Hollywood, resume o impacto: se uma pessoa com duas linhas de prompt consegue fabricar algo que parece caro, reconhecível e viral, qual é o chão do cinema industrial?
Essa pergunta não deve ser respondida com histeria, mas também não pode ser tratada como frescura de artista. O cinema é trabalho coletivo. É eletricista, câmera, maquiadora, montador, roteirista, ator, compositor, figurinista, continuísta, técnico de som, produtora de elenco. Quando a IA promete condensar esse batalhão num prompt, ela não está apenas lançando uma ferramenta. Está redesenhando relações de trabalho e autoria.
Ao mesmo tempo, há o outro lado: o da invenção pobre, brasileira, gambiarreira, independente. Para quem nunca teve orçamento, diária, autorização, caminhão de luz, travelling, grua ou finalização de luxo, esses modelos soam como uma câmera Super-8 caindo do céu — só que com alucinações, custo variável e termos de uso escritos por corporações. A promessa é sedutora: fazer um clipe, um trailer, uma cena, uma vinheta, um curta-manifesto. O perigo é confundir ferramenta com emancipação. A câmera digital barateou o cinema, mas não aboliu o mercado. A IA pode baratear a imagem, mas não garante liberdade.
Veo e Runway: o cinema como controle
Enquanto Kling e Seedance avançam com força, Google e Runway disputam outro campo: o controle criativo. O Veo 3.1, nas atualizações recentes, aposta em consistência, vídeo vertical, integração com plataformas do Google, referências visuais e upscaling. É o modelo pensado para circular entre Gemini, YouTube Shorts, Flow, API, Vertex AI e Google Vids. Não é apenas uma câmera: é uma infraestrutura.
A Runway, por sua vez, continua tentando ocupar o lugar de suíte profissional. Seu Gen-4.5 é apresentado como avanço em fidelidade visual, aderência a prompts, física, controle e consistência temporal. A empresa fala com o mercado audiovisual como quem diz: “não somos brinquedo, somos set de filmagem”. A mídia especializada reconhece os avanços, mas também registra as limitações: objeto que perde permanência, causalidade que tropeça, efeito que vem antes da causa. A IA já sabe fazer um plano bonito; ainda se atrapalha para entender por que uma porta só abre depois que alguém gira a maçaneta.
Essa é a fronteira real. O futuro do vídeo por IA não será decidido apenas por resolução, textura de pele ou brilho de lente anamórfica. Será decidido por causalidade. Por continuidade. Por direção de atores sintéticos. Por montagem. Por som. Por saber quando a câmera deve parar.
A estética do videoclipe infinito
O ranking da LLM Stats também revela um deslocamento estético. Os modelos estão ficando bons em gerar imagens com cara de publicidade premium, trailer de ficção científica, fashion film, clipe de artista internacional, vinheta de festival. A IA ama néon, chuva, câmera lenta, cidade molhada, rosto dramático, criança olhando para o céu, astronauta melancólico, mulher de cabelo ao vento, robô com alma, ruína bonita. Ela aprendeu o inconsciente visual do streaming.
É por isso que o tom musical é inevitável. A geração de vídeo por IA se parece muito com a história do sampler. Quando o sampler entrou na música, houve pânico: roubo, cópia, fim dos músicos, fim da autoria. Depois veio hip-hop, eletrônica, funk, colagem, remix, novas gramáticas. Mas também vieram processos, cercamentos, bibliotecas licenciadas, indústria reorganizada. O vídeo por IA está nesse momento: entre o baile e o tribunal.
A diferença é que o sampler musical pegava pedaços identificáveis de gravações. Os modelos de vídeo absorvem padrões estatísticos de imensos acervos audiovisuais, muitos deles protegidos, muitos deles arrancados da internet sem negociação clara. A disputa autoral será mais opaca, mais difícil e talvez mais violenta. Não se trata apenas de “copiar um trecho”; trata-se de reproduzir estilos, corpos, gestos, mundos.
E o Brasil nessa história?
Para o audiovisual brasileiro, a pergunta é urgente. O Brasil sempre fez cinema contra a escassez. Cinema Novo, Boca do Lixo, vídeo popular, clipe independente, documentário de guerrilha, produtora de quebrada, canal de YouTube, TikTok de periferia, funk ostentação, sertanejo universitário, tecnobrega, manguebeat, rap, piseiro, trap, brega funk — todos são, de algum modo, tecnologias sociais de produção com pouco recurso e muita linguagem.
A IA de vídeo pode entrar nessa linhagem como ferramenta de invenção. Pode ajudar artista independente a criar teaser, videoclipe, visualizer, animação, cenário impossível, projeção de show, material de campanha, narrativa experimental. Pode permitir que um coletivo faça uma ficção científica sertaneja anarquista sem esperar edital, sem pedir bênção para emissora, sem vender a alma para agência.
Mas também pode reforçar dependências: plataformas estrangeiras, cobrança por créditos, censura algorítmica, bloqueios de conteúdo, modelos treinados com referências que não entendem Brasil profundo, corpos brasileiros tratados como exotismo, periferia convertida em estética genérica. A questão não é usar ou não usar. A questão é disputar a linguagem.
O cinema brasileiro sempre soube que técnica não é neutra. Uma câmera na mão pode ser revolução ou vigilância. Um drone pode ser poesia ou polícia. Um algoritmo pode ser instrumento popular ou máquina de pasteurização. Depende de quem opera, de quem paga, de quem controla, de quem lucra e de quem aparece na imagem.
O ranking como parada musical
No fim, a página da LLM Stats funciona como parada musical de uma cena que muda toda semana. Hoje Kling v3 lidera. Amanhã pode ser Seedance, Veo, Runway, HappyHorse, Wan, LTX, algum modelo aberto saído de laboratório chinês, israelense, americano ou de uma garagem com GPUs alugadas. O ranking importa, mas o mais importante é a tendência: o vídeo por IA deixou de ser curiosidade e virou linguagem competitiva.
A pergunta “qual é o melhor modelo?” talvez seja pequena demais. A pergunta maior é: que tipo de imagem esses modelos estão ensinando o mundo a desejar? Uma imagem rápida, lisa, cara, obediente, infinita? Ou uma imagem estranha, política, errada, brasileira, ruidosa, inventiva?
Kling pode estar no topo da tabela. Seedance pode assustar Hollywood. Veo pode virar infraestrutura do YouTube. Runway pode se vender como estúdio portátil. Sora pode ter deixado a cena como produto, mas permanece como fantasma fundador. No meio disso tudo, criadores olham para a tela como músicos diante do primeiro sintetizador barato: alguns vão fazer jingles, outros vão fazer ruído, outros vão inventar um gênero.
O cinema sintético ainda está em seu primeiro ato. A câmera acendeu. O algoritmo pediu silêncio. Mas, como no melhor cinema brasileiro, a plateia não vai obedecer quieta.
Tecnologia & IA
Suno capta US$ 400 milhões e mostra que a música por IA virou negócio bilionário
A Suno, uma das startups mais conhecidas de geração musical por inteligência artificial, anunciou uma nova rodada de investimento de mais de US$ 400 milhões. Com o aporte, a empresa passa a ser avaliada em US$ 5,4 bilhões, consolidando-se como uma das companhias mais valiosas no setor de música generativa.
A rodada Série D foi liderada pela Bond Capital e contou com a participação de IVP, Forerunner, Union Square Ventures, Alkeon e Quiet. Investidores já presentes na companhia, como Matrix, Lightspeed, Menlo Ventures e Schroders Capital, também acompanharam o novo financiamento.
A Suno permite que usuários criem músicas completas a partir de comandos de texto, incluindo letra, voz, arranjos e instrumentação. A proposta seduziu milhões de usuários, de curiosos que fazem músicas para ocasiões pessoais a produtores e compositores profissionais interessados em incorporar ferramentas de IA ao fluxo criativo.
Segundo a empresa, o novo capital será usado para ampliar a plataforma, desenvolver modelos musicais mais avançados e lançar novos serviços. A Suno também afirma que pretende começar a disponibilizar, nos próximos meses, seu primeiro modelo musical desenvolvido em parceria com a indústria fonográfica.
Esse ponto é central para entender a nova fase da companhia. A Suno cresceu rapidamente em um ambiente marcado por entusiasmo, mas também por forte resistência de gravadoras, editoras e artistas. Empresas de música generativa como Suno e Udio foram acusadas de treinar seus modelos com obras protegidas por direitos autorais sem autorização ou compensação aos titulares.
Nos últimos anos, a tensão entre inteligência artificial e indústria musical passou dos debates abstratos para os tribunais. Grandes gravadoras e artistas independentes moveram ações contra plataformas de música generativa, questionando a legalidade do uso de catálogos protegidos no treinamento de modelos. O argumento das empresas de IA costuma se apoiar em interpretações de “uso justo”, enquanto titulares de direitos defendem que o treinamento sem licença constitui exploração comercial não autorizada.
Ao mesmo tempo, parte da indústria começa a buscar acordos em vez de apenas litígios. Em 2025, a Suno anunciou uma parceria com a Warner Music Group para desenvolver experiências de criação musical baseadas em conteúdo licenciado e em participação opt-in de artistas. A ideia é permitir que nomes, vozes, imagens, composições e estilos sejam usados em novas experiências de IA apenas quando houver autorização, controle e compensação.
A movimentação não acontece isoladamente. Spotify e Universal Music Group também anunciaram acordos de licenciamento para permitir a criação de covers e remixes por IA dentro de um modelo pago e controlado. Na prática, o mercado parece testar uma transição: da IA musical vista como ameaça pirata para uma infraestrutura licenciada de criação, remixagem e engajamento de fãs.
Para os investidores, a aposta é clara. A música por IA pode abrir uma nova camada da economia do entretenimento, baseada não apenas no consumo passivo de faixas, mas na participação ativa dos usuários. Em vez de apenas apertar o play, o público passa a criar, adaptar, brincar e compartilhar músicas personalizadas.
Para artistas e gravadoras, o dilema é mais delicado. Há potencial de novas receitas, novas formas de interação com fãs e expansão criativa. Mas há também riscos evidentes: substituição de trabalho humano, diluição de identidade artística, uso indevido de vozes e estilos, além da dificuldade de rastrear autoria, remuneração e consentimento em escala.
O novo aporte da Suno mostra que, apesar das disputas legais, o capital de risco segue convencido de que a música generativa será uma das grandes frentes comerciais da inteligência artificial. A pergunta já não é se a IA vai participar da cadeia musical, mas em quais condições: com licença, transparência e remuneração — ou em uma guerra permanente entre inovação tecnológica e direitos autorais.
A próxima etapa da Suno será decisiva. Se a empresa conseguir migrar para modelos treinados com acordos industriais robustos, poderá se apresentar como uma ponte entre tecnologia e mercado musical. Se não conseguir, continuará sendo símbolo de uma contradição cada vez mais visível: uma plataforma capaz de democratizar a criação musical, mas construída sobre uma disputa ainda aberta sobre quem deve ser pago quando a máquina aprende a cantar.
Fonte: Silicon Angle
Tecnologia & IA
Novo Gemini Omni leva edição conversacional para vídeos com IA
O Google apresentou, durante o Google I/O 2026, o Gemini Omni, uma nova família de modelos de inteligência artificial voltada à criação multimodal. A promessa é ambiciosa: permitir que usuários criem conteúdos a partir de diferentes tipos de entrada — texto, imagem, vídeo e áudio — começando pela geração e edição de vídeos. A empresa define o Omni como um passo na direção de uma IA capaz de “criar qualquer coisa a partir de qualquer entrada”.
O primeiro modelo da família é o Gemini Omni Flash, que chega com foco em vídeos curtos. Segundo o Google, ele será capaz de gerar vídeos de até 10 segundos, criar áudio sintético nativo, transformar até cinco fotos em vídeo, editar cenas em múltiplas etapas e trabalhar com avatares personalizados. A novidade exige assinatura de um plano Google AI, com disponibilidade variando por região e faixa de produto.
Na prática, o Omni aproxima a criação de vídeo da lógica de uma conversa. Em vez de depender de softwares complexos de edição, o usuário poderá pedir alterações em linguagem natural: trocar cenário, modificar estilo visual, ajustar personagens, transformar uma foto em clipe ou refinar uma sequência já gerada. O próprio Google descreve a ferramenta como uma espécie de “Nano Banana para vídeos”, em referência ao seu modelo de geração e edição de imagens.
A mudança também marca uma reorganização importante dentro do ecossistema de mídia generativa do Google. O Gemini Omni deve substituir o Veo no app Gemini, combinando a inteligência central do Gemini com recursos avançados de geração de mídia. Enquanto o Veo era mais associado à geração de vídeo a partir de prompts, o Omni amplia o conceito ao permitir que vídeos, imagens e outros elementos sirvam como referência para novas criações.
Para criadores, publicitários e produtores de conteúdo, o ponto mais relevante talvez não seja apenas a geração de vídeos, mas a edição conversacional. O Google afirma que o Omni Flash melhora a consistência de personagens, preservando identidade e voz ao longo de diferentes cenas. Esse tipo de recurso pode ser decisivo para campanhas, narrativas seriadas, vídeos educacionais e conteúdos de marca, áreas em que a coerência visual costuma ser uma das maiores limitações dos modelos generativos.
Outro destaque é a criação de avatares de IA. A ferramenta permite que usuários criem versões digitais de si mesmos para aparecer em vídeos gerados artificialmente. Segundo a Wired, o processo envolve capturar rosto e voz pelo celular, com movimentos de cabeça e leitura de uma sequência de números. A proposta inicial do Google é permitir que usuários gerem vídeos de si próprios, não de terceiros.
Essa funcionalidade, porém, reacende o debate sobre deepfakes, autenticidade e transparência. O Google afirma que vídeos criados com Omni terão marca d’água digital SynthID, tecnologia usada para identificar conteúdos gerados por IA. A Associated Press também registrou que a empresa pretende expandir ferramentas de verificação de credenciais de conteúdo no Gemini e, futuramente, no Chrome.
O lançamento acontece em um momento de corrida acelerada pela liderança em vídeo generativo. OpenAI, Runway, Luma AI, ByteDance e outros competidores disputam espaço em um mercado que interessa tanto a criadores independentes quanto a estúdios, marcas e plataformas sociais. O diferencial do Google é tentar integrar a geração de mídia diretamente ao Gemini, ao YouTube Shorts e ao Google Flow, criando um fluxo que vai da ideia ao vídeo final dentro do próprio ecossistema da empresa.
No Google Flow, o Omni Flash será usado em conjunto com recursos de agente criativo. A empresa afirma que o Flow Agent poderá ajudar em brainstorming, criação, edição em lote, organização de arquivos e desenvolvimento de ferramentas personalizadas por linguagem natural. O Google também anunciou que o Omni será integrado ao Flow Music, permitindo criar vídeos musicais a partir de orientação conversacional.
Apesar do entusiasmo, ainda há limites claros. A versão inicial trabalha com vídeos curtos, de até 10 segundos, e alguns recursos dependem de assinatura, plataforma, país e idade mínima. O próprio Google informa que funcionalidades podem variar por nível de plano e região.
Ainda assim, o Gemini Omni sinaliza uma virada estratégica. O vídeo com IA deixa de ser apenas uma ferramenta de geração a partir de texto e passa a se aproximar de um ambiente de produção completo, no qual o usuário conversa, edita, refina, reaproveita referências e mantém personagens consistentes. Para o mercado criativo, isso pode reduzir barreiras técnicas. Para a sociedade, amplia a urgência de discutir autoria, consentimento, identificação de conteúdo sintético e confiança nas imagens que circulam online.
No fim, o Google não está apenas lançando mais um modelo de vídeo. Está tentando transformar o Gemini em uma plataforma de criação multimodal — e, ao mesmo tempo, disputar o futuro da produção audiovisual com IA.
-
Cinema1 semana atrás“Dreams of Violets” é o marco zero do cinema de guerrilha com IA
-
Cinema1 semana atrásTribeca indica o caminho: IA no cinema precisa de autoria humana
-
Videoclipe1 semana atrásAos 65, Boy George lança versão de Karma Chameleon com inteligência artificial
-
Tecnologia & IA3 dias atrásKling no topo, Sora fora de cena: a nova guerra do cinema IA
-
Cinema3 dias atrásO cinema depois do prompt: Runway AIF vira vitrine, palco e campo de batalha
-
blog3 dias atrásComo fazer um videoclipe com inteligência artificial: guia completo para artistas