Tecnologia & IA
DeepSeek V4 mostra que a corrida da IA agora é também uma corrida por soberania tecnológica
A corrida global da inteligência artificial entrou em mais uma semana de aceleração brutal. Poucas horas depois da OpenAI apresentar o GPT-5.5, a chinesa DeepSeek anunciou o DeepSeek V4, uma nova geração de modelo de base com versões Pro e Flash, pesos abertos e foco em contexto longo, agentes inteligentes e redução de custos computacionais. Segundo a Caixin, o lançamento ocorreu em 24 de abril e marca uma nova ofensiva chinesa no campo dos modelos de IA de fronteira.
O ponto mais simbólico do anúncio é que o DeepSeek V4 chega como um modelo open weight — isto é, com pesos abertos — em um momento em que boa parte da IA de ponta continua concentrada em empresas americanas de modelos fechados. A versão DeepSeek V4 Pro teria 1,6 trilhão de parâmetros totais e 49 bilhões de parâmetros ativados, enquanto a versão Flash teria 284 bilhões de parâmetros totais e 13 bilhões ativados. Ambas trabalham com uma janela de contexto de até 1 milhão de tokens, o que amplia a capacidade de lidar com documentos longos, bases de código, fluxos complexos de trabalho e aplicações agentivas.
Mais do que uma atualização técnica, o V4 mostra uma mudança estratégica. Segundo a Reuters, o novo modelo da DeepSeek foi adaptado para rodar em chips Huawei Ascend, reforçando a tentativa chinesa de reduzir a dependência de GPUs da Nvidia e de tecnologias sujeitas às restrições de exportação dos Estados Unidos. A Huawei também teria confirmado suporte ao V4 em clusters baseados na linha Ascend 950, um movimento que liga diretamente a evolução dos modelos chineses à disputa por soberania computacional.
A disputa ficou ainda mais quente porque o DeepSeek-V4 chegou praticamente colado ao lançamento do GPT-5.5, apresentado pela OpenAI como seu modelo mais avançado até agora. A OpenAI afirma que o GPT-5.5 melhora desempenho em programação, tarefas profissionais, uso de ferramentas, pesquisa online, raciocínio e segurança, com disponibilidade inicial para planos pagos do ChatGPT e integrações com Codex.
Na prática, a semana mostrou duas filosofias competindo em velocidade máxima. De um lado, empresas como OpenAI continuam apostando em modelos fechados, forte integração com produtos e infraestrutura premium. Do outro, DeepSeek tenta ocupar o espaço simbólico e técnico dos modelos abertos de alta performance, oferecendo à comunidade e às empresas uma alternativa mais flexível — especialmente atraente para desenvolvedores, startups e países que buscam autonomia tecnológica.
Tencent e Xiaomi também entram no jogo
A ofensiva chinesa não veio só da DeepSeek. A Tencent também apresentou uma atualização importante do seu modelo Hunyuan, com o Hy3 preview, considerado o primeiro grande lançamento desde a chegada de Yao Shunyu, ex-pesquisador da OpenAI, para liderar os esforços de modelos fundacionais da companhia. Segundo o South China Morning Post, a Tencent descreve o Hy3 como seu modelo mais poderoso até agora, com avanços em raciocínio complexo e programação.
A Xiaomi, por sua vez, vem ampliando a família MiMo, com modelos voltados a capacidades multimodais e agentivas. Reportagens recentes apontam que a empresa lançou ou vem preparando versões como MiMo-V2.5 e MiMo-V2.5-Pro, combinando texto, imagem, áudio e vídeo em um mesmo sistema, com foco em eficiência, codificação e automação de tarefas.
Esse movimento é importante porque mostra que a IA chinesa não está mais concentrada apenas em chatbots ou modelos de texto. As empresas estão mirando diretamente em agentes, programação, automação empresarial, multimodalidade e infraestrutura própria. Ou seja: a disputa deixou de ser apenas “quem responde melhor a uma pergunta” e passou a ser “quem constrói o sistema operacional da próxima economia digital”.
A camada invisível: falta de computação
Por trás da corrida dos modelos existe um gargalo cada vez mais evidente: computação. A Caixin destaca que fabricantes de modelos enfrentam uma espécie de “escassez de poder computacional”, enquanto a Reuters aponta que a adaptação do DeepSeek aos chips da Huawei faz parte da tentativa chinesa de contornar limitações impostas pelo acesso restrito a hardware americano de ponta.
É aqui que a guerra da IA encontra a geopolítica. Modelos melhores exigem mais dados, mais energia, mais datacenters e chips mais poderosos. A disputa entre Estados Unidos e China, portanto, não é só uma corrida de software. É também uma corrida de semicondutores, nuvem, energia, infraestrutura e talento científico.
O que isso significa para a economia criativa
Para o mercado audiovisual, musical e de conteúdo, essa semana tem um recado claro: a IA está ficando mais barata, mais longa, mais agentiva e mais integrada aos fluxos de produção. Modelos com contexto de 1 milhão de tokens podem analisar roteiros extensos, organizar bibliotecas de cenas, operar bases de conhecimento, auxiliar na edição e coordenar pipelines complexos de produção.
Já os modelos agentivos, como os que estão sendo explorados por OpenAI, DeepSeek, Tencent e Xiaomi, apontam para um futuro em que a IA deixa de ser apenas uma ferramenta de geração e passa a atuar como assistente de produção, programador, editor, pesquisador, roteirista técnico e até coordenador de tarefas.
Para empresas como a MVAI, esse cenário é especialmente relevante. O avanço simultâneo de modelos fechados premium e modelos abertos mais baratos cria um ambiente ideal para montar pipelines híbridos: usar modelos abertos para volume, automação e customização; e modelos fechados para tarefas de maior precisão, raciocínio avançado ou acabamento premium.
A nova fase da corrida
O lançamento do DeepSeek-V4 reforça uma tendência que já vinha se desenhando desde 2025: a IA de ponta está se dividindo entre plataformas fechadas superintegradas e modelos abertos cada vez mais competitivos. A novidade é que agora essa disputa também se apoia em hardware nacional, cadeias de suprimento próprias e estratégias de soberania tecnológica.
A OpenAI tenta consolidar o GPT-5.5 como referência global em produtividade, programação e uso de ferramentas. A DeepSeek tenta provar que modelos abertos podem competir em escala de fronteira. A Tencent quer transformar o Hunyuan em infraestrutura empresarial e agentiva. A Xiaomi começa a conectar IA multimodal ao seu ecossistema de dispositivos, APIs e automação.
A conclusão é simples: a corrida da inteligência artificial não desacelerou. Ela mudou de marcha.
E, daqui para frente, cada novo modelo não será apenas uma atualização técnica. Será um movimento no tabuleiro global da tecnologia, da economia criativa e da soberania digital.
Fonte: Caixin
Tecnologia & IA
Suno capta US$ 400 milhões e mostra que a música por IA virou negócio bilionário
A Suno, uma das startups mais conhecidas de geração musical por inteligência artificial, anunciou uma nova rodada de investimento de mais de US$ 400 milhões. Com o aporte, a empresa passa a ser avaliada em US$ 5,4 bilhões, consolidando-se como uma das companhias mais valiosas no setor de música generativa.
A rodada Série D foi liderada pela Bond Capital e contou com a participação de IVP, Forerunner, Union Square Ventures, Alkeon e Quiet. Investidores já presentes na companhia, como Matrix, Lightspeed, Menlo Ventures e Schroders Capital, também acompanharam o novo financiamento.
A Suno permite que usuários criem músicas completas a partir de comandos de texto, incluindo letra, voz, arranjos e instrumentação. A proposta seduziu milhões de usuários, de curiosos que fazem músicas para ocasiões pessoais a produtores e compositores profissionais interessados em incorporar ferramentas de IA ao fluxo criativo.
Segundo a empresa, o novo capital será usado para ampliar a plataforma, desenvolver modelos musicais mais avançados e lançar novos serviços. A Suno também afirma que pretende começar a disponibilizar, nos próximos meses, seu primeiro modelo musical desenvolvido em parceria com a indústria fonográfica.
Esse ponto é central para entender a nova fase da companhia. A Suno cresceu rapidamente em um ambiente marcado por entusiasmo, mas também por forte resistência de gravadoras, editoras e artistas. Empresas de música generativa como Suno e Udio foram acusadas de treinar seus modelos com obras protegidas por direitos autorais sem autorização ou compensação aos titulares.
Nos últimos anos, a tensão entre inteligência artificial e indústria musical passou dos debates abstratos para os tribunais. Grandes gravadoras e artistas independentes moveram ações contra plataformas de música generativa, questionando a legalidade do uso de catálogos protegidos no treinamento de modelos. O argumento das empresas de IA costuma se apoiar em interpretações de “uso justo”, enquanto titulares de direitos defendem que o treinamento sem licença constitui exploração comercial não autorizada.
Ao mesmo tempo, parte da indústria começa a buscar acordos em vez de apenas litígios. Em 2025, a Suno anunciou uma parceria com a Warner Music Group para desenvolver experiências de criação musical baseadas em conteúdo licenciado e em participação opt-in de artistas. A ideia é permitir que nomes, vozes, imagens, composições e estilos sejam usados em novas experiências de IA apenas quando houver autorização, controle e compensação.
A movimentação não acontece isoladamente. Spotify e Universal Music Group também anunciaram acordos de licenciamento para permitir a criação de covers e remixes por IA dentro de um modelo pago e controlado. Na prática, o mercado parece testar uma transição: da IA musical vista como ameaça pirata para uma infraestrutura licenciada de criação, remixagem e engajamento de fãs.
Para os investidores, a aposta é clara. A música por IA pode abrir uma nova camada da economia do entretenimento, baseada não apenas no consumo passivo de faixas, mas na participação ativa dos usuários. Em vez de apenas apertar o play, o público passa a criar, adaptar, brincar e compartilhar músicas personalizadas.
Para artistas e gravadoras, o dilema é mais delicado. Há potencial de novas receitas, novas formas de interação com fãs e expansão criativa. Mas há também riscos evidentes: substituição de trabalho humano, diluição de identidade artística, uso indevido de vozes e estilos, além da dificuldade de rastrear autoria, remuneração e consentimento em escala.
O novo aporte da Suno mostra que, apesar das disputas legais, o capital de risco segue convencido de que a música generativa será uma das grandes frentes comerciais da inteligência artificial. A pergunta já não é se a IA vai participar da cadeia musical, mas em quais condições: com licença, transparência e remuneração — ou em uma guerra permanente entre inovação tecnológica e direitos autorais.
A próxima etapa da Suno será decisiva. Se a empresa conseguir migrar para modelos treinados com acordos industriais robustos, poderá se apresentar como uma ponte entre tecnologia e mercado musical. Se não conseguir, continuará sendo símbolo de uma contradição cada vez mais visível: uma plataforma capaz de democratizar a criação musical, mas construída sobre uma disputa ainda aberta sobre quem deve ser pago quando a máquina aprende a cantar.
Fonte: Silicon Angle
Tecnologia & IA
Novo Gemini Omni leva edição conversacional para vídeos com IA
O Google apresentou, durante o Google I/O 2026, o Gemini Omni, uma nova família de modelos de inteligência artificial voltada à criação multimodal. A promessa é ambiciosa: permitir que usuários criem conteúdos a partir de diferentes tipos de entrada — texto, imagem, vídeo e áudio — começando pela geração e edição de vídeos. A empresa define o Omni como um passo na direção de uma IA capaz de “criar qualquer coisa a partir de qualquer entrada”.
O primeiro modelo da família é o Gemini Omni Flash, que chega com foco em vídeos curtos. Segundo o Google, ele será capaz de gerar vídeos de até 10 segundos, criar áudio sintético nativo, transformar até cinco fotos em vídeo, editar cenas em múltiplas etapas e trabalhar com avatares personalizados. A novidade exige assinatura de um plano Google AI, com disponibilidade variando por região e faixa de produto.
Na prática, o Omni aproxima a criação de vídeo da lógica de uma conversa. Em vez de depender de softwares complexos de edição, o usuário poderá pedir alterações em linguagem natural: trocar cenário, modificar estilo visual, ajustar personagens, transformar uma foto em clipe ou refinar uma sequência já gerada. O próprio Google descreve a ferramenta como uma espécie de “Nano Banana para vídeos”, em referência ao seu modelo de geração e edição de imagens.
A mudança também marca uma reorganização importante dentro do ecossistema de mídia generativa do Google. O Gemini Omni deve substituir o Veo no app Gemini, combinando a inteligência central do Gemini com recursos avançados de geração de mídia. Enquanto o Veo era mais associado à geração de vídeo a partir de prompts, o Omni amplia o conceito ao permitir que vídeos, imagens e outros elementos sirvam como referência para novas criações.
Para criadores, publicitários e produtores de conteúdo, o ponto mais relevante talvez não seja apenas a geração de vídeos, mas a edição conversacional. O Google afirma que o Omni Flash melhora a consistência de personagens, preservando identidade e voz ao longo de diferentes cenas. Esse tipo de recurso pode ser decisivo para campanhas, narrativas seriadas, vídeos educacionais e conteúdos de marca, áreas em que a coerência visual costuma ser uma das maiores limitações dos modelos generativos.
Outro destaque é a criação de avatares de IA. A ferramenta permite que usuários criem versões digitais de si mesmos para aparecer em vídeos gerados artificialmente. Segundo a Wired, o processo envolve capturar rosto e voz pelo celular, com movimentos de cabeça e leitura de uma sequência de números. A proposta inicial do Google é permitir que usuários gerem vídeos de si próprios, não de terceiros.
Essa funcionalidade, porém, reacende o debate sobre deepfakes, autenticidade e transparência. O Google afirma que vídeos criados com Omni terão marca d’água digital SynthID, tecnologia usada para identificar conteúdos gerados por IA. A Associated Press também registrou que a empresa pretende expandir ferramentas de verificação de credenciais de conteúdo no Gemini e, futuramente, no Chrome.
O lançamento acontece em um momento de corrida acelerada pela liderança em vídeo generativo. OpenAI, Runway, Luma AI, ByteDance e outros competidores disputam espaço em um mercado que interessa tanto a criadores independentes quanto a estúdios, marcas e plataformas sociais. O diferencial do Google é tentar integrar a geração de mídia diretamente ao Gemini, ao YouTube Shorts e ao Google Flow, criando um fluxo que vai da ideia ao vídeo final dentro do próprio ecossistema da empresa.
No Google Flow, o Omni Flash será usado em conjunto com recursos de agente criativo. A empresa afirma que o Flow Agent poderá ajudar em brainstorming, criação, edição em lote, organização de arquivos e desenvolvimento de ferramentas personalizadas por linguagem natural. O Google também anunciou que o Omni será integrado ao Flow Music, permitindo criar vídeos musicais a partir de orientação conversacional.
Apesar do entusiasmo, ainda há limites claros. A versão inicial trabalha com vídeos curtos, de até 10 segundos, e alguns recursos dependem de assinatura, plataforma, país e idade mínima. O próprio Google informa que funcionalidades podem variar por nível de plano e região.
Ainda assim, o Gemini Omni sinaliza uma virada estratégica. O vídeo com IA deixa de ser apenas uma ferramenta de geração a partir de texto e passa a se aproximar de um ambiente de produção completo, no qual o usuário conversa, edita, refina, reaproveita referências e mantém personagens consistentes. Para o mercado criativo, isso pode reduzir barreiras técnicas. Para a sociedade, amplia a urgência de discutir autoria, consentimento, identificação de conteúdo sintético e confiança nas imagens que circulam online.
No fim, o Google não está apenas lançando mais um modelo de vídeo. Está tentando transformar o Gemini em uma plataforma de criação multimodal — e, ao mesmo tempo, disputar o futuro da produção audiovisual com IA.
Tecnologia & IA
Google testa ferramenta que pode transformar o Gemini em estúdio de vídeo com IA
O Google pode estar prestes a dar mais um passo na disputa pelo futuro do vídeo gerado por inteligência artificial. Um novo modelo chamado Gemini Omni apareceu para alguns usuários dentro do Gemini, com uma descrição que promete criação de vídeos, remixagem, edição direta no chat e uso de templates. A descoberta foi relatada pela 9to5Google nesta segunda-feira, 11 de maio de 2026, e reforçada por publicações especializadas que acompanham testes e vazamentos de produtos de IA.
A frase exibida na interface era direta: “Create with Gemini Omni”. Segundo os relatos, o Google descreve o recurso como um novo modelo de geração de vídeo capaz de remixar vídeos, editar conteúdos por conversa e partir de modelos prontos. Ainda não está claro se o Omni será um modelo totalmente novo, uma camada de produto sobre o Veo ou uma evolução integrada da estratégia multimodal do Gemini.
As primeiras demos chamaram atenção por dois motivos. A primeira mostrava um professor escrevendo uma prova matemática em um quadro, um tipo de cena difícil para modelos de vídeo porque exige coerência visual, texto legível e continuidade de movimento. A segunda brincava com um teste clássico de IA generativa: pessoas comendo espaguete, referência ao famoso meme dos primeiros vídeos gerados artificialmente, quando mãos, bocas, talheres e comida viravam um pequeno carnaval de horrores digitais. Segundo a 9to5Google, os resultados ainda têm sinais visíveis de geração por IA, mas já mostram avanço considerável em realismo e aderência ao prompt.
O ponto mais importante para criadores, videomakers e produtores independentes não é apenas a geração de vídeo a partir de texto. O diferencial sugerido pelo vazamento está na edição conversacional: trocar objetos, remixar cenas, editar vídeos diretamente no chat e trabalhar a partir de templates. O TestingCatalog afirma que os testes iniciais indicam desempenho especialmente forte em tarefas de edição, incluindo substituição de elementos e reescrita de cenas por instruções em linguagem natural.
Esse detalhe é estratégico. A geração bruta de vídeo já virou território disputado por Google, OpenAI, ByteDance, Runway, Luma e outras empresas. Mas a próxima fronteira pode ser menos “crie um vídeo do zero” e mais “pegue este material e transforme em outra coisa”. Para a indústria criativa, isso muda o jogo: o modelo deixa de ser apenas um gerador de clipes e começa a se comportar como um assistente de pós-produção.
Também apareceu para alguns usuários uma aba de uso, indicando que a criação de vídeos com Omni pode consumir rapidamente os limites diários de planos pagos. A própria página de suporte do Google já trata geração de vídeo como recurso sujeito a limites por plano e afirma que os limites podem mudar com frequência por demanda e capacidade.
O vazamento chega poucos dias antes do Google I/O 2026, marcado oficialmente para 19 e 20 de maio. A página do evento promete keynotes, sessões e novidades com foco em IA, Gemini, Android, Chrome e Cloud. O blog de desenvolvedores do Google também afirma que a conferência trará avanços de IA e atualizações de modelos Gemini, o que torna o evento o palco mais provável para uma explicação oficial sobre o Omni, caso o produto esteja realmente pronto para anúncio.
Por enquanto, convém tratar o Gemini Omni como um vazamento forte, não como lançamento oficial. O Google ainda não apresentou publicamente o produto nem explicou como ele se encaixará na família Veo. Mas a direção é clara: a Big Tech quer que o Gemini deixe de ser apenas um chatbot multimodal e se torne um ambiente completo de criação — texto, imagem, vídeo, edição e talvez, em breve, fluxo de produção audiovisual.
Para creators, artistas visuais, diretores de clipes, agências pequenas e produtores independentes, a promessa é sedutora: um estúdio criativo dentro de uma conversa. Para o mercado, o recado é menos poético e mais brutal: a guerra do vídeo com IA ainda nem começou direito, e o Google parece disposto a colocar seu exército dentro do Gemini.
Fonte: 9to5Google
-
Cinema2 semanas atrásScorsese leva a IA para o storyboard — e reacende a guerra cultural em Hollywood
-
Tecnologia & IA2 semanas atrásSuno capta US$ 400 milhões e mostra que a música por IA virou negócio bilionário
-
Cinema5 dias atrásTribeca indica o caminho: IA no cinema precisa de autoria humana
-
Cinema5 dias atrás“Dreams of Violets” é o marco zero do cinema de guerrilha com IA
-
Videoclipe4 dias atrásAos 65, Boy George lança versão de Karma Chameleon com inteligência artificial