A rede neural é uma festa

podcast community cover# A neurônica é uma festa

O desenvolvimento de redes neurais nesta fase permite não só criar paródias de artistas musicais conhecidos, mas também restaurar as vozes de celebridades da era pré-digital. Sobre a arte dos neurocovers e a importância das criptomoedas para o mercado de música de IA, falou André, autor do canal no YouTube "Ai, guitarrista!".

ForkLog (FL): André, os teus neurocovers estão a receber milhões de visualizações. Este tipo de arte é procurado atualmente?

André: Acho que sim. Eu tenho um público que vem em busca de nostalgia, pelas vozes de artistas que já faleceram há muito tempo — Coi e Letov. São os fãs deles, e pode não ser supermilhões como na música pop, mas ainda assim é um número significativo. Para mim, isso é muito especial.

FL: Como você entrou na música?

André: Eu toco guitarra desde os 13 anos. Comecei ainda na velha guitarra do meu pai, fabricada pela fábrica de móveis de Chernígov. E assim isso ficou comigo para toda a vida — como um hobby. Depois vieram festas de rock, underground. Ao longo da vida, estive envolvido em coisas completamente diferentes, mas nos últimos dois anos e meio voltei a me dedicar intensamente à música.

FL: Quando começaste a trabalhar com neurocovers e por que é que te diriges mais frequentemente à voz do Letov?

Andrei: Sempre ouvi rock, e Letov e Tsой são lendas reconhecidas do rock russo. Especificamente, conheci Letov através do meu irmão, que era um grande fã dele e trazia fitas de Moscovo.

Quando aprendi a tocar guitarra, surgiu a ideia de regravar artistas. A voz de Letov tem um certo charme, uma certa desesperança. Se suas canções forem interpretadas com a sua voz, elas tornam-se muito comoventes, até de partir o coração.

Em 2023, comecei a trabalhar com neurocovers, e o primeiro modelo de voz que tive foi Leto. Naquela época, entre os jovens, ele começou a ter um segundo auge de popularidade, já após a sua morte.

FL: Como ocorre o processo de criação de uma faixa?

Andrei: Inicialmente, eu canto tudo, faço uma espécie de esboço. Escolho a música ou eu mesmo, ou aquela que os meus seguidores sugerem nos comentários.

A maior parte do processo fica comigo. Em seguida, na rede neural RVC, coloco o modelo de voz e depois processo tudo no editor de áudio Ableton. Também utilizo outras redes neurais para a pós-produção: ElevenLabs, Adobe Podcast.

Os primeiros neurocovers que fiz foram em um modelo de voz acessível ao público, agora já faz um ano e meio que uso um modelo que criei eu mesmo, treinado em álbuns específicos de Letov. No entanto, a maneira e a entrega ainda são responsabilidade de uma pessoa viva, a rede neural não consegue lidar com isso.

FL: Como é equipada o seu estúdio?

André: O conjunto de ferramentas é absolutamente padrão. A única coisa que eu recomendo é comprar uma boa interface de áudio. Eu tenho uma interface de áudio iCON Duo 22 Dyna, que tem entrada para guitarra e microfone condensador. Microfone e auriculares Superlux, baratos.

FL: As neurocoberturas são criadas em tempo real?

Andrei: A rede neural RVC aplica o modelo de voz em tempo real. O mais importante é sincronizar a guitarra e a voz, porque a placa gráfica precisa de cerca de alguns segundos para processar. Eu tenho uma RTX 3090 local, não é a mais poderosa. Mas para redes neurais, a memória de vídeo é o que importa, aqui ela tem 34 GB – ainda vai me servir por mais alguns anos.

FL: O que está a acontecer agora no mercado da música de IA?

Andrei: Já faz mais de um ano desde o lançamento dos primeiros modelos Suno, as pessoas geram sua música, publicam-na em plataformas e monetizam. Isso provocou uma série de grandes processos judiciais entre gravadoras e startups de IA. As reclamações consistem no fato de que, para treinar suas redes neurais, a Suno e a Udio utilizam faixas originais, cujos autores e intérpretes não recebem quaisquer royalties.

No futuro, penso que chegaremos ao ponto em que os músicos receberão royalties — talvez 50 a 50 — pelo uso das suas vozes.

Além disso, os processos de estúdio rotineiros passarão a utilizar redes neurais. Se eu estivesse no lugar das gravadoras, já estaria implementando essas ferramentas para facilitar o trabalho.

FL: Você participou de projetos comunitários para restaurar as vozes de celebridades de épocas passadas. Como foi esse processo?

Andrei: Eu ajudei os rapazes do Uzbequistão na recuperação das vozes de ouro da república — vários locutores e cantores. O projeto foi realizado com o apoio do governo. Foram utilizadas gravações dos arquivos nacionais, com base nas quais eu criava modelos de voz e melhorava a qualidade do som.

Atualmente, também estou participando na restauração da voz de Sergei Yesenin, a quem foi dedicado o ano de 2025 na Rússia. Durante sua vida, ele teve apenas uma gravação de áudio mais ou menos de qualidade, na qual ele lê seu poema por cerca de quatro minutos. E apesar de que só restou uma lembrança da voz, eu ainda tentei extrair isso e criar um modelo de voz baseado nisso. Neste outono, este projeto será apresentado.

FL: Vês problemas éticos na utilização da voz de artistas falecidos?

André: Sou contra que haja excessos no uso de material original na criação de neurocanções. Na minha criação, tento abordar os músicos falecidos com respeito. Minhas músicas são em grande parte - uma reinterpretação.

FL: Na Rússia, foi proposta a proteção da voz do cidadão como um objeto de direitos imateriais. Esta área deve ser regulada e de que forma?

André: Isso é inevitável. O projeto de lei russo está mais direcionado a combater o uso da voz humana para fins fraudulentos. Nesse contexto, é uma proposta muito correta.

Eu não trabalho com modelos de conversação de forma alguma, eu crio arte paródica, escrevo música do zero e menciono isso em todo lugar.

Sem dúvida, haverá emendas à legislação nesta área. A Europa e os EUA estão atualmente muito preocupados com a luta contra os deepfakes. Não há necessidade de bagunça em nenhum setor.

Se isso afetar a minha atividade e eu tiver que obter algum tipo de autorização, continuarei a fazer isso, mesmo que com restrições.

FL: Estás a acompanhar algum token de IA?

Andrei: Um dos projetos interessantes é o io.net. Eles oferecem capacidades de computação na nuvem, o que é importante para redes neurais, quando você não tem um bom equipamento em casa. Com os tokens, você compra poder de computação deles e o utiliza para treinar seus modelos.

Outro projeto interessante é o ChainGPT. Eles têm vários agentes de IA que ajudam a lidar com criptomoedas e verificam contratos inteligentes.

Estou certo de que no futuro surgirão projetos semelhantes ao ElevenLabs com seus tokens, que poderão ser usados para pagar serviços de processamento de vozes ou música. É muito legal quando tecnologias e criptomoedas trabalham em simbiose.

FL: Qual é a sua opinião sobre a ideia de tokenização nesta área?

Andrei: Tenho uma ótima opinião. Eu até tive ideias para lançar meu próprio bot do Telegram, que criaria música no Suno com pagamento em tokens.

A tokenização na neuro-música considero muito útil, mas ainda não há uma adoção em massa para que isso aconteça em um nível sério. Acredito que avanços nessa direção ocorrerão também graças ao Telegram.

FL: A inteligência artificial destruirá a humanidade?

André: Acho que não. Com a abordagem certa, pelo contrário, irá complementar.

Subscrever o podcast:

Apple Podcasts

Spotify

YouTube

Deezer

Yandex.Música

YouTube Music

RVC-4.98%
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)