Le développement des réseaux neuronaux à ce stade permet non seulement de créer des parodies d'artistes musicaux célèbres, mais aussi de restaurer les voix de célébrités de l'époque pré-numérique. André, l'auteur de la chaîne YouTube « Ah, guitariste ! », a parlé de l'art des neurocovers et de l'importance des cryptomonnaies pour le marché de la musique IA.
ForkLog (FL): André, tes neurocovers attirent des millions de vues. Ce type d'art est-il demandé en ce moment ?
Andrei : Je pense que oui. J'ai constitué un public qui vient pour la nostalgie, pour les voix d'artistes déjà disparus - Tsoï, Letov. Ce sont leurs fans, et peut-être qu'ils ne sont pas des super millions comme dans la pop, mais c'est tout de même un nombre significatif. Pour moi, c'est très spécial.
FL: Comment es-tu venu à la musique ?
Andrei : Je joue de la guitare depuis l'âge de 13 ans. J'ai commencé sur l'ancienne guitare de mon père, fabriquée par l'usine de meubles de Tchernihiv. Et cela m'est resté toute ma vie – comme un hobby. Ensuite, il y a eu des soirées rock, l'underground. Dans la vie, j'ai fait des choses complètement différentes, mais ces deux dernières années et demie, je me suis à nouveau consacré sérieusement à la musique.
FL : Quand as-tu commencé à t'occuper des neurocovers et pourquoi t'adresses-tu le plus souvent à la voix de Letov ?
Andrei: J'ai toujours écouté du rock, et Letov et Tsui sont des légendes reconnues du rock russe. C'est mon frère, qui était un grand fan de Letov, qui m'a fait découvrir sa musique en rapportant des cassettes de Moscou.
Quand j'ai appris à jouer de la guitare, l'idée de reprendre des artistes m'est venue. La voix de Letov a un certain charme, une sorte de désespoir. Si on chante des chansons de dessins animés avec sa voix, elles deviennent très émouvantes, même déchirantes.
En 2023, j'ai commencé à m'intéresser aux neurocovers, et le premier modèle de voix que j'ai eu était Leto. À ce moment-là, il a connu un second regain de popularité parmi les jeunes, déjà après sa mort.
FL: Comment se déroule le processus de création d'un morceau ?
Andrei : Au départ, je chante tout, je fais un brouillon. Je choisis la chanson moi-même ou celle que me suggèrent les abonnés dans les commentaires.
La majeure partie du processus repose sur moi. Ensuite, dans le réseau de neurones RVC, j'applique le modèle vocal, puis je traite le tout dans l'éditeur audio Ableton. J'utilise également d'autres réseaux de neurones pour le post-traitement : ElevenLabs, Adobe Podcast.
Les premières neurocovers que j'ai faites étaient sur un modèle vocal public, et maintenant, cela fait déjà un an et demi que j'utilise un modèle que j'ai construit moi-même, entraîné sur certains albums de Letov. Cependant, c'est toujours un être humain qui est responsable du style et de la présentation, une intelligence artificielle ne peut pas gérer cela.
FL: Comment est équipée ton studio ?
Andrey : L'ensemble d'outils est absolument standard. La seule chose, je vous conseille d'acheter une bonne interface audio. J'ai une interface audio iCON Duo 22 Dyna, elle a une entrée pour guitare et un microphone à condensateur. Microphone et écouteurs Superlux, pas chers.
FL: Les neurocovers sont-ils créés en temps réel ?
Andrei: Le réseau de neurones RVC superpose le modèle vocal en temps réel. La chose la plus importante est de synchroniser la guitare et la voix, car la carte graphique a besoin d'environ quelques secondes pour le traitement. J'ai une RTX 3090 locale, ce n'est pas la plus puissante. Mais pour les réseaux de neurones, c'est la mémoire vidéo qui est importante, ici elle est de 34 Go - cela me suffira encore pour quelques années.
FL: Que se passe-t-il actuellement sur le marché de la musique IA ?
Andrey: Cela fait plus d'un an depuis la sortie des premiers modèles Suno, les gens génèrent leur musique, la publient sur des plateformes et la monétisent. Cela a provoqué une série de grands procès entre les maisons de disques et les startups d'IA. Les revendications consistent à dire que pour entraîner leurs réseaux neuronaux, Suno et Udio utilisent des morceaux originaux, dont les auteurs et interprètes ne reçoivent aucune redevance.
À l'avenir, je pense que nous arriverons à ce que les musiciens reçoivent des redevances - peut-être 50-50 - pour l'utilisation de leur voix.
En outre, les processus de studio routiniers passeront aux neurones. À la place des labels, je commencerais déjà à intégrer cet outil pour faciliter le travail.
FL: Tu as participé à des projets publics de restauration des voix de célébrités des époques passées. Comment ce processus s'est-il déroulé ?
Andrei : J'ai aidé des gars d'Ouzbékistan à restaurer les voix d'or de la république — divers narrateurs et chanteurs. Le projet était réalisé avec le soutien de l'État. Des enregistrements des archives nationales étaient utilisés, sur cette base je créais des modèles vocaux et améliorais la qualité sonore.
Je participe également actuellement à la restauration de la voix de Sergueï Yesenin, à qui l'année 2025 est consacrée en Russie. De son vivant, il n'y avait qu'un seul enregistrement audio de qualité moyenne, où il lit pendant environ quatre minutes son poème. Et malgré le fait qu'il ne reste qu'un souvenir de sa voix, j'ai tout de même essayé de l'extraire et de créer un modèle vocal basé sur cela. Ce projet sera présenté à l'automne.
FL: Vois-tu des problèmes éthiques dans l'utilisation de la voix des artistes décédés ?
Andrey : Je suis contre le fait qu'il y ait des abus dans l'utilisation du matériel source lors de la création de neuro-chansons. Dans ma création, j'essaie d'aborder les musiciens disparus avec respect. Mes chansons sont en grande partie une réinterprétation.
FL : En Russie, il a été proposé de protéger la voix du citoyen comme un objet de droits immatériels. Ce domaine devrait-il être réglementé et comment exactement ?
André : Cela arrivera inévitablement. Le projet de loi russe vise principalement à lutter contre l'utilisation de la voix humaine à des fins frauduleuses. Dans ce contexte, c'est une proposition très juste.
Je ne m'occupe pas du tout de modèles conversationnels, je crée des œuvres parodiques, j'écris de la musique à partir de zéro et je le fais savoir partout.
Sans aucun doute, des amendements à la législation dans ce domaine vont apparaître. L'Europe et les États-Unis sont actuellement très préoccupés par la lutte contre les deepfakes. Le désordre n'est nécessaire dans aucun domaine.
Si cela affecte mon activité et que je dois obtenir des autorisations, je continuerai quand même à m'y engager, même avec des restrictions.
FL: Suivez-vous des jetons d'IA ?
Andrei: Un des projets intéressants est io.net. Ils offrent des possibilités de calcul en nuage, ce qui est important pour les réseaux de neurones, quand tu n'as pas de bon équipement chez toi. Avec des tokens, tu achètes chez eux de la puissance de calcul et tu l'utilises pour entraîner tes modèles.
Un autre projet génial est ChainGPT. Ils ont différents agents d'IA qui aident à comprendre la crypto et vérifient les smart contracts.
Je suis sûr qu'à l'avenir, des projets similaires à ElevenLabs avec leurs propres jetons verront le jour, permettant de payer des services de traitement de voix ou de musique. C'est vraiment génial quand les technologies et les cryptomonnaies vont de pair.
FL: Quelle est ton opinion sur l'idée de tokenisation dans ce domaine ?
Andrei : J'ai une excellente opinion. J'avais même des idées de lancer mon propre bot Telegram, qui créerait de la musique dans Suno avec un paiement en tokens.
Je considère que la tokenisation dans la neuromusique est très utile, mais il n'y a pas encore d'adoption massive pour que cela se produise à un niveau sérieux. Je pense que des avancées dans ce domaine se produiront également grâce à Telegram.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Le réseau de neurones est une fête
Le développement des réseaux neuronaux à ce stade permet non seulement de créer des parodies d'artistes musicaux célèbres, mais aussi de restaurer les voix de célébrités de l'époque pré-numérique. André, l'auteur de la chaîne YouTube « Ah, guitariste ! », a parlé de l'art des neurocovers et de l'importance des cryptomonnaies pour le marché de la musique IA.
ForkLog (FL): André, tes neurocovers attirent des millions de vues. Ce type d'art est-il demandé en ce moment ?
Andrei : Je pense que oui. J'ai constitué un public qui vient pour la nostalgie, pour les voix d'artistes déjà disparus - Tsoï, Letov. Ce sont leurs fans, et peut-être qu'ils ne sont pas des super millions comme dans la pop, mais c'est tout de même un nombre significatif. Pour moi, c'est très spécial.
FL: Comment es-tu venu à la musique ?
Andrei : Je joue de la guitare depuis l'âge de 13 ans. J'ai commencé sur l'ancienne guitare de mon père, fabriquée par l'usine de meubles de Tchernihiv. Et cela m'est resté toute ma vie – comme un hobby. Ensuite, il y a eu des soirées rock, l'underground. Dans la vie, j'ai fait des choses complètement différentes, mais ces deux dernières années et demie, je me suis à nouveau consacré sérieusement à la musique.
FL : Quand as-tu commencé à t'occuper des neurocovers et pourquoi t'adresses-tu le plus souvent à la voix de Letov ?
Andrei: J'ai toujours écouté du rock, et Letov et Tsui sont des légendes reconnues du rock russe. C'est mon frère, qui était un grand fan de Letov, qui m'a fait découvrir sa musique en rapportant des cassettes de Moscou.
Quand j'ai appris à jouer de la guitare, l'idée de reprendre des artistes m'est venue. La voix de Letov a un certain charme, une sorte de désespoir. Si on chante des chansons de dessins animés avec sa voix, elles deviennent très émouvantes, même déchirantes.
En 2023, j'ai commencé à m'intéresser aux neurocovers, et le premier modèle de voix que j'ai eu était Leto. À ce moment-là, il a connu un second regain de popularité parmi les jeunes, déjà après sa mort.
FL: Comment se déroule le processus de création d'un morceau ?
Andrei : Au départ, je chante tout, je fais un brouillon. Je choisis la chanson moi-même ou celle que me suggèrent les abonnés dans les commentaires.
La majeure partie du processus repose sur moi. Ensuite, dans le réseau de neurones RVC, j'applique le modèle vocal, puis je traite le tout dans l'éditeur audio Ableton. J'utilise également d'autres réseaux de neurones pour le post-traitement : ElevenLabs, Adobe Podcast.
Les premières neurocovers que j'ai faites étaient sur un modèle vocal public, et maintenant, cela fait déjà un an et demi que j'utilise un modèle que j'ai construit moi-même, entraîné sur certains albums de Letov. Cependant, c'est toujours un être humain qui est responsable du style et de la présentation, une intelligence artificielle ne peut pas gérer cela.
FL: Comment est équipée ton studio ?
Andrey : L'ensemble d'outils est absolument standard. La seule chose, je vous conseille d'acheter une bonne interface audio. J'ai une interface audio iCON Duo 22 Dyna, elle a une entrée pour guitare et un microphone à condensateur. Microphone et écouteurs Superlux, pas chers.
FL: Les neurocovers sont-ils créés en temps réel ?
Andrei: Le réseau de neurones RVC superpose le modèle vocal en temps réel. La chose la plus importante est de synchroniser la guitare et la voix, car la carte graphique a besoin d'environ quelques secondes pour le traitement. J'ai une RTX 3090 locale, ce n'est pas la plus puissante. Mais pour les réseaux de neurones, c'est la mémoire vidéo qui est importante, ici elle est de 34 Go - cela me suffira encore pour quelques années.
FL: Que se passe-t-il actuellement sur le marché de la musique IA ?
Andrey: Cela fait plus d'un an depuis la sortie des premiers modèles Suno, les gens génèrent leur musique, la publient sur des plateformes et la monétisent. Cela a provoqué une série de grands procès entre les maisons de disques et les startups d'IA. Les revendications consistent à dire que pour entraîner leurs réseaux neuronaux, Suno et Udio utilisent des morceaux originaux, dont les auteurs et interprètes ne reçoivent aucune redevance.
À l'avenir, je pense que nous arriverons à ce que les musiciens reçoivent des redevances - peut-être 50-50 - pour l'utilisation de leur voix.
En outre, les processus de studio routiniers passeront aux neurones. À la place des labels, je commencerais déjà à intégrer cet outil pour faciliter le travail.
FL: Tu as participé à des projets publics de restauration des voix de célébrités des époques passées. Comment ce processus s'est-il déroulé ?
Andrei : J'ai aidé des gars d'Ouzbékistan à restaurer les voix d'or de la république — divers narrateurs et chanteurs. Le projet était réalisé avec le soutien de l'État. Des enregistrements des archives nationales étaient utilisés, sur cette base je créais des modèles vocaux et améliorais la qualité sonore.
Je participe également actuellement à la restauration de la voix de Sergueï Yesenin, à qui l'année 2025 est consacrée en Russie. De son vivant, il n'y avait qu'un seul enregistrement audio de qualité moyenne, où il lit pendant environ quatre minutes son poème. Et malgré le fait qu'il ne reste qu'un souvenir de sa voix, j'ai tout de même essayé de l'extraire et de créer un modèle vocal basé sur cela. Ce projet sera présenté à l'automne.
FL: Vois-tu des problèmes éthiques dans l'utilisation de la voix des artistes décédés ?
Andrey : Je suis contre le fait qu'il y ait des abus dans l'utilisation du matériel source lors de la création de neuro-chansons. Dans ma création, j'essaie d'aborder les musiciens disparus avec respect. Mes chansons sont en grande partie une réinterprétation.
FL : En Russie, il a été proposé de protéger la voix du citoyen comme un objet de droits immatériels. Ce domaine devrait-il être réglementé et comment exactement ?
André : Cela arrivera inévitablement. Le projet de loi russe vise principalement à lutter contre l'utilisation de la voix humaine à des fins frauduleuses. Dans ce contexte, c'est une proposition très juste.
Je ne m'occupe pas du tout de modèles conversationnels, je crée des œuvres parodiques, j'écris de la musique à partir de zéro et je le fais savoir partout.
Sans aucun doute, des amendements à la législation dans ce domaine vont apparaître. L'Europe et les États-Unis sont actuellement très préoccupés par la lutte contre les deepfakes. Le désordre n'est nécessaire dans aucun domaine.
Si cela affecte mon activité et que je dois obtenir des autorisations, je continuerai quand même à m'y engager, même avec des restrictions.
FL: Suivez-vous des jetons d'IA ?
Andrei: Un des projets intéressants est io.net. Ils offrent des possibilités de calcul en nuage, ce qui est important pour les réseaux de neurones, quand tu n'as pas de bon équipement chez toi. Avec des tokens, tu achètes chez eux de la puissance de calcul et tu l'utilises pour entraîner tes modèles.
Un autre projet génial est ChainGPT. Ils ont différents agents d'IA qui aident à comprendre la crypto et vérifient les smart contracts.
Je suis sûr qu'à l'avenir, des projets similaires à ElevenLabs avec leurs propres jetons verront le jour, permettant de payer des services de traitement de voix ou de musique. C'est vraiment génial quand les technologies et les cryptomonnaies vont de pair.
FL: Quelle est ton opinion sur l'idée de tokenisation dans ce domaine ?
Andrei : J'ai une excellente opinion. J'avais même des idées de lancer mon propre bot Telegram, qui créerait de la musique dans Suno avec un paiement en tokens.
Je considère que la tokenisation dans la neuromusique est très utile, mais il n'y a pas encore d'adoption massive pour que cela se produise à un niveau sérieux. Je pense que des avancées dans ce domaine se produiront également grâce à Telegram.
FL : L'intelligence artificielle détruira-t-elle l'humanité ?
Andrei : Je pense que non. Avec la bonne approche, au contraire, cela complétera.
S'abonner au podcast:
Apple Podcasts
Spotify
YouTube
Deezer
Yandex.Music
YouTube Music