ニューラルネットワークは祭りです

ポッドキャストコミュニティのカバー# ニューロンは祝祭です

この段階でのニューラルネットワークの発展は、単に有名な音楽アーティストのパロディを作成するだけでなく、デジタル前の時代の有名人の声を復元することも可能にしています。AI音楽市場における暗号通貨の重要性とニューカバーの芸術について、YouTubeチャンネル「アイ、ギタリスト!」の著者アンドレイが語りました。

ForkLog (FL): アンドレイ、君のニューロカバーは何百万回も視聴されている。現在、このようなアートの形は需要があるのか?

アンドレイ: そう思います。私のところには、すでに亡くなったアーティストの声を求めて来るオーディエンスがいます — ツォイやレトフのファンです。彼らのファンはポップスほどの数ではないかもしれませんが、それでも重要な数です。私にとっては非常に特別なことです。

FL: 音楽にどのように出会いましたか?

アンドレイ: 13歳からギターを弾いています。最初は父の古いギターで、チェルニヒウの家具工場製のものでした。それ以来、ずっと趣味として続けています。その後、ロッカーの集まりやアンダーグラウンドに参加しました。人生では全く別のことをしていましたが、ここ2年半は再び音楽にしっかりと取り組んでいます。

FL: いつからニューロカバーに取り組み始め、なぜ最もよくレトフの声に頼るのですか?

アンドレイ: ロック音楽はいつも聴いていたが、レトフとツォイはロシアのロックの認められた伝説だ。具体的には、レトフを紹介してくれたのは、彼の大ファンだった兄で、モスクワからカセットテープを持ってきてくれた。

ギターを弾けるようになったとき、アーティストのカバーをするアイデアが浮かびました。レトフの声には特有の魅力があり、ある種の絶望感があります。彼の声でアニメの歌を歌うと、とても心温まる、さらには胸が張り裂けるようなものになります。

2023年に私はニューロカバーを始め、最初に手に入れた声のモデルはレトフでした。当時、若者の間で彼は死後二度目の人気の波を迎えていました。

FL: トラックの作成プロセスはどのように行われますか?

アンドレイ: 最初に私はすべてを歌い、ある程度のドラフトを作成します。曲は自分で選ぶか、コメントでフォロワーから勧められた曲を選びます。

プロセスの大部分は私にかかっています。次に、RVCのニューラルネットワークに音声モデルを適用し、すべてをAbletonのオーディオエディターで処理します。また、後処理には他のニューラルネットワークも使用します:ElevenLabs、Adobe Podcast。

最初のニューラルカバーは公開されている音声モデルで作成しましたが、今では独自に構築したもので、レトヴァの特定のアルバムで訓練されています。それでも、スタイルとプレゼンテーションは生身の人間が担当しており、ニューラルネットワークではそれに対応できません。

FL: あなたのスタジオはどのように設備されていますか?

アンドレイ: ツールセットは完全に標準的です。唯一のアドバイスは、良いオーディオインターフェースを購入することです。私のオーディオインターフェースはiCON Duo 22 Dynaで、ギターとコンデンサーマイクの入力があります。マイクとヘッドフォンはSuperluxで、手頃な価格です。

FL: 実際にニューラルカバーはリアルタイムで作成されますか?

アンドレイ: RVCニューラルネットワークはリアルタイムで音声モデルを重ねます。最も重要なのはギターと声を同期させることです。なぜなら、グラフィックカードは処理に約数秒必要だからです。私のところにはローカルのRTX 3090がありますが、最も強力ではありません。しかし、ニューラルネットワークにはビデオメモリが特に重要で、ここでは34GBあります — これであと数年は持ちます。

FL: 現在、AI音楽市場で何が起こっていますか?

アンドレイ: 既に1年以上前から、最初のSunoモデルが発売されて以来、人々は自分の音楽を生成し、それをプラットフォームにアップロードして収益化しています。これが、レコード会社とAIスタートアップの間で一連の大規模な訴訟を引き起こしました。訴訟の内容は、SunoやUdioがオリジナルトラックを使用して自らの神経ネットワークを訓練しているため、著作者や演奏者が何のロイヤリティも受け取っていないというものです。

将来的には、音楽家には彼らの声を使用することに対してロイヤリティが支払われるようになると思います — おそらく50対50で。

さらに、ルーチンのスタジオプロセスはニューラルネットワークに移行します。私がレーベルの立場であれば、作業を軽減するためにこのツールを導入しておきます。

FL: あなたは過去の時代の有名人の声を復元する公共プロジェクトに参加しました。プロセスはどのように進行しましたか?

アンドレイ: 私はウズベキスタンの仲間たちと共和国の黄金の声—さまざまなアナウンサーや歌手の復元を手伝っていました。このプロジェクトは政府の支援のもとで実施されました。国家アーカイブからの録音を使用し、それに基づいて音声モデルを作成し、音質を向上させていました。

現在、私はロシアで2025年が彼に捧げられているセルゲイ・エセーニンの声を復元するプロジェクトにも参加しています。彼の生前、彼の詩を約4分間朗読している比較的質の高い音声記録は1つだけでした。そして、声の記憶が残っているだけにもかかわらず、私はそれを引き出して、その音声モデルを作成しようとしました。このプロジェクトは秋に発表される予定です。

FL: 故人アーティストの声を使用することに倫理的な問題を感じますか?

アンドレイ: 私は、ニューロソングを作成する際に、元の素材の使用において行き過ぎがあることに反対です。私の創作においては、故人のミュージシャンに対して敬意を持って接するように努めています。私の曲は、より多くの意味で再解釈です。

FL: ロシアでは市民の声を無形の権利の対象として保護することが提案されました。この分野は規制されるべきでしょうか、そしてどのように規制されるべきでしょうか?

アンドレイ: これは必然的に起こるでしょう。ロシアの法案は、主に人の声を詐欺的な目的で使用することに対抗することを目的としています。この文脈では、非常に正しい提案です。

私は会話モデルには全く関与していません。私はパロディ作品を作成し、ゼロから音楽を書き、あらゆる場所でそれを指摘しています。

確かに、この分野の法律には修正が加えられるでしょう。ヨーロッパとアメリカは現在、ディープフェイクとの戦いに非常に懸念を抱いています。どの分野においても混乱は必要ありません。

もしこれが私の活動に影響を及ぼし、何らかの許可を取得しなければならない場合でも、私は制限付きではありますが、この活動を続けます。

FL: あなたは何かAIトークンを追跡していますか?

アンドレイ: 興味深いプロジェクトの一つは io.net です。彼らはクラウドコンピューティングの機会を提供しており、これは自宅に適切な機器がない場合のニューラルネットワークにとって重要です。トークンを使って、彼らから計算能力を購入し、自分のモデルのトレーニングに利用します。

もう一つの素晴らしいプロジェクトはChainGPTです。彼らには暗号を理解するのを助けるさまざまなAIエージェントがいて、スマートコントラクトをチェックします。

今後、声や音楽の処理サービスを支払うためのトークンを持つElevenLabsのようなプロジェクトが登場することを確信しています。技術と暗号通貨が共生するのはとても素晴らしいことです。

FL: この分野におけるトークン化のアイデアについてどう思いますか?

アンドレイ: とても良いと思います。自分のTelegramボットを立ち上げて、Sunoで音楽を作成し、トークンで支払うアイデアさえありました。

神経音楽におけるトークン化は非常に有益だと思いますが、まだ本格的なレベルでの大衆受け入れはありません。この方向での進展は、Telegramのおかげでもあると考えています。

FL: 人工知能は人類を滅ぼすのか?

アンドレイ: そう思いません。正しいアプローチであれば、むしろ補完します。

ポッドキャストに登録する:

アップルのポッドキャスト

スポティファイ

ユーチューブ

ディーザー

ヤンデックス・ミュージック

YouTubeミュージック

RVC-3.25%
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)