صممت الملحنة التجريبية هولي هيرندون نسخة صوتية تعمل بالذكاء الاصطناعي يمكن لأي شخص استخدامها

3 مارس 2026

4 دقيقة قراءة

شعار جوجل أضفنا على جوجلأضف SciAm

صممت هذه الموسيقية نسخة من صوتها بتقنية الذكاء الاصطناعي حتى يتمكن أي شخص من الغناء مثلها

تقول الملحنة التجريبية هولي هيرندون إن هذه التكنولوجيا ليست هنا لتحل محل الفنانين، وأن مستقبل الإبداع ينتمي إلى الذكاء الجماعي

بقلم ديني إليس بيشار حرره اريك سوليفان

هولي هيرندون تقف في الداخل في معرض سربنتين نورث في لندن، محاطة بهيكل منحوت دائري معلق، مع جدران من الطوب في الخلفية. — هولي هيرندون في معرض سيربنتاين نورث في لندن، أكتوبر 2024.

ماثيو تشاتل / النشر المستقبلي عبر Getty Images

هولي هيرندون تستمع إلى مستقبل الموسيقى في البيانات. جاء هيرندون إلى الموسيقى الإلكترونية بعد الغناء في الكنيسة والجوقات في شرق تينيسي. حصلت على درجة الماجستير من كلية ميلز والدكتوراه من مركز أبحاث الكمبيوتر في الموسيقى والصوتيات بجامعة ستانفورد.

عندما بدأت تجربة التعلم الآلي في عام 2015، بدت النتائج “مشوشة”، لكنها تتذكر رؤية “الماس في الخام”. واليوم تطورت تلك التجارب إلى نماذج مخصصة تسمح لأي شخص بأداء دورها.

العلمية الأمريكية تحدثت إلى هيرندون حول تدريب نماذج الذكاء الاصطناعي الخاصة بها وإيمانها بأن الإبداع كان دائمًا جماعيًا، والذكاء الاصطناعي يجعله مرئيًا فقط.

حول دعم الصحافة العلمية

إذا كنت تستمتع بهذا المقال، ففكر في دعم صحافتنا الحائزة على جوائز من خلال الاشتراك. من خلال شراء اشتراك، فإنك تساعد على ضمان مستقبل القصص المؤثرة حول الاكتشافات والأفكار التي تشكل عالمنا اليوم.

(وفيما يلي نسخة منقحة من المقابلة.)

أنت تصف عملك بأنه “فن البروتوكول”. ماذا يعني ذلك؟

في القرن العشرين، كان موقع توليد الوسائط – الورقة والقلم حيث كتبت الموسيقى – هو الفعل الفني. مع فن البروتوكول، يحدث الفعل الإبداعي قبل توليد الوسائط. إنها تخلق مجموعة القواعد والظروف التي يتم فيها صنع الفن.

نحن مهتمون حقًا بتدريب نماذجنا الخاصة. أقول دائمًا “نحن” لأنني أعمل مع شريكي مات درايهيرست. نحن نتعامل مع كل خطوة في عملية صنع النموذج باعتبارها لحظة تدخل إبداعية. يعد إنشاء مجموعة البيانات جزءًا من العمل الفني. كثيرًا ما أكتب موسيقى للتدريب، موسيقى ليست بالضرورة لآذان البشر، بل لتعلم الكمبيوتر شيئًا ما.

هل يمكنك أن تعطيني مثالاً على ما يبدو عليه الأمر عمليًا؟

لدينا معرض في برلين الآن. لقد ألهمتنا هيلدغارد فون بينجن، وهي ملحنة من العصور الوسطى. أردنا أن نتظاهر كما لو أن تعدد الأصوات كان موجودًا عندما كانت على قيد الحياة. لقد بدأنا بنموذج من مؤلفاتها وأضفنا مجموعات القواعد حتى تتمكن من توليد تعدد الأصوات في أسلوبها. لقد أخذنا تلك المخرجات وأعدنا ترتيبها وأعطيناها لمطربين من البشر ليترجموها. ثم قمنا بإنشاء عمل تركيبي ضخم حيث يغني فناني الأداء ويدعوون الجمهور للتدرب معنا.

لا يتعلق الأمر بوضع “اكتب لي أغنية بوب باستخدام الجيتار”. يتعلق الأمر باستخدام هذه التكنولوجيا لجمع البشر معًا لصنع الفن في الفضاء الحقيقي.

يتم تدريب معظم نماذج الذكاء الاصطناعي التجارية على البيانات المستخرجة من الإنترنت. لماذا تصرين على بناء نماذجك الخاصة؟

باعتباري موسيقيًا إلكترونيًا، لم أكن أبدًا من الأشخاص الذين يأخذون عينات، فقد كنت دائمًا أصنع لوحات الصوت الخاصة بي. عندما بدأنا، قبل سونو وقبل كل هذه الأشياء، كان علينا إنشاء مجموعة البيانات الخاصة بنا. لقد بدا الأمر طبيعيًا، مثل صنع العينات الخاصة بي أو الأدوات الرقمية.

أحد الانتقادات الموجهة للمنتجات (مثل Suno) هو أنها تبدو “متوسطة” جدًا – فهي مدربة على كل شيء أو على الأكثر متوسطًا. تبدو نماذجي فريدة من نوعها لأنني أقوم بإعداد بيانات التدريب بنفسي. أعتقد أيضًا أن هناك دافعًا تحت الغطاء في Suno يقتصر على أغانٍ مدتها ثلاث دقائق مع بنية جوقة شعرية. هناك حواجز حماية مما يجعلها مملة. أحب أن يحرروا بعض القيود.

هل فاجأك أحد العارضات من قبل؟

لقد قمنا بمشروع يسمى Holly+ في عام 2021 تقريبًا، وهو استنساخ صوتي لصوتي الخاص. لقد عملنا مع Voctro Labs لتدريب نموذج صوتي يعمل في الوقت الفعلي حتى يتمكن الأشخاص من الغناء باستخدام صوتي. كان ذلك بمثابة تغيير في قواعد اللعبة.

إذا نجح هذا في الوقت الفعلي، فيمكن للأشخاص الآخرين أداء هوية بعضهم البعض في الوقت الفعلي. عندما كنا نختبرها، كان شريكي، وهو بريطاني، يغني فيها. سمعت صوتي بلكنة بريطانية. لقد كان الأمر غريبًا جدًا، واضطررت إلى مغادرة الغرفة – كان يغني مثلي. لقد كان ذلك واحدًا من أكبر المفاجآت العقلية حول مدى غرابة وروعة هذه الأشياء.

أعتقد أن الأمر سيستغرق من خمس إلى عشر سنوات ليكون سلسًا. ولكن بمجرد أن يتحول جسمنا في الوقت الفعلي، تخيل أنه يمكنك إنشاء نموذج لصوت الحوت، ثم قم بإنشاء حوت سوبرانو هجين. عندما تغني عاليًا، يصبح الأمر أوبراليًا؛ عندما تغني بصوت منخفض، فأنت أقرب إلى الحوت أو باري وايت. لم نعد مقيدين بحنجرتي.

أين تعتقد أننا سنكون بعد 10 سنوات؟

الكثير من المخاوف حول هذه التكنولوجيا هي في الواقع مخاوف من كيفية عمل الإنترنت الحالي – اقتصاد الانتباه، ومدى صعوبة الأمر كمبدع. يقول شريكي دائمًا: “التمرير مخصص للروبوتات، والمشي مخصص للبشر”.

رؤيتنا الأكثر تفاؤلاً هي استخدام وكلاء للتعامل مع كل التفاهات وتصفية الأشياء، مما يجمعنا معًا في العالم الحقيقي. ولهذا السبب تتضمن مشاريعنا أشخاصًا يلتقون بـ IRL ويفعلون الأشياء معًا. يقوم بعض أصدقائي المطورين الأذكى بالبرمجة مع العديد من الوكلاء أثناء الطهي أو التنزه مع أطفالهم الصغار. يمكن أن تكون الأشياء جميلة حقًا إذا تخيلناها وقمنا ببنائها بهذه الطريقة.

هل تغير هذه التكنولوجيا تعريفك للإبداع؟

قد يجبرنا موضوع الذكاء الاصطناعي برمته على رؤية أنفسنا ربما لسنا الممثلين المبدعين الوحيدين في الكون. لا ينبغي أن يكون ذلك مخيفًا، بل يمكن أن يكون جميلًا ومحررًا.

الإبداع يحدث في السرب، في المجتمع. الذكاء الاصطناعي هو مجرد ذكاء جماعي، أي ذكاء بشري مجمع. يرتبط النموذج الفني في القرن العشرين بعبقري فردي يلمس شيئًا ما ويضفي عليه قيمة. هذا يتم طرحه على رأسه. أنا كل فريق الذكاء الجماعي.

حان الوقت للدفاع عن العلم

إذا استمتعت بهذا المقال، أود أن أطلب دعمكم. العلمية الأمريكية لقد عمل كمدافع عن العلوم والصناعة لمدة 180 عامًا، وربما تكون اللحظة الحالية هي اللحظة الأكثر أهمية في تاريخ القرنين.

لقد كنت العلمية الأمريكية مشترك منذ أن كان عمري 12 عامًا، وقد ساعد ذلك في تشكيل الطريقة التي أنظر بها إلى العالم. SciAm يثقفني ويسعدني دائمًا، ويلهمني شعورًا بالرهبة تجاه عالمنا الواسع والجميل. وآمل أن يفعل ذلك بالنسبة لك أيضا.

إذا كنت الاشتراك في العلمية الأمريكيةأنت تساعد في ضمان أن تغطيتنا تركز على البحث والاكتشاف الهادف؛ وأن لدينا الموارد اللازمة للإبلاغ عن القرارات التي تهدد المختبرات في جميع أنحاء الولايات المتحدة؛ وأننا ندعم العلماء الناشئين والعاملين على حد سواء في وقت لا يتم فيه الاعتراف بقيمة العلم نفسه في كثير من الأحيان.

وفي المقابل، تحصل على الأخبار الأساسية، ملفات بودكاست آسرة، ورسوم بيانية رائعة، لا يمكنك تفويت النشرات الإخبارية ومقاطع الفيديو التي يجب مشاهدتها، ألعاب التحدي، وأفضل الكتابة والتقارير في عالم العلوم. يمكنك حتى إهداء شخص ما اشتراكًا.

لم يكن هناك وقت أكثر أهمية بالنسبة لنا للوقوف وإظهار أهمية العلم. آمل أن تدعمونا في تلك المهمة.

Fonte

صممت الملحنة التجريبية هولي هيرندون نسخة صوتية تعمل بالذكاء الاصطناعي يمكن لأي شخص استخدامها

حول دعم الصحافة العلمية

حان الوقت للدفاع عن العلم

الحكم بالإدانة على والد مطلق النار في مدرسة مراهقة في الولايات المتحدة

المجرة الحلزونية عبارة عن عجلة كونية مذهلة في صورة ملفتة للنظر ليوم 3 مارس 2026

Pokémon Pokopia هي لعبة Pokémon الأعلى تقييمًا منذ X/Y على Metacritic، ولم يتم طرحها حتى على Nintendo Switch 2 بعد

لا أستطيع أن أصدق أنني أقول هذا، ولكن جهاز MacBook Air M5 الأكثر تكلفة يعد خبرًا رائعًا – وإليك السبب

تقوم Intel بتوسيع تشكيلة Xeon 6 باستخدام Clearwater Forest Xeon 6+ الذي يحتوي على 288 نواة والذي يستهدف أعباء عمل الذكاء الاصطناعي في شبكات 5G

هذا النظام النجمي الرباعي الذي حطم الأرقام القياسية مكتظ للغاية لدرجة أنه يمكن أن يتناسب بين كوكب المشتري وشمسنا

التعليقات

اترك تعليقاً إلغاء الرد

الحكم بالإدانة على والد مطلق النار في مدرسة مراهقة في الولايات المتحدة

المجرة الحلزونية عبارة عن عجلة كونية مذهلة في صورة ملفتة للنظر ليوم 3 مارس 2026

Pokémon Pokopia هي لعبة Pokémon الأعلى تقييمًا منذ X/Y على Metacritic، ولم يتم طرحها حتى على Nintendo Switch 2 بعد

لا أستطيع أن أصدق أنني أقول هذا، ولكن جهاز MacBook Air M5 الأكثر تكلفة يعد خبرًا رائعًا – وإليك السبب

تقوم Intel بتوسيع تشكيلة Xeon 6 باستخدام Clearwater Forest Xeon 6+ الذي يحتوي على 288 نواة والذي يستهدف أعباء عمل الذكاء الاصطناعي في شبكات 5G

هذا النظام النجمي الرباعي الذي حطم الأرقام القياسية مكتظ للغاية لدرجة أنه يمكن أن يتناسب بين كوكب المشتري وشمسنا

يزعم التقرير أن أزمة ذاكرة الذكاء الاصطناعي تجبر سوق DRAM على نموذج “التسعير بالساعة” – الشركات الصغيرة والمتوسطة تكافح من أجل البقاء

أخبار الليونز: محللو اتحاد كرة القدم الأميركي الوطني يعلقون على تجارة ديفيد مونتغمري

بعد أكثر من ثمانية أشهر من استخدام Nintendo Switch 2، ما زلت غير قادر على تجاوز ترقية الأداء هذه – ولا علاقة لها بالمرئيات أو معدل الإطارات