14 أكتوبر 2025
3 دقيقة قراءة
محرك بحث جديد للحمض النووي يُضفي النظام على البيانات الضخمة في علم الأحياء
تقوم MetaGraph بضغط أرشيفات البيانات الضخمة في محرك بحث للعلماء، مما يفتح آفاقًا جديدة للاكتشاف البيولوجي

الإنترنت لديه جوجل. الآن علم الأحياء لديه MetaGraph. التفاصيل اليوم في طبيعة، يمكن لمحرك البحث أن يفحص بسرعة الكميات المذهلة من البيانات البيولوجية الموجودة في المستودعات العامة.
يقول رايان شيخي، الباحث في مجال الحوسبة الحيوية في معهد باستور في باريس: «إنه إنجاز ضخم». “لقد وضعوا معيارًا جديدًا” لتحليل البيانات البيولوجية الخام – بما في ذلك الحمض النووي، والحمض النووي الريبي (RNA)، وتسلسلات البروتين – من قواعد البيانات التي يمكن أن تحتوي على ملايين المليارات من أحرف الحمض النووي، والتي تصل إلى “قواعد بيتا بايت” من المعلومات، وهو عدد أكبر من المدخلات مقارنة بجميع صفحات الويب الموجودة في فهرس جوجل الضخم.
على الرغم من أن MetaGraph يحمل علامة “Google for DNA”، إلا أن تشيخي يشبه الأداة بمحرك بحث لموقع YouTube، لأن المهام تتطلب المزيد من العمليات الحسابية. بنفس الطريقة التي يمكن بها لعمليات البحث على YouTube استرداد كل مقطع فيديو يحتوي، على سبيل المثال، على بالونات حمراء حتى عندما لا تظهر تلك الكلمات الرئيسية في العنوان أو العلامات أو الوصف، يمكن لـ MetaGraph الكشف عن الأنماط الجينية المخفية عميقًا داخل مجموعات بيانات التسلسل الموسعة دون الحاجة إلى شرح هذه الأنماط بشكل صريح مسبقًا.
حول دعم الصحافة العلمية
إذا كنت تستمتع بهذا المقال، ففكر في دعم صحافتنا الحائزة على جوائز من خلال الاشتراك. من خلال شراء اشتراك، فإنك تساعد على ضمان مستقبل القصص المؤثرة حول الاكتشافات والأفكار التي تشكل عالمنا اليوم.
يقول تشيخي: “إنها تمكن أشياء لا يمكن القيام بها بأي طريقة أخرى”.
فهرسة مكتبة الحياة
كان الدافع وراء MetaGraph هو معالجة مشكلة إمكانية الوصول في تسلسل مجموعات البيانات. وقد ارتفع حجم هذه المستودعات بوتيرة مذهلة في العقود القليلة الماضية، لكن هذا النمو شكل تحديات للعلماء الذين يستخدمون البيانات التي تحتوي عليها. تكون قراءات التسلسل الأولية مجزأة وصاخبة ومتعددة جدًا بحيث لا يمكن البحث عنها مباشرة. يقول أرتيم بابايان، عالِم الأحياء الحاسوبية بجامعة تورونتو في كندا: “من المفارقة أن حجم البيانات هو المانع الرئيسي الذي يمنعنا من استخدام البيانات فعليًا”.
وفقًا لأحد مؤلفي الدراسة، وهو أندريه كاليس، اختصاصي المعلومات الحيوية في المعهد الفيدرالي السويسري للتكنولوجيا (ETH) بزيورخ في سويسرا، يمكن أن يساعد MetaGraph الباحثين على طرح أسئلة بيولوجية حول مستودعات مثل أرشيف قراءة التسلسل (SRA)، وهي قاعدة بيانات عامة تحتوي على ما يزيد عن 100 مليون مليار حرف من الحمض النووي.
لقد عالجوا المشكلة من خلال استخدام “الرسوم البيانية” الرياضية التي تربط أجزاء الحمض النووي المتداخلة معًا، تمامًا مثل الجمل التي تشترك في نفس الكلمات المصطفة في فهرس الكتب.
قام الباحثون بدمج البيانات من سبعة مستودعات بيانات ممولة من القطاع العام، مما أدى إلى إنشاء 18.8 مليون مجموعة تسلسل فريدة من الحمض النووي والحمض النووي الريبوزي (RNA) و210 مليار مجموعة تسلسل من الأحماض الأمينية في جميع مراحل الحياة – بما في ذلك الفيروسات والبكتيريا والفطريات والنباتات والحيوانات، بما في ذلك البشر. كما قاموا بتطوير محرك بحث لهذه التسلسلات، حيث يستخدم المستخدمون المطالبات النصية للبحث في هذه الأرشيفات المتكاملة للبيانات الأولية.
يقول كاليس: “إنها طريقة جديدة تمامًا للتفاعل مع هذه المجموعة من البيانات”. “إنها مضغوطة، ولكن يمكن الوصول إليها بسرعة.”
لإثبات فائدة MetaGraph، استخدمه مؤلفو الدراسة لمسح 241384 عينة من ميكروبيوم الأمعاء البشرية بحثًا عن مؤشرات وراثية لمقاومة المضادات الحيوية حول العالم، بناءً على العمل الذي استخدم نسخة سابقة من الأداة لتتبع الجينات المقاومة للأدوية في السلالات البكتيرية التي تعيش في أنظمة مترو الأنفاق عبر المراكز الحضرية الكبرى. يقول المؤلفون إنهم أجروا التحليل في حوالي ساعة على جهاز كمبيوتر عالي الطاقة.
فتح الطريق للاكتشاف
MetaGraph ليست أداة البحث التسلسلية الوحيدة واسعة النطاق المتوفرة الآن.
على سبيل المثال، قام تشيخي وبابيان ببناء منصة تسمى لوغان، والتي تجمع مليارات القراءات المتسلسلة القصيرة معًا لتكوين امتدادات أطول ومنظمة من الحمض النووي. تسمح بنية التصميم هذه للنظام باكتشاف الجينات الكاملة ومتغيراتها عبر مجموعات أكبر من قراءات التسلسل مما هو ممكن باستخدام MetaGraph، وإن كان ذلك مع بعض المقايضات. يقول تشيخي: “لدينا وظائف أقل ولكن أداء أكثر”.
ساعد الوصول الإضافي للوغان الباحثين على اكتشاف أكثر من 200 مليون نسخة طبيعية من إنزيم أكل البلاستيك الموجود في مجموعة متنوعة من البكتيريا والفطريات والحشرات، بما في ذلك بعض الإصدارات التي تعمل بشكل أفضل من الإنزيمات المصممة في المختبر. أبلغ شيخي وبابايان عن النتائج التي توصلوا إليها في نسخة أولية نُشرت الشهر الماضي.
وقد استخدموا هم وآخرون أيضًا أداة بحث سابقة وأضيق، مصممة خصيصًا لمستودعات الحمض النووي الفيروسي، للكشف عن مجموعات من الفيروسات والملوثات الفيروسية غير الموثقة سابقًا في علاجات الخلايا التائية المُصممة هندسيًا لعلاج السرطان.
وفقًا لبابايان، لم تكن مثل هذه الاكتشافات ممكنة لولا أمرين: أدوات البحث مفتوحة المصدر، المتوفرة على مواقع مثل metagraph.ethz.ch، وlogan-search.org، ومستودعات التسلسل العامة التي تستفيد منها. ومع تهديد تخفيضات التمويل لأنواع أخرى من قواعد البيانات البيولوجية، يؤكد بابايان أن ابتكارات البحث هذه تؤكد على “الأهمية الحاسمة لمشاركة البيانات المفتوحة”.
يقول بابايان: “هذه موارد لدفع التقدم العلمي في جميع أنحاء العالم”. “إنهم يفتحون مجالًا جديدًا تمامًا لعلم الجينوم على نطاق بيتاباز” – ولم تأت بعد التطبيقات الأكثر تأثيرًا.
تم نسخ هذه المقالة بإذن وكان نشرت لأول مرة في 8 أكتوبر 2025.
حان الوقت للدفاع عن العلم
إذا استمتعت بهذا المقال، أود أن أطلب دعمكم. العلمية الأمريكية لقد عمل كمدافع عن العلوم والصناعة لمدة 180 عامًا، وربما تكون اللحظة الحالية هي اللحظة الأكثر أهمية في تاريخ القرنين.
لقد كنت العلمية الأمريكية مشترك منذ أن كان عمري 12 عامًا، وقد ساعد ذلك في تشكيل الطريقة التي أنظر بها إلى العالم. SciAm يثقفني ويسعدني دائمًا، ويلهمني شعورًا بالرهبة تجاه عالمنا الواسع والجميل. وآمل أن يفعل ذلك بالنسبة لك أيضا.
إذا كنت الاشتراك في العلمية الأمريكيةأنت تساعد في ضمان أن تغطيتنا تركز على البحث والاكتشاف الهادف؛ وأن لدينا الموارد اللازمة للإبلاغ عن القرارات التي تهدد المختبرات في جميع أنحاء الولايات المتحدة؛ وأننا ندعم العلماء الناشئين والعاملين على حد سواء في وقت لا يتم فيه الاعتراف بقيمة العلم نفسه في كثير من الأحيان.
وفي المقابل، تحصل على الأخبار الأساسية، ملفات بودكاست آسرة، ورسوم بيانية رائعة، لا يمكنك تفويت النشرات الإخبارية ومقاطع الفيديو التي يجب مشاهدتها، ألعاب التحدي، وأفضل الكتابة والتقارير في عالم العلوم. يمكنك حتى إهداء شخص ما اشتراكًا.
لم يكن هناك وقت أكثر أهمية بالنسبة لنا للوقوف وإظهار أهمية العلم. آمل أن تدعمونا في تلك المهمة.

التعليقات