محققان یک چارچوب ریاضی برای بررسی ژنوم و شناسایی نشانه های انتخاب طبیعی ایجاد کردند
علیرغم تعداد زیادی ژنی که هر سلول انسانی حاوی این توالیهای DNA به اصطلاح «کدکننده» است، تنها 1 درصد از کل ژنوم ما را تشکیل میدهند. 99 درصد باقیمانده از DNA “غیر کد کننده” تشکیل شده است – که بر خلاف DNA کد کننده، دستورالعمل ساخت پروتئین را ندارد.
یکی از عملکردهای حیاتی این دیانای غیرکدکننده، که DNA تنظیمکننده نیز نامیده میشود، کمک به روشن و خاموش کردن ژنها و کنترل میزان (در صورت وجود) پروتئین است. با گذشت زمان، همانطور که سلولها DNA خود را برای رشد و تقسیم تکثیر میکنند، جهشها اغلب در این مناطق غیر کدکننده ظاهر میشوند – گاهی اوقات عملکرد آنها را تغییر میدهند و نحوه کنترل بیان ژن را تغییر میدهند. بسیاری از این جهشها بیاهمیت هستند و برخی حتی سودمند هستند. با این حال، گاهی اوقات، آنها می توانند با افزایش خطر ابتلا به بیماری های رایج، مانند دیابت نوع 2، یا موارد تهدید کننده زندگی، از جمله سرطان، مرتبط باشند.
برای درک بهتر پیامدهای چنین جهشهایی، محققان به سختی روی نقشههای ریاضی کار کردهاند که به آنها اجازه میدهد به ژنوم یک موجود زنده نگاه کنند، پیشبینی کنند که کدام ژن بیان میشود، و تعیین کنند که این بیان چگونه بر ویژگیهای قابل مشاهده ارگانیسم تأثیر میگذارد. این نقشهها، که مناظر تناسب اندام نامیده میشوند، تقریباً یک قرن پیش مفهومسازی شدند تا بفهمند که چگونه ترکیب ژنتیکی بر یک معیار رایج تناسب اندام به ویژه تأثیر میگذارد: موفقیت باروری. مناظر اولیه تناسب اندام بسیار ساده بودند و اغلب بر تعداد محدودی جهش تمرکز می کردند. مجموعه داده های بسیار غنی تری در حال حاضر در دسترس هستند، اما محققان هنوز به ابزارهای اضافی برای توصیف و تجسم چنین داده های پیچیده ای نیاز دارند. این توانایی نه تنها درک بهتری از چگونگی تکامل ژنهای فردی در طول زمان را تسهیل میکند،
در مطالعه جدیدی که در Nature منتشر شده است منتشر شده است ، تیمی از دانشمندان چارچوبی را برای مطالعه مناظر تناسب اندام DNA تنظیمی ایجاد کرده اند. آنها یک مدل شبکه عصبی ایجاد کردند که وقتی روی صدها میلیون اندازهگیری تجربی آموزش داده شد، میتوانست پیشبینی کند که چگونه تغییرات در این توالیهای غیرکدکننده در مخمر بر بیان ژن تأثیر میگذارد. آنها همچنین روشی منحصربفرد برای نمایش مناظر در دو بعد ابداع کردند که درک گذشته و پیشبینی تکامل آینده توالیهای غیرکدکننده در موجودات فراتر از مخمر را آسان میکند – و حتی الگوهای بیان ژن سفارشی را برای ژن درمانی و کاربردهای صنعتی طراحی میکنند.
ما اکنون یک «اوراکل» داریم که میتوان پرسید: اگر همه جهشهای ممکن این دنباله را امتحان کنیم، چه میشود؟ یا چه سکانس جدیدی را باید طراحی کنیم تا بیان دلخواه را به ما بدهد؟» Aviv Regev، استاد زیست شناسی در MIT (در مرخصی)، عضو اصلی موسسه Broad از هاروارد و MIT (در مرخصی)، رئیس تحقیقات Genentech و توسعه اولیه، و نویسنده ارشد این مطالعه می گوید. دانشمندان اکنون می توانند از این مدل برای پرسش یا سناریوی تکاملی خود و برای مشکلات دیگری مانند ساخت توالی هایی که بیان ژن را به روش های دلخواه کنترل می کنند، استفاده کنند. من همچنین در مورد امکانات برای محققان یادگیری ماشین علاقه مند به تفسیرپذیری هیجان زده هستم. آنها می توانند سؤالات خود را برعکس بپرسند تا زیست شناسی زیربنایی را بهتر درک کنند.”
قبل از این مطالعه، بسیاری از محققان به سادگی مدل های خود را بر روی جهش های شناخته شده (یا تغییرات جزئی آن) که در طبیعت وجود دارد آموزش داده بودند. با این حال، تیم Regev می خواست با ایجاد مدل های بی طرفانه خود که قادر به پیش بینی تناسب اندام و بیان ژن یک ارگانیسم بر اساس هر توالی DNA ممکن است – حتی توالی هایی که قبلاً ندیده بودند – یک قدم فراتر بروند. این همچنین محققان را قادر می سازد تا از چنین مدل هایی برای مهندسی سلول ها برای اهداف دارویی، از جمله درمان های جدید برای سرطان و اختلالات خود ایمنی استفاده کنند.
برای دستیابی به این هدف، Eeshit Dhaval Vaishnav، دانشجوی کارشناسی ارشد MIT و نویسنده اول، Carl de Boer، اکنون استادیار دانشگاه بریتیش کلمبیا، و همکارانشان یک مدل شبکه عصبی برای پیشبینی بیان ژن ایجاد کردند. آنها آن را بر روی مجموعه داده ای آموزش دادند که با قرار دادن میلیون ها توالی DNA کاملا تصادفی غیر کدکننده در مخمر ایجاد شده بود و مشاهده کردند که چگونه هر توالی تصادفی بر بیان ژن تأثیر می گذارد. آنها بر روی زیرمجموعه خاصی از توالی های DNA غیر کدکننده به نام پروموترها تمرکز کردند که به عنوان محل اتصال پروتئین ها عمل می کنند که می توانند ژن های مجاور را روشن یا خاموش کنند.
رجو میگوید: «این کار نشان میدهد که وقتی انواع جدیدی از آزمایشها را برای تولید دادههای مناسب برای آموزش مدلها طراحی میکنیم، چه فرصتهایی را باز میکند. در مفهوم گستردهتر، من معتقدم این نوع رویکردها برای بسیاری از مشکلات مهم خواهند بود – مانند درک انواع ژنتیکی در مناطق نظارتی که خطر بیماری را در ژنوم انسان ایجاد میکنند، اما همچنین برای پیشبینی تاثیر ترکیبی از جهشها یا طراحی مولکولهای جدید. “
رجو، وایشناو، دو بوئر و نویسندگان همکارشان در ادامه تواناییهای پیشبینی مدل خود را به روشهای مختلف آزمایش کردند تا نشان دهند چگونه میتواند به ابهامزدایی از گذشته تکاملی و آینده احتمالی برخی از مروجین کمک کند. وایشناو توضیح میدهد: «ایجاد یک مدل دقیق مطمئناً یک دستاورد بود، اما برای من، واقعاً یک نقطه شروع بود.
ابتدا، برای تعیین اینکه آیا مدل آنها میتواند به کاربردهای زیستشناسی مصنوعی مانند تولید آنتیبیوتیکها، آنزیمها و غذا کمک کند یا خیر، محققان استفاده از آن را برای طراحی مروجهایی که میتوانند سطوح بیان دلخواه را برای هر ژن مورد علاقه ایجاد کنند، تمرین کردند. آنها سپس سایر مقالات علمی را بررسی کردند تا سؤالات اساسی تکاملی را شناسایی کنند تا ببینند آیا مدل آنها می تواند به آنها پاسخ دهد یا خیر. این تیم حتی تا آنجا پیش رفت که به مدل خود مجموعه ای از داده های جمعیتی در دنیای واقعی را از یک مطالعه موجود، که حاوی اطلاعات ژنتیکی از گونه های مخمر در سراسر جهان بود، ارائه داد. با انجام این کار، آنها توانستند هزاران سال فشارهای انتخابی گذشته را که ژنوم مخمرهای امروزی را تراشیده است، ترسیم کنند.
اما، به منظور ایجاد ابزار قدرتمندی که بتواند هر ژنومی را کاوش کند، محققان میدانستند که باید راهی برای پیشبینی تکامل توالیهای غیرکدکننده حتی بدون چنین مجموعه دادههای جمعیتی جامعی بیابند. برای پرداختن به این هدف، Vaishnav و همکارانش یک تکنیک محاسباتی ابداع کردند که به آنها اجازه میدهد پیشبینیها را از چارچوب خود بر روی یک نمودار دو بعدی ترسیم کنند. این به آنها کمک کرد تا به روشی بسیار ساده نشان دهند که چگونه هر توالی DNA غیر کدکننده بر بیان و تناسب ژن تأثیر می گذارد، بدون اینکه نیازی به انجام آزمایش های وقت گیر در آزمایشگاه باشد.
Vaishnav توضیح می دهد: “یکی از مشکلات حل نشده در مناظر تناسب اندام این بود که ما رویکردی برای تجسم آنها به گونه ای نداشتیم که به طور معناداری ویژگی های تکاملی دنباله ها را به تصویر بکشد.” “من واقعاً می خواستم راهی برای پر کردن این شکاف پیدا کنم. و به چشم انداز دیرینه ایجاد یک چشم انداز تناسب اندام کامل کمک کنید.
مارتین تیلور، استاد ژنتیک در واحد ژنتیک انسانی شورای تحقیقات پزشکی دانشگاه ادینبورگ که در این تحقیق شرکت نداشت، میگوید این مطالعه نشان میدهد که هوش مصنوعی نه تنها میتواند تأثیر تغییرات تنظیمکننده DNA را پیشبینی کند، بلکه اصول اساسی را نیز آشکار میکند. که میلیون ها سال تکامل را اداره می کند.
علیرغم این واقعیت که این مدل فقط بر روی کسری از DNA تنظیم کننده مخمر در چند شرایط رشد آموزش دیده است، او تحت تأثیر قرار گرفته است که می تواند چنین پیش بینی های مفیدی در مورد تکامل تنظیم ژن در پستانداران انجام دهد.
او توضیح می دهد: «کاربردهای کوتاه مدت آشکاری وجود دارد، مانند طراحی سفارشی DNA تنظیمی برای مخمر در آبجوسازی، پخت و پز و بیوتکنولوژی. اما گسترش این کار همچنین می تواند به شناسایی جهش های بیماری در DNA تنظیم کننده انسان کمک کند که در حال حاضر یافتن آنها دشوار است و تا حد زیادی در کلینیک نادیده گرفته می شود. این کار نشان میدهد آینده روشنی برای مدلهای هوش مصنوعی تنظیم ژن وجود دارد که بر روی مجموعه دادههای غنیتر، پیچیدهتر و متنوعتر آموزش دیدهاند.
حتی قبل از انتشار رسمی این مطالعه، Vaishnav شروع به دریافت پرس و جو از سایر محققان کرد که امیدوار بودند از این مدل برای ابداع توالیهای DNA غیر کدکننده برای استفاده در ژن درمانی استفاده کنند.
وایشناو میگوید: «مردم چندین دهه است که در حال مطالعه تکامل مقرراتی و مناظر تناسب اندام هستند. من فکر میکنم چارچوب ما در پاسخ به سؤالات اساسی و باز در مورد تکامل و تکامل DNA تنظیمکننده ژن کمک زیادی خواهد کرد و حتی به ما کمک میکند توالیهای بیولوژیکی را برای کاربردهای جدید هیجانانگیز طراحی کنیم.»
– این بیانیه مطبوعاتی در ابتدا در وب سایت موسسه فناوری ماساچوست منتشر شد