الگوریتم جدید پیش بینی RNA معیوب

به گزارش واحد ژنتیک پایگاه اطلاع رسانی علوم آزمایشگاهی ایران، تاکنون، توضیح علل حدود نیمی از بیماری های ارثی نادر ممکن نبوده است. یک تیم تحقیقاتی مونیخ الگوریتمی را توسعه داده اند که اثرات جهش های ژنتیکی بر تشکیل RNA را شش برابر دقیق تر از مدل های قبلی پیش بینی می کند. در نتیجه می توان علل ژنتیکی بیماری های نادر ارثی و سرطان را با دقت بیشتری شناسایی کرد. تغییرات توالی ژنتیکی نسبتاً مکرر رخ می دهد. به طور متوسط، یک در هزار نوکلئوتید ژنوم یک فرد تحت تأثیر قرار می گیرد. در موارد نادر، این تغییرات می تواند منجر به RNA های معیوب و در نتیجه پروتئین های غیرعملکردی شود. این می تواند منجر به اختلال عملکرد در اندام های فردی شود. اگر مشکوک به یک بیماری نادر باشد، برنامه های تشخیصی به کمک کامپیوتر می توانند در جستجوی علل احتمالی ژنتیکی کمک کنند. به طور خاص، ژنوم را می توان با استفاده از الگوریتم ها تجزیه و تحلیل کرد تا مشخص شود که آیا ارتباطی بین تغییرات ژنتیکی نادر و اختلالات در قسمت های خاص بدن وجود دارد یا خیر.

پروژه تحقیقاتی میان رشته ای

تحت رهبری جولین گاگنور، استاد پزشکی مولکولی محاسباتی در دانشگاه فنی مونیخ (TUM) و رهبر گروه تحقیقاتی پزشکی مولکولی محاسباتی در هلمهولتز مونیخ، یک تیم بین رشته ای از بخش های انفورماتیک و پزشکی مدل جدیدی را توسعه دادند که نسبت به پیشینیان خود در پیش بینی تغییرات DNA منجر به تشکیل نادرست RNA می شود. دکتر هولگر پروکیش، یکی از نویسندگان این مطالعه و رهبر گروه مؤسسه ژنتیک انسانی در TUM و هلمهولتز مونیخ، معتقد است که تشخیص قابل اعتمادی را می توان برای نیمی از بیماران با استفاده از روش های آنالیز DNA ایجاد کرد. برای بقیه، به مدل هایی نیاز داریم که پیش بینی های ما را بهبود بخشند. الگوریتم جدید توسعه یافته می تواند سهم مهمی در این امر داشته باشد.

تمرکز مدل بر روی اتصال است

محققان تغییرات ژنتیکی را در نظر گرفتند که بر فرآیند تبدیل DNA به RNA و در نهایت تشکیل پروتئین ها به روشی خاص بافت تاثیر می گذارد. تمرکز روی پیرایش بود، فرآیندی در سلول ها که در آن RNA به گونه ای بریده می شود که دستورالعمل های ساختمانی پروتئین را می توان بعدا خواند. اگر تغییراتی در DNA وجود داشته باشد، این فرآیند می تواند مختل شود و منجر به بریده شدن بیش از حد یا خیلی کم از RNA شود. تصور می شود که اشتباهات در فرآیند پیرایش یکی از شایع ترین علل تشکیل نادرست پروتئین و بیماری های ارثی است.

دقت قابل توجهی بیشتر از مطالعات قبلی

این تیم از مجموعه داده های موجود استفاده می کند تا بتواند اظهاراتی در مورد ارتباط احتمالی بین تغییرات ژنتیکی و اختلالات اتصال در بافت های خاص بیان کند. این مجموعه داده ها شامل نمونه های DNA و RNA از 49 بافت از مجموع 946 فرد است. در مقایسه با مطالعات قبلی، تیم ابتدا هر نمونه را مورد بررسی قرار داد تا ببیند آیا و تا چه حد پیرایش نادرست ناشی از تغییر روی DNA عموماً از طریق اختلالات پیرایش در بافت های خاص خود را نشان می دهد یا خیر. به عنوان مثال، یک پروتئین ممکن است مربوط به نواحی خاصی از قلب باشد، در حالی که ممکن است هیچ عملکردی در مغز نداشته باشد. برای این منظور، یک نقشه پیوند مخصوص بافت ایجاد شد که در آن تعیین شود کدام مکان های روی RNA برای پیوند در یک بافت خاص مهم هستند.

در تجزیه و تحلیل، هر ژن با حداقل یک گونه ژنتیکی نادر و مرتبط با تشکیل پروتئین در نظر گرفته شد. علاوه بر بخش های کدکننده پروتئین روی RNA، بخش هایی وجود دارند که برای سایر فرآیندهای سلول های ما مهم هستند. این موارد در مطالعه در نظر گرفته نشد. این منجر به مطالعه حدود 9 میلیون گونه ژنتیکی نادر شد. به دنبال این مطالعه دقت پیش بینی اتصال نادرست در مقایسه با مدل های قبلی شش برابر شد. دقت و یادآوری معیارهای مهمی برای پیش بینی اثربخشی مدل ها هستند. دقت نشان می دهد که چه تعداد از تغییرات ژنتیکی پیش بینی شده توسط مدل واقعاً منجر به پیوند نادرست می شود. این فراخوان نشان می دهد که چند جهش ژنتیکی که منجر به پیوند نادرست می شوند توسط مدل بازیابی می شوند.

استفاده عملی از الگوریتم

این مدل به عنوان بخشی از پروژه تحقیقاتی اروپایی Solve-RD حل بیماری های نادر حل نشده استفاده می شود. این ابتکار هدف خود را بهبود نتایج تشخیصی بیماری های نادر از طریق تبادل گسترده دانش قرار داده است. تیم TUM در حال حاضر 20000 توالی DNA از مجموع 6000 خانواده آسیب دیده را تجزیه و تحلیل کرده است. علاوه بر این، این مدل باید امکان یافتن آسان تر تشخیص ژنتیکی اشکال مختلف لوسمی را در آینده فراهم کند. برای این منظور، محققان در حال حاضر در حال بررسی 4200 نمونه DNA و RNA از بیماران لوسمی هستند.