[صفحه اصلی ]   [Archive] [ English ]  
:: دوره 3، شماره 5 و S5 - ( ویژه نامه90 آماری 1390 ) ::
جلد 3 شماره 5 و S5 صفحات 93-101 برگشت به فهرست نسخه ها
آنالیز جنگل های تصادفی: یک روش آماری مدرن برای غربالگری در مطالعات با بعد بالا و کاربرد آن در یک مطالعه همبستگی ژنتیکی جمعیت-پایه
سحر نوری1، کرامت نوری جلیانی 2، کاظم محمد3، محمد حسین نیکنام4، مهدی محمودی5، لاریس آندونیان3، آرش اکابری6
1- تخصصی آمار زیستی، گروه اپیدمیولوژی و آمار زیستی، دانشکده بهداشت و انستیتو تحقیقات بهداشتی، دانشگاه علوم پزشکی تهران، تهران، ایران
2- دانشکده بهداشت و انستیتو تحقیقات بهداشتی، دانشگاه علوم پزشکی تهران ، تهران، ایران
3- دانشکده بهداشت و انستیتو تحقیقات بهداشتی، دانشگاه علوم پزشکی تهران، تهران، ایران
4- ، مرکز تحقیقات ایمونولوژی ملکولی، دانشگاه علوم پزشکی تهران، تهران، ایران
5- روماتولوژی و مرکز تحقیقات ایمونولوژی ملکولی، دانشگاه علوم پزشکی تهران، تهران، ایران
6- دانشگاه علوم پزشکی خراسان شمالی، بجنورد، ایران
چکيده:   (3046 مشاهده)

چکیده زمینه و هدف: پیشرفت های سریع تکنولوژی قرن اخیر در زمینه مطالعات ژنتیکی ما را با حجم زیاد اطلاعات مواجه کرده و چالشی را در تحلیل این قبیل داده های با تعداد بسیار زیاد متغیر پیشگو بوجود آورده است. مطالعه حاضر با در نظر گرفتن داده ها با تعداد متغیرهای بسیار زیاد همراه با اثرات متقابل آنها که ممکن است در تحلیل آماری داده های ژنتیکی با آن مواجه شویم و با هدف بررسی روش های نوین برای تحلیل اینگونه داده های با بعد زیاد انجام پذیرفت. مواد و روش کار: در این مطالعه روش آماری ناپارامتری و نوین جنگل های تصادفی برای تعیین فاکتورهای مهم و اثرگذار ژنتیکی بر روی بیماری آنکیلوزان اسپوندیلیت بکار برده شد. داده ها حاوی اطلاعات مربوط به ژن HLA-B27 و 12 پلی مرفیسم تک نوکلئوتیدی ژنی موسوم به ERAP-1 از 401 بیمار مبتلا به آنکیلوزان اسپوندیلیت و 316 کنترل سالم بود. تحلیل های فوق متعاقبأ به کمک رگرسیون لجستیک نیز اجرا شد و نتایج آن با جنگل های تصادفی مقایسه گردید. یافته ها: بر اساس نتایج مدل رگرسیون لجستیک گام به گام متغیرهای HLA-B27 و پلی مرفیسم rs28096 به طور معنی دار در ارتباط با بیماری مذکور بودند در حالیکه روش جنگل های تصادفی متغیرهای HLA-B27 و rs1065407 را متغیرهای اصلی اثرگذار روی این بیماری تشخیص داد و rs28096 در رتبه سوم اهمیت قرار داشت. نتیجه گیری: نتایج حاصل از این مطالعه حاکی از ارتباط زیاد HLA-B27 با بیماری آنکیلوزان اسپوندیلیت بود. روش کلاسیک و متداول رگرسیون لجستیک پلی مرفیسم rs28096 را مهم ترین فاکتور خطر در رابطه با بیماری معرفی کرد در حالیکه روش جنگل های تصادفی rs1065407 را نیز مهمترین پلی مرفیسم تشخیص داد. لذا محققین بایستی نتایج آماری حاصل از روش های متداول کلاسیک را با روش های جامع و کامل تر نوین از قبیل جنگل های تصادفی در مطالعات غربالگری مدنظر داشته باشند

واژه‌های کلیدی: واژه های کلیدی: جنگل های تصادفی (RF)، داده های بعد بالا، اثرمتقابل، رگرسیون لجستیک، درخت
متن کامل [PDF 286 kb]   (805 دریافت)    
نوع مطالعه: مقاله پژوهشی | موضوع مقاله: علوم پایه
دریافت: ۱۳۹۳/۱۱/۱۶ | پذیرش: ۱۳۹۳/۱۱/۱۶ | انتشار: ۱۳۹۳/۱۱/۱۶
ارسال نظر درباره این مقاله
نام کاربری یا پست الکترونیک شما:

CAPTCHA code



XML   English Abstract   Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Noori S, Nourijelyani K, Mohammad K, Niknam M, Mahmoudi M, Andonian L et al . Random forests analysis: A modern statistical method for screening in high-dimensional studies and its application in a population-based genetic association study. JNKUMS. 2012; 3 (5) :93-101
URL: http://journal.nkums.ac.ir/article-1-253-fa.html

نوری سحر، نوری جلیانی کرامت، محمد کاظم، نیکنام محمد حسین، محمودی مهدی، آندونیان لاریس و همکاران.. آنالیز جنگل های تصادفی: یک روش آماری مدرن برای غربالگری در مطالعات با بعد بالا و کاربرد آن در یک مطالعه همبستگی ژنتیکی جمعیت-پایه. مجله دانشگاه علوم پزشکی خراسان شمالی. 1390; 3 (5) :93-101

URL: http://journal.nkums.ac.ir/article-1-253-fa.html



دوره 3، شماره 5 و S5 - ( ویژه نامه90 آماری 1390 ) برگشت به فهرست نسخه ها
مجله دانشگاه علوم پزشکی خراسان شمالی Journal of North Khorasan University of Medical Sciences
Persian site map - English site map - Created in 0.23 seconds with 30 queries by YEKTAWEB 3767