close
دانلود فیلم
پایان نامه داده کاوی
 
پایان نامه بررسی و تشخیص نفوذ با استفاده از الگوریتم های داده ­کاوی

عنوان :بررسی و تشخیص نفوذ با استفاده از الگوریتم های داده ­کاوی

تعداد صفحات : 164

چکیده

با رشد فناوری اطلاعات، امنیت شبکه به عنوان یکی از مباحث مهم و چالش بسیار بزرگ مطرح است. سیستم های تشخیص نفوذ، مولفه اصلی یک شبکه امن است. سیستم های تشخیص نفوذ سنتی نمی­توانند خود را با حملات جدید تطبیق دهند از این رو  امروزه سیستم های تشخیص نفوذ مبتنی بر داده ­کاوی مطرح گردیده­اند. مشخص نمودن الگوهای در حجم زیاد داده، کمک بسیار بزرگی به ما می­کند. روش­های داده ­کاوی با مشخص نمودن یک برچسب دودویی (بسته نرمال، بسته غیر­نرمال) و همچنین مشخص نمودن ویژگی­ها و خصیصه با الگوریتم ­های دسته­ بندی می­توانند داده غیر­نرمال تشخیص دهند. از همین رو دقت و درستی سیستم­های تشخیص ­نفوذ  افزایش یافته و در نتیجه امنیت شبکه بالا می­رود. در این پایان نامه ما مدلی پیشنهادی ارائه می­نماییم که الگوریتم­های مختلف دسته­بندی  را روی مجموعه داده خود تست نموده و نتایج  شبیه­سازی نشان می­دهد در درخت تصمیم  الگوریتم J48 ، شبکه عصبی الگوریتم Neural net ، شبکه بیزین  الگوریتم HNB ، مدل کاهل الگوریتم K-STAR، در ماشین بردار پشتیبان الگوریتم LibSVM و در مدل قانون محور الگوریتمRule Induction Single Attribute  دارای بهترین جواب از نظر پارامترهای مختلف ارزیابی برای سیستم تشخیص نفوذ است. بین تمامی الگوریتم­ها با این مجموعه داده، الگوریتم J48 دارای بالاترین مقدار درستی به میزان  85.49%،  دارای بالاترین میزان دقت به مقدار 86.57% و دارای بالاترین مقدار یادآوری به مقدار 86.57% می­باشد. نوآوری اصلی در پایان نامه ، استفاده از الگوریتم­های مدل کاهل و مدل قانون­محور است که تاکنون برای سیستم­های تشخیص­نفوذ استفاده نشده است. و همچنین پیشنهاد 5 نمونه داده که از داده اولیه استخراج شده که برای مدل­های مختلف و الگوریتم­ها بهترین جواب را می­ دهد.

ادامه مطلب...
پایان نامه Data Mining

چکیده:

در دو دهه قبل توانايي­های فنی بشر برای توليد و جمع­آوری داده‌ها به سرعت افزايش يافته است. عواملی نظير استفاده گسترده از بارکد برای توليدات تجاری، به خدمت گرفتن کامپيوتر در کسب­و­کار، علوم، خدمات­ دولتی و پيشرفت در وسائل جمع­آوری داده، از اسکن کردن متون و تصاوير تا سيستمهای سنجش از دور ماهواره­ای، در اين تغييرات نقش مهمی دارند.

بطور کلی استفاده همگانی از وب و اينترنت به عنوان يک سيستم اطلاع رسانی جهانی ما را مواجه با حجم زیادی از داده و اطلاعات می‌کند. اين رشد انفجاری در داده‌های ذخيره شده، نياز مبرم وجود تکنولوژی­های جديد و ابزارهای خودکاری را ايجاد کرده که به صورت هوشمند به انسان ياری رسانند تا اين حجم زياد داده را به اطلاعات و دانش تبديل کند. داده­کاوی به عنوان يک راه حل برای اين مسائل مطرح مي باشد. در يک تعريف غير رسمی داده­کاوی فرآيندی است، خودکار برای استخراج الگوهايی که دانش را بازنمايی مي­کنند، که اين دانش به صورت ضمنی در پايگاه داده­های عظيم، انباره­داده و ديگر مخازن بزرگ اطلاعات، ذخيره شده است.

 به لحاظ اینکه در چند سال اخیر مبحث داده­کاوی و اکتشاف دانش موضوع بسیاری از مقالات و کنفرانسها قرار گرفته و نرم­افزار­های آن در بازار به شدت مورد توجه قرار گرفته، از اینرو در مقاله سعی بر آن شده تا گذری بر آن داشته باشیم.

در این مقاله درفصل مروری بر داده­کاوی خواهیم داشت . که به طور عمده به تاریخچه ، تعاریف، کاربردها وارتباط آن با انبار داده و OLAP خواهیم پرداخت. در پایان فصل مراحل فرایند کشف دانش از پایگاه داده­ها را ذکر کردیم که داده­کاوی یکی از مراحل آن است.

 در فصل 2 یکی از شیوه­های داده­کاوی که از سبد خرید گرفته شده­ است توضیح داده شده است . در این فصل به شرح قوانین ارتباطی خواهیم پرداخت که در آن بعد از دسته­بندی الگوریتمها ، الگوریتم Apriori ( که یک الگوریتم پایه در این زمینه است ) و الگوریتم FP-Growth ( یک الگوریتم جدید میباشد) را با شرح یک مثال توضیح می­دهیم و در آخر آن دو را با هم مقایسه می­کنیم .

در فصل 3 مباحث وب­کاوی و متن­کاوی را که در بسیاری از مراجع جزء کاربردهای داده­کاوی به حساب می­آید شرح داده خواهد شد.

ادامه مطلب...
پایان نامه بهینه سازی خرید دارو با استفاده از داده کاوی

پایان ‌نامه کارشناسی ارشد در رشته مهندسی فناوری اطلاعات (تجارت الکترونیک)

بهینه سازی خرید دارو با استفاده از داده ­کاوی

تعداد صفحات :120

چکیده

بهینه سازی خرید دارو با استفاده از داده کاوی  توسعه ­ی استفاده از فناوری اطلاعات در بهداشت و درمان علاوه بر مزایای فراوان باعث می شود تا حجم زیادی از داده­های مرتبط، در دسترس قرار بگیرند. با بکارگیری داده کاوی بر روی داده های موجود می توان تصمیم گیری­ها  و فرایند­های مدیریتی را بهبود بخشید. در این پایان نامه تلاش شده است ضمن بررسی الگوریتم­های مختلف داده کاوی مدلی جهت پیش بینی مصرف دارو در داروخانه­های بیمارستان­ها ارائه گردد. مجموعه داده در نظر گرفته شده مربوط به سیستم اطلاعات بیمارستان پاستور شهرستان بم می باشد که در مدت 5 سال در پایگاه داده سیستم اطلاعات این بیمارستان ذخیره شده است. برای پیش بینی مصرف دارو عملکرد مدل­های MLP، SVR، ADABOOST.R، BAGTREE، LR، LSSVR مورد بررسی قرار می گیرد. دقت پیش بینی بر اساس معیارها  MSE ,RMSE ,MAE وR2 ارزیابی می گردد. طبق نتایج بدست آمده عملکرد مدل BAGTREE  در روش های مختلف بهتر از سایر مدل ها بوده است.

ادامه مطلب...
پایان نامه پیش پردازش داده های نا متوازن با استفاده از ماشین بردار پشتیبان

پیش پردازش داده های نا متوازن با استفاده از ماشین بردار پشتیبان

تعداد صفحات:113

چکیده

برای دست یابی به نتایج مطلوب در داده کاوی نیاز به پیش پردازش داده ها داریم.پیش پردازش داده ها یکی از اجزای مهم در فرایند کشف دانش است.روش های بسیاری برای پیش پردازش داده وجود دارد که می­توان از آنها استفاده کرد.اما این روش ها برای داده های نامتوازن مناسب نیستند. اصطلاح “مجموعه داده نامتوازن” عموما به مجموعه داده‌ای گفته می‌شود که در آن تعداد نمونه‌هایی که نمایانگر یک کلاس هستند از نمونه‌های دیگر در کلاس‌های متفاوت کمتر است مشکل عدم توازن کلاس در بسیاری از برنامه های کاربردی جهان واقعی به رسمیت شناخته شده است و موضوع تحقیقات یادگیری مبتنی بر ماشین قرار گرفته است از این رو اخیراً مشکل نامتوازن بودن کلاسها مورد توجه محققان در زمینهی دادهکاوی قرار گرفته است.آنها به دنبال کشف روش هایی بودند که با اعمال بر روی داده های نامتوازن به نتایج مطلوبی دست یابند.

در این پروژه روش های گوناگون پیش پردازش داده های نامتوازن مورد بحث قرار گرفته و الگوریتم جدیدی برای بهبود نتایج طبقه بندی ارائه می­شود، به گونه ای که کارایی و دقت آن مورد توجه باشد.

 

ادامه مطلب...
 ارائه روشی جهت تحقق پرداخت الکترونیکی عوارض در کشور با استفاده از الگو های داده کاوی

 

پایان‌نامه کارشناسی ارشد در رشته مهندسی فن‌آوری اطلاعات (تجارت الکترونیک)

عنوان:ارائه روشی جهت تحقق پرداخت الکترونیکی عوارض در کشور با استفاده از الگو های داده کاوی

تعداد صفحات :194

چکیده:

بخش حمل ونقل نیز به عنوان یکی شاهرگ اصلی اقتصاد، نقش بسزایی در شکوفایی و توسعه جامعه ایفا می­کند. سنگینی ترافیک از تقاضای بیش از ظرفیت سیستم های حمل و نقل نشات می گیرد و اثرات منفی آن به شکل تاخیر یا افزایش زمان سفر نمود می یابد.

قیمت گذاری تراکم یکی از مکانیزم­های مدیریت تقاضای حمل ونقل است. در این روش استفاده کنندگان بگونه ای ترغیب می شوند که در طول ساعات شلوغ و پرتردد از سفر پرهیز کنند و سفرهای خود را در ساعات کم تردد انجام دهند. بدین طریق جریان ترافیک تعدیل شده و تقاضای سفر بگونه ای در طول ساعات روز توزیع می شود که کمتر بار ترافیکی شدید به وجود آید. از طرف دیگر شاید بهترین گزینه جلوگیری از وقوع تراکم باشد، که خود مستلزم پیش بینی وقوع آن در زمان آینده می باشد. مدل پیش بینی حجم ترافیک در کوتاه مدت یکی از بخش هایی است که از این اطلاعات استفاده می کند. این مدل با بکارگیری اطلاعات شناسگرهای ترافیکی هر معبر، حجم عبوری از یک معبر در لحظات پیش رو را پیش بینی می­کند، و از این اطلاعات برای مدیریت پیشگیرانه ترافیک میتوان استفاده نمود.

ادامه مطلب...
پایان نامه طراحی سیستم پیشنهاددهنده موسیقی ایرانی با استفاده از داده‌کاوی

دانلود متن کامل پایان نامه با فرمت ورد

پایان نامه مقطع کارشناسی ارشد رشته فناوری اطلاعات

 

عنوان: طراحی سیستم پیشنهاددهنده موسیقی ایرانی با استفاده از  داده‌کاوی

تعداد صفحات :98

به دلیل رشد بی‌رویه فایل‌های موسیقی و ایجاد کتابخانه‌های عظیم دیجیتال، بازیابی اطلاعات موسیقی و سازمان‌دهی آن بر اساس نوع ژانر یا خواننده و یا حالت و … تبدیل به چالشی مهم شده است. علاوه بر آن افراد ذائقه‌های مختلفی در انتخاب موسیقی دارند و یا در شرایط مختلف نیازهای متفاوتی به نوع و حالت موسیقی دارند که با توجه به حجم زیاد موسیقی یافتن فایل‌هایی که مرتبط با ذائقه و یا نیاز افراد باشد کاری دشوار به نظر می‌رسد از همین روست که در سال‌های اخیر  توجه خاصی به بازیابی اطلاعات موسیقی شده است. هم اکنونفراداده‌یی نظیر نام فایل، خواننده، اندازه فایل، تاریخ وژانر به صورت معمول در رده‌بندی و بازیابی این رکوردها مورد استفاده قرار می‌گیرد. اما این دسته‌بندی‌ها پاسخ‌گوی نیاز دنیای امروز نیست.

هدف اصلی این پایان نامه بهبود روش‌های پیشنهاددهی موسیقی  با استفاده ازویژگی‌هایمحتواییو همچنین مدیریت پروفایل‌های مشتری می‌باشد. در راستای دست یافتن به این هدفرده‌بندی فایل‌های موسیقی در کلاس‌هایی مانند خواننده و ژانر و یافتن موسیقی‌هایی که از نظر موسیقیای به هم شباهت دارند و همچنین پیشنهاد بر اساس مشتری‌هایی که ذائقه‌های مشترک دارند را می‌توان به خدمت گرفت. در این پایان‌نامه در جهت رسیدن به اهداف ذکر شده، یکی ازکارهای انجام گرفته یافتن یک ویژگی رده­بندی جدید به نام Area Method of Moment می­باشد. این ویژگی بالاترین درصد کارایی را در رده‌بندی ژآنر به دست داده است. علاوهبراین، با استفاده از همین ویژگی‌هایی که نشان‌دهنده یک ویژگی موسیقیای خاص است میزان شباهت فایل‌های موسیقی به هم اندازه‌گیری شده و به کاربران پیشنهاد شده که با توجه به بازخورد کاربران به ارزیابی میزان صحت می‌پردازد. در ادامه  برای به خدمت گرفتن روش Collaborative flittering    به ارائه معیاری جدید در یافتن شباهت میان پروفایل‌هامی‌پردازیم. به دلیل این که هدف اصلی این پایان‌نامه کار کردن بر روی موسیقی ایرانی است، بنابراین به علت عدم  وجود مجموعه داده مناسب، برای شروع مناسب، ایجاد مجموعه داده مناسب در اولویت تحقیق قرار گرفته است. شایان ذکر است که برای ارزیابی و دریافت بازخورد مشتریان، برنامه کاربردی با ویژگی‌های مذکور پیاده سازی شده است.

از آنجایی که در دنیای رقابتی امروز یافتن موسیقی مورد پسند افراد در صنعت فروش موسیقی از اهمیت بالایی برخوردار استروش‌های پیشنهاد شده در این تحقیق می‌تواند بسیار کاربردی باشد. با توجه به نتایج به دست آمده دراین تحقیق، امید آن می­رود که کمپانی‌های فروش موسیقی آن‌ها را در سطح تجاری مورد استفاده قرار دهند. همچنین روش‌های ارائه شده در این سیستم پیشنهاددهنده می‌تواند برای سایر سیستم‌های پیشنهاددهنده نیز مورد استفاده قرار گیرد.

ادامه مطلب...
تدوین شاخص‌ها و داشبورد ارزیابی و پیش‌بینی پیشرفت تحصیلی دانشجویان با شبکه‌عصبی و درخت‌تصمیمC5

تدوین شاخص‌ها و داشبورد ارزیابی و پیش‌بینی پیشرفت تحصیلی دانشجویان با شبکه‌عصبی و درخت‌تصمیمC5

تعداد صفحات :123

چکیده

درک عواملی که منجر به موفقیت یا شکست در امتحانات مسئله ای جالب و چالش برانگیز است.مفاهیم مرتبط، تجزیه و تحلیل عوامل موفقیت در امتحانات، ممکن است به درک و به طور بالقوه به بهبود پیشرفت تحصیلی کمک کند.بنابراین در این پژوهش ضمن مروری کلی بر داده کاوی و ویژگی های اصلی یک داشبورد مدیریتی کارا، سعی بر این است تا یک مطالعه موردی بر روی پایگاه داده های دانشگاه های سراسری و آزاد استان قم صورت گیرد تا پیشرفت تحصیلی دانشجویان پیش بینی گردد.در این پژوهش ابتدا توسط الگوریتم k-means خوشه بندی صورت گرفته است و با استفاده از شاخص ارزیابی SSE ، تعداد خوشه بهینه تعیین گردیده است. بنابراین تعداد خوشه بهینه برای دانشجویان چهار خوشه می باشد و سپس خوشه ها با روش های پیش بینی داده کاوی از جمله شبکه عصبی و درخت تصمیم C5 که از پرکاربردترین و دقیق ترین روش های پیش بینی می باشند، پیش بینی شده اند و درنهایت با استفاده از نتایج این روش ها، شاخص های مناسب یافت شدند و به صورتی روشن در یک داشبورد نمایش داده شدند.

ادامه مطلب...
پیش پردازش داده های نا متوازن با استفاده از ماشین بردار پشتیبان

عنوان:پیش پردازش داده های نا متوازن با استفاده از ماشین بردار پشتیبان

تعداد صفحات :115

چکیده:

برای دست یابی به نتایج مطلوب در داده کاوی نیاز به پیش پردازش داده ها داریم.پیش پردازش داده ها یکی از اجزای مهم در فرایند کشف دانش است.روش های بسیاری برای پیش پردازش داده وجود دارد که می­توان از آنها استفاده کرد.اما این روش ها برای داده های نامتوازن مناسب نیستند. اصطلاح “مجموعه داده نامتوازن” عموما به مجموعه داده‌ای گفته می‌شود که در آن تعداد نمونه‌هایی که نمایانگر یک کلاس هستند از نمونه‌های دیگر در کلاس‌های متفاوت کمتر است مشکل عدم توازن کلاس در بسیاری از برنامه های کاربردی جهان واقعی به رسمیت شناخته شده است و موضوع تحقیقات یادگیری مبتنی بر ماشین قرار گرفته است از این رو اخیراً مشکل نامتوازن بودن کلاسها مورد توجه محققان در زمینه ی داده کاوی قرار گرفته است.آنها به دنبال کشف روش هایی بودند که با اعمال بر روی داده های نامتوازن به نتایج مطلوبی دست یابند.

در این پروژه روش های گوناگون پیش پردازش داده های نامتوازن مورد بحث قرار گرفته و الگوریتم جدیدی برای بهبود نتایج طبقه بندی ارائه می­شود، به گونه ای که کارایی و دقت آن مورد توجه باشد.

 


ادامه مطلب...
پایان نامه ارایه مدلی برای تعمیرات پیشگویانه تجهیزات درکارخانه های نفتی با تکنیکهای داده کاوی

دانشکده آموزشهای الکترونیکی مهندسی فناوری اطلاعات(گرایش مدیریت سیستمهای اطلاعاتی)

عنوان: ارایه مدلی برای تعمیرات پیشگویانه تجهیزات درکارخانه های نفتی با تکنیکهای داده کاوی، مطالعه موردی: شرکت بهره برداری نفت و گاز گچساران

تعداد صفحات : 145

چکیده:

کارخانه ها و تاسیسات هر روزه با چالشها و مشکلات بیشتری برای افزایش بهره وری و کاهش هزینه ها مواجه می شوند و در این راستا استراتژی های نگهداری و تعمیرات نقش بسزایی دررسیدن به این هدف دارند.در سالهای اخیر تلاشهای فراوانی شده است تا بتوان با کمک سیستمهای فناوری اطلاعات انواع روشهای نگهداری و تعمیرات را به طرز موثری پیاده سازی و اجرایی نمود. نگهداری و تعمیرات پیشگویانه یکی از استراتژی‌های نگهداری و تعمیرات است که بر مبنای آن در بازه‌های زمانی معین تعدادی از پارامترهای تجهیرات اندازه‌گیری می‌شود و بر اساس این داده‌ها، زمان رخداد خرابی احتمالی آینده پیش بینی شده و برای تعمیر و یا تعویض قطعات و تجهیزات تصمیم‌گیری می‌شود.

در این مقاله سعی شده است یک مدل پشتیبان تصمیم گیر برای نگهداری و تعمیرات پیشگویانه مبتنی بر شرایط بر اساس تکنیکهای داده کاوی طراحی شود. این پروژه در یکی از شرکتهای بهره برداری نفت و گاز جنوب کشور انجام شده و تجهیز انتخابی برای این پروژه توربین می باشد که یکی از اساسی ترین و بحرانی ترین تجهیزات در کارخانه های نفتی است.

در این پروژه چندین تکنیک داده کاوی از جمله درخت تصمیم وشبکه های عصبی برای پیش بینی رخداد خرابی مورد استفاده قرار گرفت و با مقایسه خروجی و نتایج آنها و با آنالیز این خروجی ها سعی شد بهترین مدل برای پیش بین رخداد خرابی در تجهیز مورد نظر مشخص شود.در انتها پیشنهادهایی از جمله توسعه این مدل برای سایر تجهیزات، کنترل مدت زمان مشاهده وضعیت تجهیزات و تعیین زمان بهینه تعمیر و نگهداری برای آینده ارائه شده است.

فصل اول

1- مقدمه و طرح مسئله

1-1- مقدمه

در عصر حاضر و در حالی که کارخانجات صنعتی بزرگ به دنبال ایجاد تغییرات در درون خود هستند تا بتوانند در رقابت با سایر رقبای خود در تحولات جهانی شدن موفق گردند این بحث نگهداری و تعمیرات است که بطور جدی و موثر مسیر استراتژی تولید را در کارخانه های صنعتی مشخص می نماید.امروزه ،کارخانه های صنعتی به شدت درگیر مباحثی همچون کاهش هزینه ها ،توان رقابت بالا ، بهبود مستمر،بحران انرژی و افزایش کیفیت و کمیت محصولات هستند که در این راستا اندیشیدن پیرامون نگهداری و تعمیرات به عنوان یک امر استراتژیک جهت رسیدن به اهداف فوق بسیار مهم و انکارناپذیر جلوه می کند.همواره رقابت ، عامل فشار بر کارخانجات تولیدی بوده است. به منظور کنترل و مدیریت این فشار، کارخانجات تولیدی می بایست ضمن کاهش هزینه ها، کیفیت و راندمان محصولات خود را افزایش داده و انعطاف پذیر نیز باشند[1, 2] .با توسعه فناوری اطلاعات میزان و سرعت دسترسی به اطلاعات بطور فوق العاده ای افزایش یافته است.از طرفی پیشرفت تکنولوژی نیز منجر به افزایش دستیابی موسسات و سازمانها به منابع وسیع اطلاعاتی شده وامکان تحقیق وبررسی موضوعات مختلف را برای سازمانها فراهم نموده است[3]. بنابراین نکته قابل توجه در سناریو جدید پیرامون مدیریت نگهداری و تعمیرات، آماده و در دسترس نگهداشتن تجهیرات در زمان نیاز است.یک کارخانه بسیار بزرگ با چندین هزار دستگاه متنوع از پیچیدگی بالایی در فعالیت نگهداری و تعمیرات(نت) برخوردار است. تصمیم گیری پیرامون استراتژی نت نیازمند دانشی است که منطبق بر واقعیت سازمان باشد.از طرف دیگر کسب دانش مفید نیازمند استفاده و تحلیل صحیح از داده ها می باشد.لذا استفاده از داده ها و اطلاعات و چگونگی کار با آنها در طول مراحل پیاده سازی استراتژی نگهداری و تعمیرات از جایگاه ویژه ای برخوردار است [4, 5].

2-1- تشریح و بیان مسأله

آنچه در سالهای اخیر توجه مدیران صنایع مختلف را در دنیای رقابتی امروز به خود جلب کرده است ، کاهش هزینه های تولید و در نتیجه کاهش قیمت نهایی محصولات است. در این میان هزینه های تعمیراتی ، مهمترین هزینه قابل کنترل در صنایع است و طبیعی است که کاهش آن در دستور کار مدیران صنعت قرار گیرد . یکی از مهمترین ابزارهایی که برای نیل به این هدف در اختیار مسئولین قرار دارد استفاده از روشهای نوین نگهداری و تعمیرات بر اساس پایش وضعیت دستگاهها است که بخصوص در صنایع تولید مداوم ، نظیر نفت ،گاز و پتروشیمی از اهمیت ویژه ای برخوردار است. فلسفه وجودی روشهای تعمیراتی از قبیل نگهداری و تعمیرات پیشگیرانه1 و نگهداری و تعمیرات پیشگویانه2 ارائه راهکارهایی جهت کاهش هزینه های تعمیراتی و در نتیجه افزایش بهره وری واحد های تولیدی است[6].

عموما نگهداری و تعمیرات یا در زمان های مشخص و از قبل تعیین شده انجام می شود یا اینکه هر وقت خرابی رخ داد بسته به نوع خرابی تعمیر مرود نظر انجام می شود.اگرچه انجام تعمیرات پیشگیرانه می تواند تعمیرات ناگهانی و غیرمترقبه را کاهش دهد اما همچنان باعث کاهش دردسترس بودن و افزایش هرینه های تعمیرات می گردد. گاهی تعمیرات پیشگیرانه روی تجهیز انجام می شود درحالیکه تجهیز به خوبی کار می کند و نیازی به تعمیر و توقف ندارد اما چون نگهداری از قبل در بازه زمانی خاصی برنامه ریزی شده است بایستی طبق روال خود انجام شود.یک سیاست مناسب در نگهداری و تعمیرات می گوید تعمیر زمانی باید انجام شود که نیاز باشد[6].

پیشرفت تکنولوژی باعث افزایش پیچیدگی در هر دوصنعت ماشین آلات و سیستمهای تولید شده است.صنایع مدرن دایما به کار کردن با قابلیت اطمینان بالا ، ریسک محیطی پایین و امنیت افراد که در حال انجام فرایندهای خود با بیشترین بازدهی هستند وابسته است.بنابراین پیشگیری از شکست و تشخیص سریع و ابتدایی مشکلات سیستمها و ماشین ها عمر کارکرد ماشین آلات صنعتی را افزایش می دهد[7].

کارخانجات صنعتی نباید دیگر تصور کنند که خرابی های تجهیزات تنها پس از مدت زمان ثابتی که در حال کار هستند اتفاق می افتد.آنها باید استراتژی های نگهداری آنلاین و پیشگویانه را گسترش دهند که بتوانند تصور کنند که هر خرابی در هر زمانی ممکن است بطور تصادفی رخ دهد.آغاز خرابی و شکست تجهیزات ممکن است خود را در داده های بوجود آمده از روشهای مختلف آشکار سازد.تجهیزات علایم و نشانه هایی از خود بروز می دهند که می گویند این تجهیزات باید تعمیر یا جایگزین شوند و یا رها شوند تا به کار خود ادامه دهند[8].

تشخیص اشتباه و عیب در مراحل اولیه آسیب برای جلوگیری از نقص و عیب فنی در طول کارکرد و عملیات لازم است.این مساله سود قابل توجهی را در رسیدن به استفاده از تکنیکهای بهینه سازی در عملیات واحد صنعتی با بهبود استفاده از منابع در سطوح مختلف از فرایند تصمیم گیری بر می گرداند.فرضیه نگهداری شرطی یک مشاهده منظم از شرایط واقعی از تجهیزات بر اساس ویژگی های مهم و برجسته و موثر آنها و کارایی عملکرد از سیستمهای فرایندی است که باعث اطمینان از حداکثر کردن فاصله بین تعمیرها ، کاهش هزینه تعمیرات برنامه ریزی نشده ناشی ازخرابی ماشین آلات و بهبود دسترسی جامع از عملکرد واحد های صنعتی خواهد بود.یکی از مهمترین و به صرفه ترین تکنیکهای موثر نگهداری ، نگهداری مبتنی بر شرایط(CBM)1 است[8].

1Condition Based Maintenance

استفاده از نگهداری و تعمیرات پیشگویانه یا همان نگهداری مبتنی بر شرایطباعث رسیدن به پیشرفتهای بزرگی در هزینه های نگهداری و تعمیرات ، کاهش خرابیهای برنامه ریزی نشده ماشین آلات1 ، کاهش زمان ازکارافتادگی(بیکاری) ناشی از تعمیر2 تجهیزات و بهبود موجودی قطعات یدکی می شود[7].

نگهداری پیشگویانه  یکی از استراتژی‌های نگهداری و تعمیرات است که بر مبنای آن در بازه‌های زمانی معین و یا بصورت مستمر تعدادی از پارامترهای تجهیرات اندازه‌گیری می‌شود و بر اساس این داده‌ها برای تعمیر و یا تعویض قطعات و تجهیزات تصمیم‌گیری می‌شود.

1-3- هدف از انتخاب موضوع

هدف از اجرای برنامه نگهداری و تعمیرات پیشگویانه شناسایی و تشخیص عیوب تجهیزات از بدو پیدایش و برنامه ریزی به موقع جهت انجام اقدامات اصلاحی است.

روش نگهداری و تعمیر پیشگویانه بر این اصل استوار است که دستگاهی را که با شرایط مطلوب در حال کارکرد است نباید برای تعمیر باز کرد. در این روش تلاش می شود با استفاده از تکنیکهای مناسب هر دستگاه نظیر لرزه نگاری3 ، ترموگرافی4 ، صوت سنجی5 ، آنالیز روغن6 و سایر تکنیکها ضمن رسیدن به حد اکثر بهره وری ، دستگاه فقط هنگام نیاز به تعمیر باز شود و همچنین با اعمال تعمیرات کوچک و به موقع ، نظیر هم محوری و بالانس ، از نتایج زیانبار خرابی های ثانویه که معلول مشکلات کوچک هستند پیشگیری شود.[9]

در این روش عمر قسمتهای مهم بر اساس تعمیرات پیشگیرانه و سایر داده های تاریخی قبلی1 ، تعمیرات و بازرسی ها محاسبه شده و بر اساس آن بصورت منظم فعالیت تعمیرات انجام می شود.

تعمیرات پیشگویانه یک روش تعمیرات مبتنی بر شرط است که در این روش پارامترها و ویژگی های مهم تجهیز و دستگاه بصورت طبیعی محاسبه می گردد و مقادیر بدست آمده به عنوان مبنا در نظر گرفته می شوند، سپس در هنگام استفاده و بکارگیری تجهیز این پارامترها و ویژگی ها بصورت مستمر و مرتب سنجیده شده و با مقایسه با میزان مبنا، زمان خرابی ، علت آن و احتمال وقوع آن محاسبه می شود[7].

اساس و ذات پیش بینی عیب و نقص، برآورد و تخمین زمان باقیمانده از عمر تجهیز در دوره های معنی داری است که می خواهد به سمت یک فرایند تصمیم گیری نگهداری و تعمیرات عمیق و هوشمند هدایت شود[9].

پیش بینی ها به عنوان یک ویژگی اضافه بر امکانات تشخیص عیب نمایش داده می شوند.آنها سلامت و بهبودی جاری یک سیستم را ارزیابی می کنند و میزان زمان از باقیمانده عمر تجهیز را پیش بینی می کنند.پیش بینی ها برای بهبود امنیت ، برنامه ریزی ماموریتهای موفق ، نگهداری های برنامه ریزی شده و کاهش هزینه های نگهداری و زمان بیکاری حیاتی هستند .تکنیکهای نگهداری مبتنی بر شرط یک ارزیابی از شرایط سیستم بر اساس داده های جمع آوری شده از سیستم با مشاهده مستمر را فراهم می کنند[7].

هدف مشخص کردن زودتر برنامه نگهداری مورد نیاز برای هر خرابی پیش بینی شده است.بنابراین استراتژی های نگهداری برای کمینه کردن هزینه با بهبود ایمنی عملیات و تعداد خرابی های سیستم در حال کار کمک می کند.

 

ادامه مطلب...
پایان نامه استفاده از داده کاوی در پیش‌بینی خطای نرم‌افزار بر اساس متریک‌های کد و وابستگی

پایان‌نامه کارشناسی ارشد در رشته مهندسی فناوری اطلاعات (تجارت الکترونیک)

عنوان:استفاده از داده کاوی در پیش‌بینی خطای نرم‌افزار بر اساس متریک‌های کد و وابستگی

تعداد صفحات : 83

چکیده:

تضمین کیفیت نرم‌افزار همیشه دارای محدودیت‌های زمان و هزینه بوده است. به منظور رسیدن به کیفیت بالا و کاهش محدودیت‌ها، مدیران همواره سعی کرده‌اند تا بخش‌های مستعد خطا را در نرم‌افزار پیش‌بینی نمایند و منابع مذکور را به صورت موثری به این بخش‌ها اختصاص دهند. پیش از این، محققین روش‌های خودکاری را برای کمک به مدیران در این امر مهم معرفی و از آن‌ها استفاده کرده‌اند. روش‌های خودکار مذکور با استفاده از اندازه گیری معیارهای مختلف نرم‌افزار و یافتن ارتباط میان این معیارها و خطاهای نرم‌افزاری، همواره سعی در افزایش سرعت و دقت در پیش‌بینی خطا داشته‌اند. به نوعی می‌توان این معیارها را در چهار دسته که عبارتند از معیارهای پیچیدگی، داده‌های تاریخی، معیارهای طراحی و معیارهای وابستگی، قرار داد. اگرچه معیارهای استفاده شده، تا حدودی موثر هستند اما هنوز هیچکدام موفق به پیش‌بینی تمامی خطاهای موجود نشده‌اند. در این رساله، ما با توسعه دادن مفهوم وابستگی در نرم‌افزار، به معرفی مفهوم جدیدی به نام درخت وابستگی می‌پردازیم. این مفهوم به ما کمک می‌کند تا با در نظر گرفتن تمامی وابستگی‌های مستقیم و غیر مستقیم در بین اجزای نرم‌افزار، معیارهای جدیدی را استخراج نماییم که این معیارها می‌توانند عملاً نتایج مطلوب‌تری را نسبت به معیارهای پیشین، در پیش‌بینی خطا ارائه دهند.

1- مقدمه

یکی چالش بر انگیزترین موضوعات مطرح در تضمین کیفیت، در شرکت‌های سازنده نرم افزار، موضوع رفع خطاهای نرم افزار است. خطاهای نرم افزاری می‌توانند در زمان پیش و یا پس از انتشار نرم افزار تشخیص داده شوند. اما منابعی که می‌توان برای تشخیص و تصحیح خطاها در نظر گرفت محدود است (Kamyabi et al.).

خطاها را می‌توان به دو دسته کلی تقسیم کرد. خطاهای نحوی و خطاهای مفهومی. با توجه به‌این که ابزارهای خودکار بسیار قدرتمندی برای تشخیص خطاهای نحوی وجود دارند، احتمال‌این که خطایی ازاین دست تا زمان انتشار تشخیص داده نشود، بسیار کم است. خطاهای مفهومی به آن دسته از خطاها اشاره دارد که در اثر مشکلاتی جدای از اشتباهات نحوی و خطاهای انسانی ملموس اتفاق می‌افتند و معمولاً در اثر عدم هماهنگی در بخش‌های مختلف کد و گاهی به صورت بسیار ناملموس به وجود می‌آیند که در اینجا به سادگی نمی‌توان با بررسی کد، این‌گونه خطاها را تشخیص داد. بنا بر این در مورد خطاهای مفهومی داستان فرق می‌کند چرا که عوامل بسیار زیادی می‌توانند در بروزاین‌گونه از خطاها دخیل باشند. (Zimmermann & Nagappan, 2008) بنا براین همواره سعی شده است که با اندازه گیری معیارهای مختلف و استفاده از آن‌ها در روش‌های پیش‌بینی خودکار خطا، سرعت و دقت را در امر تست نرم افزار افزایش دهند. طی تحقیقاتی که تا کنون صورت گرفته، متداول‌ترین معیارهای استفاده شده در پیش‌بینی اتوماتیک خطا، معیارهای پیچیدگی است. (Zimmermann & Nagappan, 2008) اما جدیدترین روشی که مطرح شده است، مسأله مربوط به وابستگی‌های بین کلاس‌ها و همچنین بین ماژول‌ها می‌باشد. انواع وابستگی‌ها می‌توانند بین دو کلاس و یا دو ماژول مطرح شوند که تحقیقات نشان داده است که این وابستگی‌ها ارتباط بسیار زیادی با وجود خطاهای مفهومی دارند.

برای اجرای روشمند و علمی روند یافتن روابط و الگوهای مناسب برای پیش بینی خطا بر اساس معیارهای قابل اندازه گیری، از مفهومی به نام داده‌کاوی استفاده خواهیم کرد که در تشریح و بیان مسأله به آن خواهیم پرداخت.

دراین پایان نامه، سعی می‌کنیم که به بررسی چنین وابستگی‌هایی بپردازیم و بر اساس روابط موجود بین وابستگی و وجود خطا در نرم افزار، وجود خطا در کد را پیش بینی نماییم.

در ادامه این رساله در بخش دوم به بررسی تحقیقات قبلی انجام شده در این زمینه می‌پردازیم، در بخش سوم به بیان انگیزش و نحوه به وجود آمدن ایده کار شده در این رساله می‌پردازیم، در بخش چهارم فرضیات مورد بررسی را مطرح می‌کنیم، در بخش پنجم داده‌ها و ابزارهای جمع آوری شده برای انجام عملی آزمایشات را معرفی می‌کنیم، در بخش ششم به بیان شیوه و نوع آزمایشات و بیان نتایج آنالیزها و نتایج می‌پردازیم و در بخش هفتم و پایانی این رساله سعی در نتیجه‌گیری از آزمایشات انجام شده خواهیم داشت.

2- پیشینه پژوهشی:

تلاش‌های گذشته با هدف پیش‌بینی خطا را در سه گروه مورد بررسی قرار می‌دهیم: معیارهای نرم‌افزار، معیارهای وابستگی و معیارهای تاریخی. ابتدا به بیان توضیحی در مورد شیوه کار کردن این معیارها می‌پردازیم.

2-1- معیارهای نرم‌افزار:

معیارهای نرم‌افزار برای اندازه‌گیری درجه پیشرفته بودن یک محصول و یا یک فرآیند نرم‌افزاری به کار می‌روند. معیارهای نرم‌افزاری به چندین گروه تقسیم می‌شوند: معیارهای محصول، معیارهای فرآیند، معیارهای پروژه و معیارهای منبع. معیارهای نرم‌افزاری که در پیش‌بینی خطا به کار می‌روند معیارهای محصول می‌باشند که از مشخصات کد سیستم نرم‌افزاری استخراج می‌شوند. این معیارها به سه گروه تقسیم می‌شوند: معیارهای اندازه، معیارهای پیچیدگی و معیارهای کیفیت. (Mills, 1988) معیارهای اندازه بر اساس تعداد خطوط کد برنامه محاسبه می‌شوند مانند تعداد کل خطوط برنامه، تعداد خطوط توضیحات و … معیارهای میزان نگهداشت‌پذیری و قابلیت تست برنامه وابسته است از جمله معروف‌ترین معیارهای پیچیدگی معیارهای پیچیدگی مک کیب و معیارهای هالستد می‌باشند. معیارهای مک‌کیب پیچیدگی کد را بر اساس تعداد مسیرهای کنترلی محاسبه می‌نماید. (McCabe, 1976) هالستد معیارهای خود را بر اساس ارتباطات ریاضی بین اجزای کد، پیچیدگی کد و نوع زبان برنامه نویسی مطرح کرد. (Halstead M. H., 1975) معیارهای اتصال و پیوستگی از معروف‌ترین معیارهای کیفیت می‌باشند که بالا و یا پایین بودن اندازه این دو معیار نشان دهنده کیفیت محصول و یا فرآیند نرم‌افزاری است. (Pressman, 1982) معیارهای کیفیت معیارهایی میباشند که درجه آن‌ها می‌تواند تولیدکنندگان نرم‌افزار را در مورد توانایی دست کار کردن سیستم‌شان مطمئن سازد.

2-2- معیارهای وابستگی:

معیارهای وابستگی معیارهایی هستند که بر اساس ارتباط اجزای کد نرم‌افزار محاسبه می‌شوند. این ارتباط می‌تواند بین سطوح مختلف کد مطرح شود مانند سطح فایل، کلاس، تابع … نوع ارتباط و یا به عبارت دیگر وابستگی موجود بین اجزای کد نیز می‌تواند متفاوت باشد مانند وابستگی داده که بر اساس تعریف و استفاده از داده می‌باشد و یا وابستگی صدا زدن که بر اساس تعریف و صدا زدن مؤلفه‌ها می‌باشد. (Zimmermann, 2008 & Nagappan )

2-3- معیارهای تاریخی:

این دسته از معیارهای بر اساس تغییراتی که در بین چندین انتشار مختلف از یک سیستم نرم‌افزاری رخ می‌دهد تعریف می‌شوند. این تغییرات می‌توانند اضافه شدن، حذف شدن، تغییر یافتن مؤلفه‌های جز مربوطه در بین چندین انتشار باشند. محدودیتی که در به کار بردن این معیارها وجود دارد این است که محاسبه این معیارهای تنها برای محصولات نرم‌افزاری مقدور می‌باشد که دارای چندین انتشار باشند و همچنین اطلاعات کامل در مورد انتشارات قبلی موجود باشد.

 

 

ادامه مطلب...
دانلود پایان نامه نقش داده کاوی در تجارت الکترونیک

مشخصات مقاله:

عنوان : کاربرد داده کاوی در تجارت الکترونیک
فرمت فایل: WORD (قابل ویرایش)
تعداد صفحات: ۱۵۱

چکیده ای از مقدمه آغازین ”  پایان نامه نقش داده کاوی در تجارت الکترونیک ” بدین شرح است:

 

از هنگامی که رایانه در تحلیل و ذخیره سازی داده ها بکار رفت (۱۹۵۰) پس از حدود ۲۰ سال، حجم داده ها در پایگاه داده ها دو برابر شد. ولی پس از گذشت دو دهه و همزمان با پیشرفت فن آوری اطلاعات(IT)  هر دو سال یکبار حجم داده ها، دو برابر شده و همچنین تعداد پایگاه داده ها با سرعت بیشتری رشد نمود. این در حالی است که تعداد متخصصین تحلیل داده ها با این سرعت رشد نکرد. حتی اگر چنین امری اتفاق می افتاد، بسیاری از پایگاه  داده ها چنان گسترش یافته‌اند که شامل چندصد میلیون یا چندصد میلیارد رکورد ثبت شده هستند.
امکان تحلیل و استخراج اطلاعات با روش های معمول آماری از دل انبوه داده ها مستلزم چند روز کار با رایانه های موجود است.[۳]حال با وجود سیستم های یکپارچه اطلاعاتی، سیستم های یکپارچه بانکی و تجارت الکترونیک، لحظه به لحظه به حجم داده ها در پایگاه داده های مربوط اضافه شده و باعث به وجود آمدن حانبارهای عظیمی از داده ها شده است.
ادامه مطلب...
به کانال تلگرام سایت ما بپیوندید