آموزش زبان با داستان انگلیسی
 
پایان نامه ارایه مدلی برای تعمیرات پیشگویانه تجهیزات درکارخانه های نفتی با تکنیکهای داده کاوی

دانشکده آموزشهای الکترونیکی مهندسی فناوری اطلاعات(گرایش مدیریت سیستمهای اطلاعاتی)

عنوان: ارایه مدلی برای تعمیرات پیشگویانه تجهیزات درکارخانه های نفتی با تکنیکهای داده کاوی، مطالعه موردی: شرکت بهره برداری نفت و گاز گچساران

تعداد صفحات : 145

چکیده:

کارخانه ها و تاسیسات هر روزه با چالشها و مشکلات بیشتری برای افزایش بهره وری و کاهش هزینه ها مواجه می شوند و در این راستا استراتژی های نگهداری و تعمیرات نقش بسزایی دررسیدن به این هدف دارند.در سالهای اخیر تلاشهای فراوانی شده است تا بتوان با کمک سیستمهای فناوری اطلاعات انواع روشهای نگهداری و تعمیرات را به طرز موثری پیاده سازی و اجرایی نمود. نگهداری و تعمیرات پیشگویانه یکی از استراتژی‌های نگهداری و تعمیرات است که بر مبنای آن در بازه‌های زمانی معین تعدادی از پارامترهای تجهیرات اندازه‌گیری می‌شود و بر اساس این داده‌ها، زمان رخداد خرابی احتمالی آینده پیش بینی شده و برای تعمیر و یا تعویض قطعات و تجهیزات تصمیم‌گیری می‌شود.

در این مقاله سعی شده است یک مدل پشتیبان تصمیم گیر برای نگهداری و تعمیرات پیشگویانه مبتنی بر شرایط بر اساس تکنیکهای داده کاوی طراحی شود. این پروژه در یکی از شرکتهای بهره برداری نفت و گاز جنوب کشور انجام شده و تجهیز انتخابی برای این پروژه توربین می باشد که یکی از اساسی ترین و بحرانی ترین تجهیزات در کارخانه های نفتی است.

در این پروژه چندین تکنیک داده کاوی از جمله درخت تصمیم وشبکه های عصبی برای پیش بینی رخداد خرابی مورد استفاده قرار گرفت و با مقایسه خروجی و نتایج آنها و با آنالیز این خروجی ها سعی شد بهترین مدل برای پیش بین رخداد خرابی در تجهیز مورد نظر مشخص شود.در انتها پیشنهادهایی از جمله توسعه این مدل برای سایر تجهیزات، کنترل مدت زمان مشاهده وضعیت تجهیزات و تعیین زمان بهینه تعمیر و نگهداری برای آینده ارائه شده است.

فصل اول

1- مقدمه و طرح مسئله

1-1- مقدمه

در عصر حاضر و در حالی که کارخانجات صنعتی بزرگ به دنبال ایجاد تغییرات در درون خود هستند تا بتوانند در رقابت با سایر رقبای خود در تحولات جهانی شدن موفق گردند این بحث نگهداری و تعمیرات است که بطور جدی و موثر مسیر استراتژی تولید را در کارخانه های صنعتی مشخص می نماید.امروزه ،کارخانه های صنعتی به شدت درگیر مباحثی همچون کاهش هزینه ها ،توان رقابت بالا ، بهبود مستمر،بحران انرژی و افزایش کیفیت و کمیت محصولات هستند که در این راستا اندیشیدن پیرامون نگهداری و تعمیرات به عنوان یک امر استراتژیک جهت رسیدن به اهداف فوق بسیار مهم و انکارناپذیر جلوه می کند.همواره رقابت ، عامل فشار بر کارخانجات تولیدی بوده است. به منظور کنترل و مدیریت این فشار، کارخانجات تولیدی می بایست ضمن کاهش هزینه ها، کیفیت و راندمان محصولات خود را افزایش داده و انعطاف پذیر نیز باشند[1, 2] .با توسعه فناوری اطلاعات میزان و سرعت دسترسی به اطلاعات بطور فوق العاده ای افزایش یافته است.از طرفی پیشرفت تکنولوژی نیز منجر به افزایش دستیابی موسسات و سازمانها به منابع وسیع اطلاعاتی شده وامکان تحقیق وبررسی موضوعات مختلف را برای سازمانها فراهم نموده است[3]. بنابراین نکته قابل توجه در سناریو جدید پیرامون مدیریت نگهداری و تعمیرات، آماده و در دسترس نگهداشتن تجهیرات در زمان نیاز است.یک کارخانه بسیار بزرگ با چندین هزار دستگاه متنوع از پیچیدگی بالایی در فعالیت نگهداری و تعمیرات(نت) برخوردار است. تصمیم گیری پیرامون استراتژی نت نیازمند دانشی است که منطبق بر واقعیت سازمان باشد.از طرف دیگر کسب دانش مفید نیازمند استفاده و تحلیل صحیح از داده ها می باشد.لذا استفاده از داده ها و اطلاعات و چگونگی کار با آنها در طول مراحل پیاده سازی استراتژی نگهداری و تعمیرات از جایگاه ویژه ای برخوردار است [4, 5].

2-1- تشریح و بیان مسأله

آنچه در سالهای اخیر توجه مدیران صنایع مختلف را در دنیای رقابتی امروز به خود جلب کرده است ، کاهش هزینه های تولید و در نتیجه کاهش قیمت نهایی محصولات است. در این میان هزینه های تعمیراتی ، مهمترین هزینه قابل کنترل در صنایع است و طبیعی است که کاهش آن در دستور کار مدیران صنعت قرار گیرد . یکی از مهمترین ابزارهایی که برای نیل به این هدف در اختیار مسئولین قرار دارد استفاده از روشهای نوین نگهداری و تعمیرات بر اساس پایش وضعیت دستگاهها است که بخصوص در صنایع تولید مداوم ، نظیر نفت ،گاز و پتروشیمی از اهمیت ویژه ای برخوردار است. فلسفه وجودی روشهای تعمیراتی از قبیل نگهداری و تعمیرات پیشگیرانه1 و نگهداری و تعمیرات پیشگویانه2 ارائه راهکارهایی جهت کاهش هزینه های تعمیراتی و در نتیجه افزایش بهره وری واحد های تولیدی است[6].

عموما نگهداری و تعمیرات یا در زمان های مشخص و از قبل تعیین شده انجام می شود یا اینکه هر وقت خرابی رخ داد بسته به نوع خرابی تعمیر مرود نظر انجام می شود.اگرچه انجام تعمیرات پیشگیرانه می تواند تعمیرات ناگهانی و غیرمترقبه را کاهش دهد اما همچنان باعث کاهش دردسترس بودن و افزایش هرینه های تعمیرات می گردد. گاهی تعمیرات پیشگیرانه روی تجهیز انجام می شود درحالیکه تجهیز به خوبی کار می کند و نیازی به تعمیر و توقف ندارد اما چون نگهداری از قبل در بازه زمانی خاصی برنامه ریزی شده است بایستی طبق روال خود انجام شود.یک سیاست مناسب در نگهداری و تعمیرات می گوید تعمیر زمانی باید انجام شود که نیاز باشد[6].

پیشرفت تکنولوژی باعث افزایش پیچیدگی در هر دوصنعت ماشین آلات و سیستمهای تولید شده است.صنایع مدرن دایما به کار کردن با قابلیت اطمینان بالا ، ریسک محیطی پایین و امنیت افراد که در حال انجام فرایندهای خود با بیشترین بازدهی هستند وابسته است.بنابراین پیشگیری از شکست و تشخیص سریع و ابتدایی مشکلات سیستمها و ماشین ها عمر کارکرد ماشین آلات صنعتی را افزایش می دهد[7].

کارخانجات صنعتی نباید دیگر تصور کنند که خرابی های تجهیزات تنها پس از مدت زمان ثابتی که در حال کار هستند اتفاق می افتد.آنها باید استراتژی های نگهداری آنلاین و پیشگویانه را گسترش دهند که بتوانند تصور کنند که هر خرابی در هر زمانی ممکن است بطور تصادفی رخ دهد.آغاز خرابی و شکست تجهیزات ممکن است خود را در داده های بوجود آمده از روشهای مختلف آشکار سازد.تجهیزات علایم و نشانه هایی از خود بروز می دهند که می گویند این تجهیزات باید تعمیر یا جایگزین شوند و یا رها شوند تا به کار خود ادامه دهند[8].

تشخیص اشتباه و عیب در مراحل اولیه آسیب برای جلوگیری از نقص و عیب فنی در طول کارکرد و عملیات لازم است.این مساله سود قابل توجهی را در رسیدن به استفاده از تکنیکهای بهینه سازی در عملیات واحد صنعتی با بهبود استفاده از منابع در سطوح مختلف از فرایند تصمیم گیری بر می گرداند.فرضیه نگهداری شرطی یک مشاهده منظم از شرایط واقعی از تجهیزات بر اساس ویژگی های مهم و برجسته و موثر آنها و کارایی عملکرد از سیستمهای فرایندی است که باعث اطمینان از حداکثر کردن فاصله بین تعمیرها ، کاهش هزینه تعمیرات برنامه ریزی نشده ناشی ازخرابی ماشین آلات و بهبود دسترسی جامع از عملکرد واحد های صنعتی خواهد بود.یکی از مهمترین و به صرفه ترین تکنیکهای موثر نگهداری ، نگهداری مبتنی بر شرایط(CBM)1 است[8].

1Condition Based Maintenance

استفاده از نگهداری و تعمیرات پیشگویانه یا همان نگهداری مبتنی بر شرایطباعث رسیدن به پیشرفتهای بزرگی در هزینه های نگهداری و تعمیرات ، کاهش خرابیهای برنامه ریزی نشده ماشین آلات1 ، کاهش زمان ازکارافتادگی(بیکاری) ناشی از تعمیر2 تجهیزات و بهبود موجودی قطعات یدکی می شود[7].

نگهداری پیشگویانه  یکی از استراتژی‌های نگهداری و تعمیرات است که بر مبنای آن در بازه‌های زمانی معین و یا بصورت مستمر تعدادی از پارامترهای تجهیرات اندازه‌گیری می‌شود و بر اساس این داده‌ها برای تعمیر و یا تعویض قطعات و تجهیزات تصمیم‌گیری می‌شود.

1-3- هدف از انتخاب موضوع

هدف از اجرای برنامه نگهداری و تعمیرات پیشگویانه شناسایی و تشخیص عیوب تجهیزات از بدو پیدایش و برنامه ریزی به موقع جهت انجام اقدامات اصلاحی است.

روش نگهداری و تعمیر پیشگویانه بر این اصل استوار است که دستگاهی را که با شرایط مطلوب در حال کارکرد است نباید برای تعمیر باز کرد. در این روش تلاش می شود با استفاده از تکنیکهای مناسب هر دستگاه نظیر لرزه نگاری3 ، ترموگرافی4 ، صوت سنجی5 ، آنالیز روغن6 و سایر تکنیکها ضمن رسیدن به حد اکثر بهره وری ، دستگاه فقط هنگام نیاز به تعمیر باز شود و همچنین با اعمال تعمیرات کوچک و به موقع ، نظیر هم محوری و بالانس ، از نتایج زیانبار خرابی های ثانویه که معلول مشکلات کوچک هستند پیشگیری شود.[9]

در این روش عمر قسمتهای مهم بر اساس تعمیرات پیشگیرانه و سایر داده های تاریخی قبلی1 ، تعمیرات و بازرسی ها محاسبه شده و بر اساس آن بصورت منظم فعالیت تعمیرات انجام می شود.

تعمیرات پیشگویانه یک روش تعمیرات مبتنی بر شرط است که در این روش پارامترها و ویژگی های مهم تجهیز و دستگاه بصورت طبیعی محاسبه می گردد و مقادیر بدست آمده به عنوان مبنا در نظر گرفته می شوند، سپس در هنگام استفاده و بکارگیری تجهیز این پارامترها و ویژگی ها بصورت مستمر و مرتب سنجیده شده و با مقایسه با میزان مبنا، زمان خرابی ، علت آن و احتمال وقوع آن محاسبه می شود[7].

اساس و ذات پیش بینی عیب و نقص، برآورد و تخمین زمان باقیمانده از عمر تجهیز در دوره های معنی داری است که می خواهد به سمت یک فرایند تصمیم گیری نگهداری و تعمیرات عمیق و هوشمند هدایت شود[9].

پیش بینی ها به عنوان یک ویژگی اضافه بر امکانات تشخیص عیب نمایش داده می شوند.آنها سلامت و بهبودی جاری یک سیستم را ارزیابی می کنند و میزان زمان از باقیمانده عمر تجهیز را پیش بینی می کنند.پیش بینی ها برای بهبود امنیت ، برنامه ریزی ماموریتهای موفق ، نگهداری های برنامه ریزی شده و کاهش هزینه های نگهداری و زمان بیکاری حیاتی هستند .تکنیکهای نگهداری مبتنی بر شرط یک ارزیابی از شرایط سیستم بر اساس داده های جمع آوری شده از سیستم با مشاهده مستمر را فراهم می کنند[7].

هدف مشخص کردن زودتر برنامه نگهداری مورد نیاز برای هر خرابی پیش بینی شده است.بنابراین استراتژی های نگهداری برای کمینه کردن هزینه با بهبود ایمنی عملیات و تعداد خرابی های سیستم در حال کار کمک می کند.

 

ادامه مطلب...
پایان نامه استفاده از داده کاوی در پیش‌بینی خطای نرم‌افزار بر اساس متریک‌های کد و وابستگی

پایان‌نامه کارشناسی ارشد در رشته مهندسی فناوری اطلاعات (تجارت الکترونیک)

عنوان:استفاده از داده کاوی در پیش‌بینی خطای نرم‌افزار بر اساس متریک‌های کد و وابستگی

تعداد صفحات : 83

چکیده:

تضمین کیفیت نرم‌افزار همیشه دارای محدودیت‌های زمان و هزینه بوده است. به منظور رسیدن به کیفیت بالا و کاهش محدودیت‌ها، مدیران همواره سعی کرده‌اند تا بخش‌های مستعد خطا را در نرم‌افزار پیش‌بینی نمایند و منابع مذکور را به صورت موثری به این بخش‌ها اختصاص دهند. پیش از این، محققین روش‌های خودکاری را برای کمک به مدیران در این امر مهم معرفی و از آن‌ها استفاده کرده‌اند. روش‌های خودکار مذکور با استفاده از اندازه گیری معیارهای مختلف نرم‌افزار و یافتن ارتباط میان این معیارها و خطاهای نرم‌افزاری، همواره سعی در افزایش سرعت و دقت در پیش‌بینی خطا داشته‌اند. به نوعی می‌توان این معیارها را در چهار دسته که عبارتند از معیارهای پیچیدگی، داده‌های تاریخی، معیارهای طراحی و معیارهای وابستگی، قرار داد. اگرچه معیارهای استفاده شده، تا حدودی موثر هستند اما هنوز هیچکدام موفق به پیش‌بینی تمامی خطاهای موجود نشده‌اند. در این رساله، ما با توسعه دادن مفهوم وابستگی در نرم‌افزار، به معرفی مفهوم جدیدی به نام درخت وابستگی می‌پردازیم. این مفهوم به ما کمک می‌کند تا با در نظر گرفتن تمامی وابستگی‌های مستقیم و غیر مستقیم در بین اجزای نرم‌افزار، معیارهای جدیدی را استخراج نماییم که این معیارها می‌توانند عملاً نتایج مطلوب‌تری را نسبت به معیارهای پیشین، در پیش‌بینی خطا ارائه دهند.

1- مقدمه

یکی چالش بر انگیزترین موضوعات مطرح در تضمین کیفیت، در شرکت‌های سازنده نرم افزار، موضوع رفع خطاهای نرم افزار است. خطاهای نرم افزاری می‌توانند در زمان پیش و یا پس از انتشار نرم افزار تشخیص داده شوند. اما منابعی که می‌توان برای تشخیص و تصحیح خطاها در نظر گرفت محدود است (Kamyabi et al.).

خطاها را می‌توان به دو دسته کلی تقسیم کرد. خطاهای نحوی و خطاهای مفهومی. با توجه به‌این که ابزارهای خودکار بسیار قدرتمندی برای تشخیص خطاهای نحوی وجود دارند، احتمال‌این که خطایی ازاین دست تا زمان انتشار تشخیص داده نشود، بسیار کم است. خطاهای مفهومی به آن دسته از خطاها اشاره دارد که در اثر مشکلاتی جدای از اشتباهات نحوی و خطاهای انسانی ملموس اتفاق می‌افتند و معمولاً در اثر عدم هماهنگی در بخش‌های مختلف کد و گاهی به صورت بسیار ناملموس به وجود می‌آیند که در اینجا به سادگی نمی‌توان با بررسی کد، این‌گونه خطاها را تشخیص داد. بنا بر این در مورد خطاهای مفهومی داستان فرق می‌کند چرا که عوامل بسیار زیادی می‌توانند در بروزاین‌گونه از خطاها دخیل باشند. (Zimmermann & Nagappan, 2008) بنا براین همواره سعی شده است که با اندازه گیری معیارهای مختلف و استفاده از آن‌ها در روش‌های پیش‌بینی خودکار خطا، سرعت و دقت را در امر تست نرم افزار افزایش دهند. طی تحقیقاتی که تا کنون صورت گرفته، متداول‌ترین معیارهای استفاده شده در پیش‌بینی اتوماتیک خطا، معیارهای پیچیدگی است. (Zimmermann & Nagappan, 2008) اما جدیدترین روشی که مطرح شده است، مسأله مربوط به وابستگی‌های بین کلاس‌ها و همچنین بین ماژول‌ها می‌باشد. انواع وابستگی‌ها می‌توانند بین دو کلاس و یا دو ماژول مطرح شوند که تحقیقات نشان داده است که این وابستگی‌ها ارتباط بسیار زیادی با وجود خطاهای مفهومی دارند.

برای اجرای روشمند و علمی روند یافتن روابط و الگوهای مناسب برای پیش بینی خطا بر اساس معیارهای قابل اندازه گیری، از مفهومی به نام داده‌کاوی استفاده خواهیم کرد که در تشریح و بیان مسأله به آن خواهیم پرداخت.

دراین پایان نامه، سعی می‌کنیم که به بررسی چنین وابستگی‌هایی بپردازیم و بر اساس روابط موجود بین وابستگی و وجود خطا در نرم افزار، وجود خطا در کد را پیش بینی نماییم.

در ادامه این رساله در بخش دوم به بررسی تحقیقات قبلی انجام شده در این زمینه می‌پردازیم، در بخش سوم به بیان انگیزش و نحوه به وجود آمدن ایده کار شده در این رساله می‌پردازیم، در بخش چهارم فرضیات مورد بررسی را مطرح می‌کنیم، در بخش پنجم داده‌ها و ابزارهای جمع آوری شده برای انجام عملی آزمایشات را معرفی می‌کنیم، در بخش ششم به بیان شیوه و نوع آزمایشات و بیان نتایج آنالیزها و نتایج می‌پردازیم و در بخش هفتم و پایانی این رساله سعی در نتیجه‌گیری از آزمایشات انجام شده خواهیم داشت.

2- پیشینه پژوهشی:

تلاش‌های گذشته با هدف پیش‌بینی خطا را در سه گروه مورد بررسی قرار می‌دهیم: معیارهای نرم‌افزار، معیارهای وابستگی و معیارهای تاریخی. ابتدا به بیان توضیحی در مورد شیوه کار کردن این معیارها می‌پردازیم.

2-1- معیارهای نرم‌افزار:

معیارهای نرم‌افزار برای اندازه‌گیری درجه پیشرفته بودن یک محصول و یا یک فرآیند نرم‌افزاری به کار می‌روند. معیارهای نرم‌افزاری به چندین گروه تقسیم می‌شوند: معیارهای محصول، معیارهای فرآیند، معیارهای پروژه و معیارهای منبع. معیارهای نرم‌افزاری که در پیش‌بینی خطا به کار می‌روند معیارهای محصول می‌باشند که از مشخصات کد سیستم نرم‌افزاری استخراج می‌شوند. این معیارها به سه گروه تقسیم می‌شوند: معیارهای اندازه، معیارهای پیچیدگی و معیارهای کیفیت. (Mills, 1988) معیارهای اندازه بر اساس تعداد خطوط کد برنامه محاسبه می‌شوند مانند تعداد کل خطوط برنامه، تعداد خطوط توضیحات و … معیارهای میزان نگهداشت‌پذیری و قابلیت تست برنامه وابسته است از جمله معروف‌ترین معیارهای پیچیدگی معیارهای پیچیدگی مک کیب و معیارهای هالستد می‌باشند. معیارهای مک‌کیب پیچیدگی کد را بر اساس تعداد مسیرهای کنترلی محاسبه می‌نماید. (McCabe, 1976) هالستد معیارهای خود را بر اساس ارتباطات ریاضی بین اجزای کد، پیچیدگی کد و نوع زبان برنامه نویسی مطرح کرد. (Halstead M. H., 1975) معیارهای اتصال و پیوستگی از معروف‌ترین معیارهای کیفیت می‌باشند که بالا و یا پایین بودن اندازه این دو معیار نشان دهنده کیفیت محصول و یا فرآیند نرم‌افزاری است. (Pressman, 1982) معیارهای کیفیت معیارهایی میباشند که درجه آن‌ها می‌تواند تولیدکنندگان نرم‌افزار را در مورد توانایی دست کار کردن سیستم‌شان مطمئن سازد.

2-2- معیارهای وابستگی:

معیارهای وابستگی معیارهایی هستند که بر اساس ارتباط اجزای کد نرم‌افزار محاسبه می‌شوند. این ارتباط می‌تواند بین سطوح مختلف کد مطرح شود مانند سطح فایل، کلاس، تابع … نوع ارتباط و یا به عبارت دیگر وابستگی موجود بین اجزای کد نیز می‌تواند متفاوت باشد مانند وابستگی داده که بر اساس تعریف و استفاده از داده می‌باشد و یا وابستگی صدا زدن که بر اساس تعریف و صدا زدن مؤلفه‌ها می‌باشد. (Zimmermann, 2008 & Nagappan )

2-3- معیارهای تاریخی:

این دسته از معیارهای بر اساس تغییراتی که در بین چندین انتشار مختلف از یک سیستم نرم‌افزاری رخ می‌دهد تعریف می‌شوند. این تغییرات می‌توانند اضافه شدن، حذف شدن، تغییر یافتن مؤلفه‌های جز مربوطه در بین چندین انتشار باشند. محدودیتی که در به کار بردن این معیارها وجود دارد این است که محاسبه این معیارهای تنها برای محصولات نرم‌افزاری مقدور می‌باشد که دارای چندین انتشار باشند و همچنین اطلاعات کامل در مورد انتشارات قبلی موجود باشد.

 

 

ادامه مطلب...
دانلود پایان نامه مروری بر داده کاوی با رویکرد وب سرویس کاوی

سمینار برای دریافت درجه کارشناسی ارشد “M.Sc” مهندسی کامپیوتر – نرم افزار
عنوان :مروری بر داده کاوی با رویکرد وب سرویس کاوی

تعداد صفحات : 138

 

چکیده
واژه داده کاوی برای توصیف مجموعه فعالیتهای وسیعی مورد استفاده قرار می گیرد. دنیای مدرون امروز، دنیای اطلاعات است و ما با حجم بسیار وسیعی از داده ها سرکار داریم. برای رسیدن به اطلاعات باید این داده ها تحلیل و پردازش شوند تا اطلاعات از آنها استخراج شود .
توسعه سریع و افزایش قابلیتهای و کاهش هزینه های ذخیره سازی منجر به ذخیره بسیار وسیع داده با هزینه
ذخیره سازی پائینی شده است. وجود داده های زیادی بر روی وب سایتها، پایگاه داده ها، مالتی مدیا، وب سرویسها و … اخیرا استفاده از داده کاوی را از این منابع مد نظر قرار داده است. کاوش اطلاعات مفید که دانش
مناسب را از پایگاه داده های وسیع استخراج می کند، به یکی از زمینه های مهم تحقیقاتی تبدیل شده است .
وب کاوی یکی از زمینه های مهم تحقیقاتی در زمینه داده کاوی برای تعداد وسیعی از سرویسهای وب جهان گستر در سالهای اخیر تبدیل شده است. وب جهان گستر بصورت گسترده ای هم در زمینه ترافیک و هم در زمینه اندازه و پیچیدگی وب سایتها در حال گسترش است. این پیچیدگی، نیاز ما را به تحلیل استفاده وب سایت، چگونگی ساختار وب و محتوای منابع وب وادار ساخته است .
تکنولوژی وب سرویس باعث افزایش نقش وب سرویسها در برنامه های اینترنتی بطور کلی و در زمینه تجاری به طور خاص شده است. از زمانی که وب سرویسها نقش مهم و فزاینده ای در تکنولوژی اطلاعات پیدا کرده اند، از سیستمهای سرویسگرا انتظار رشد و پیچیدگی روزافرون می رود. مانند تقاضای سیستمهای برای ابزارهای که اجازه تحلیل و نظارت بر سیستمهای سرویسگرا استفاده شده را می دهند .
روشهای مختلفی برای داده کاوی و فرایند کاوی از وب سرویسها و تعاملات بین آنها برای تحلیل تعاملات وب سرویسها بین استفاده کننده گان و مهیا کننده گان و کشف ترکیب سرویهاست وجود دارد.

مقدمه
اخیرا توانایی های فنی بشر در تولید و جمع آوری دادهها به سرعت افزایش یافته است عواملی نظیر استفاده گسترده از کامپیوتر در کسب و کار، علوم، خدمات دولتی و پیشرفت در وسائل جمع آوری داده، از اسکن کردن متون و تصاویر تا سیستمهای سنجش از دور ماهواره ای، در این تغییرات نقش مهمی داشته اند.
حجم بسیار بالای سایتهای طراحی شده و موجود در بستر وب؛ تنوع و حجم بالای اطلاعات موجود در آنها، تکنیکها و توزیع شدگی منابع به معظلی بزرگ در استفاده از این منابع تبدیل شده است. در واقع مشکل از آنجائی ناشی می شود که منابع به اندازه کافی موجود است، ولی بصورت خام و پخش شده در رسانه های مختلف و با حجم زیاد. مشکل اصلی دربدست آوردن دانش موجود در آنها و اینکه دانش مورد نیاز ما در چه منابعی و به چه صورتی واقع شده است؛ می باشد .
این رشد انفجاری در دادههای ذخیره شده، نیاز مبرم به وجود تکنولوژی های جدید و ابزارهای خودکاری را ایجاد کرده که به صورت هوشمند به انسان یاری رسانند تا این حجم زیاد داده را به اطلاعات و دانش تبدیل کند: داده کاوی به عنوان یک راه حل برای این مسائل مطرح می شود.
بطورغیر رسمی داده کاوی فرآیندی است، خودکار برای استخراج الگوهایی که دانش را بازنمایی می کنند، که این دانش به صورت ضمنی در پایگاه داده های عظیم، انباره داده1، صفحات وب، منابع توزیع شده و دیگر مخازن بزرگ اطلاعات، ذخیره شده است. داده کاوی تکنیکی است که بطور همزمان از چندین رشته علمی نظیر: تکنولوژی پایگاه داده، هوش مصنوعی، یادگیری ماشین، شبکه های عصبی، آمار، شناسایی الگو، سیستم های مبتنی بر دانش2، حصول دانش3، بازیابی اطلاعات4، محاسبات سرعت بالا5 و بازنمایی بصری داده 6 بهره می برد.

داده کاوی در اواخر دهه 1980 پدیدار گشته، در دهه 1990 گامهای بلندی در این شاخه از علم برداشته شد و انتظار می رود در این قرن به رشد و پیشرفت خود ادامه دهد.
کشف دانش از منابع داده فرایند شناسایی درست، ساده، مفید، و نهایتا الگوها و مدلهای قابل فهم در داده ها می باشد. داده کاوی، مرحله ای از فرایند کشف دانش می باشد و شامل الگوریتمهای مخصوص داده کاوی است، بطوریکه، تحت محدودیتهای مؤثر محاسباتی قابل قبول، الگوها و یا مدلها را در داده کشف می کند. به بیان ساده تر، داده کاوی به فرایند استخراج دانش ناشناخته، درست، و بالقوه مفید از داده اطلاق می شود.
تعریف دیگر اینست که، داده کاوی گونه ای از تکنیکها برای شناسایی اطلاعات و یا دانش تصمیم گیری از قطعات داده می باشد، به نحوی که با استخراج آنها، در حوزه های تصمیم گیری، پیش بینی، پیشگویی، و تخمین مورد استفاده قرار گیرند. داده ها اغلب حجیم ، اما بدون ارزش می باشند، داده به تنهایی قابل استفاده نیست، بلکه دانش نهفته در داده ها قابل استفاده می باشد. به این دلیل اغلب به داده کاوی، تحلیل داده ای ثانویه7 . گفته می شود
داده کاوی از منابع توزیع شده متفاوت تر از داده کاوی از منایع متمرکز است. مشکل داده کاوی از منابع توزیع شده (مانند وب) در محتویات غیر ساخت یافته و یا شبه ساخت یافته این منابع است. منابع توزیع شده، برخلاف منابع متمرکز، دارای یک ساختار استاندارد مناسب نیستند و از سبک و شیوه نگارشی متنوع محتوائی نسبت به آنچه که در مجموعه منابع متمرکز وجود دارد، پیروی می کنند .
فصل اول این سمیناریک مرور سریع بر معرفی داده کاوی؛ مدلها و روشهای موجود در آن پرداخته است، فصل دوم مدل ها و الگوریتم های داده کاوی به صورت اجمالی برسی شده؛ در فصل سوم مدل وب کاوی مطرح شده است در این فصل تکنیکها و الگوریتمهای مختلف وب کاوی برسی شده است، در این بخش الگوریتمهای داده کاوی از وب نیز معرفی شده است در فصل چهارم وب سرویس و معماری وب سرویس و XML و چگونگی داده کاوی از وب سرویسها مطرح شده است. در فصل چهارم یکسری ایده ها و سوالاتی در رابطه با وب سرویس کاوی مطرح شده است.

ادامه مطلب...
دانلود پایان نامه نقش داده کاوی در تجارت الکترونیک

مشخصات مقاله:

عنوان : کاربرد داده کاوی در تجارت الکترونیک
فرمت فایل: WORD (قابل ویرایش)
تعداد صفحات: ۱۵۱

چکیده ای از مقدمه آغازین ”  پایان نامه نقش داده کاوی در تجارت الکترونیک ” بدین شرح است:

 

از هنگامی که رایانه در تحلیل و ذخیره سازی داده ها بکار رفت (۱۹۵۰) پس از حدود ۲۰ سال، حجم داده ها در پایگاه داده ها دو برابر شد. ولی پس از گذشت دو دهه و همزمان با پیشرفت فن آوری اطلاعات(IT)  هر دو سال یکبار حجم داده ها، دو برابر شده و همچنین تعداد پایگاه داده ها با سرعت بیشتری رشد نمود. این در حالی است که تعداد متخصصین تحلیل داده ها با این سرعت رشد نکرد. حتی اگر چنین امری اتفاق می افتاد، بسیاری از پایگاه  داده ها چنان گسترش یافته‌اند که شامل چندصد میلیون یا چندصد میلیارد رکورد ثبت شده هستند.
امکان تحلیل و استخراج اطلاعات با روش های معمول آماری از دل انبوه داده ها مستلزم چند روز کار با رایانه های موجود است.[۳]حال با وجود سیستم های یکپارچه اطلاعاتی، سیستم های یکپارچه بانکی و تجارت الکترونیک، لحظه به لحظه به حجم داده ها در پایگاه داده های مربوط اضافه شده و باعث به وجود آمدن حانبارهای عظیمی از داده ها شده است.
ادامه مطلب...
ارائه مدلی برای شناسایی عوامل اثرگذار و ضریب تاثیر آنها در سود و زیان بیمه شخص ثالث خودرو شرکتهای ب

دانلود متن کامل پایان نامه مقطع کارشناسی ارشد رشته مهندسی کامپیوتر

گرایش : نرم افزار

عنوان : ارائه مدلی برای شناسایی عوامل اثرگذار و ضریب تاثیر آنها در سود و زیان بیمه شخص ثالث خودرو شرکتهای بیمه بوسیله روشهای داده کاوی مطالعه موردی شرکت سهامی بیمه ایران

تعداد صفحات : 106

چکیده

بررسی اطلاعات بیمه های اتومبیل نشان داده عواملی چون نوع استفاده خودرو، داشتن گواهینامه رانندگی، نوع گواهینامه و تطابق یا عدم تطابق آن با وسیله نقلیه، مبلغ حق بیمه، میزان تعهدات بیمه نامه، کیفیت خودروی خودرو سازان، سن راننده، سواد راننده، عدم تطابق حق بیمه با مورد بیمه، تاخیردرتمدید بیمه نامه، در سود و زیان شرکت های بیمه تاثیر داشته اند.

هدف این پایان نامه شناخت عوامل اثرگذار و ضریب تاثیر آنها در سود و زیان بیمه شخص ثالث خودرو شرکت های بیمه با استفاده از روش داده کاوی و  سپس انتخاب الگوریتمی که بهترین میزان دقت پیش بینی برای تشخیص این عوامل را داشته اند می باشد.

نتیجه حاصل از این پژوهش نشان می دهد که روشهای داده کاوی با استفاده از الگوریتم های دسته بندی با دقت بالای 91% و الگوریتم های درخت تصمیم با دقت بالای 96% و الگوریتم های خوشه بندی با ایجاد خوشه های قابل قبول  قادر به ارائه مدلی برای تشخیص عوامل اثرگذار و تعیین میزان اثر آنها در سود و زیان بیمه نامه شخص ثالث خودرو خواهند بود.

ادامه مطلب...
 دانلود متن کامل پایان نامه داده کاوی پویا با استفاده از عامل

 دانلود متن کامل پایان نامه داده کاوی پویا با استفاده از عامل

پایان­­ نامه کارشناسی رشته مهندسی کامپیوتر گرایش نرم ­افزار

 تعداد صفحات : 157

چکیده

امروزه با توجه به گسترش روز افزون اطلاعاتی که بشر با آنها سر و کار دارد، بهره ­گیری از روشهایی همچون داده ­کاوی برای استخراج دانش و اطلاعات نهفته در داده­ها، امری غیرقابل اجتناب می­باشد. بدلیل حجم بسیار بالای داده­ ها در بسیاری از کاربردها و اهمیت بیشتر داده­ های جدید، ذخیره ­سازی این داده ­ها امری مقرون به صرفه نیست، لذا داده ­هایی که باید مورد پردازش قرار گیرند، همواره بصوت پویا در حال تغییر و تحول هستند. مساله دیگری که امروزه در بحث داده ­کاوی وجود دارد، بحث توزیع شدگی ذاتی داده­ها است. معمولا پایگاه هایی که این داده­ ها را ایجاد یا دریافت می­کنند، متعلق به افراد حقیقی یا حقوقی هستند که هر کدام بدنبال اهداف و منافع خود می­باشند و حاضر نیستند دانش خود را بطور رایگان در اختیار دیگران قرار دهند.

با توجه به قابلیتهای عامل و سیستمهای چندعامله و مناسب بودن آنها برای محیطهای پویا و توزیع شده بنظر می­رسد که بتوان از قابلیت های آنها برای داده­کاوی در محیطهای پویا و محیطهای توزیع شده بهره برد. اکثر کارهایی که تاکنون در زمینه بهره­گیری از عامل و سیستمهای چندعامله انجام شده است خصوصیتهایی همانند خودآغازی و بخصوص متحرک بودن عاملها را مورد بررسی قرار داده است و در آنها مواردی همچون هوشمندی، یادگیری، قابلیت استدلال، هدف گرایی و قابلیت های اجتماعی عاملها مورد بررسی قرار نگرفته است. در این تحقیق ما قصد داریم تا ضمن بررسی کارهای موجود در زمینه کاربرد عامل و سیستم های چندعامله در داده­کاوی، بحث طبقه­ بندی جریان داده­ها را در یک محیط پویا مورد بررسی قرار دهیم. ما مساله خود را در دو فاز مورد بررسی قرار خواهیم داد. در فاز اول خصوصیت های یک عامل تنها مورد بررسی قرار خواهد گرفت و در فاز دوم قابلیت های اجتماعی عاملها مانند مذاکره، دستیابی به توافق و … برای داده­ کاوی در یک محیط پویا و توزیع­ شده رقابتی مورد استفاده قرار خواهد گرفت. بطور کلی دستاوردهای اصلی این تحقیق عبارتند از

1) ارائه یک رویکرد مبتنی بر عامل برای مساله طبقه­ بندی جریان داده­ های دارای تغییر مفهوم و پویا با استفاده از قابلیتهای هدف گرایی، هوشمندی، یادگیری و استدلال

2) ارائه یک رویکرد مبتنی بر سیستمهای چندعامله برای طبقه­بندی جریان داده­های توزیع­شده در یک محیط رقابتی با استفاده از قابلیتهای اجتماعی عاملها و دستیابی به توافق.

نتایج حاصل از آزمایشات انجام شده در این پایان­ نامه نشان­ دهنده برتری استفاده از عاملها و سیستم های چندعامله برای بحث طبقه­ بندی و داده ­کاوی در محیطهای پویا و توزیع شده می­باشد.

ادامه مطلب...
دانلود پایان نامه جستجوی الگوهای نوظهور با ویژگی های جریانی

دانلود متن کامل پایان نامه مقطع کارشناسی ارشد رشته مهندسی کامپیوتر 

گرایش : هوش مصنوعی

عنوان : جستجوی الگوهای نوظهور با ویژگی های جریانی

تعداد صفحه :138

چکیده

استخراج الگوهای مفید از مجموعه داده ها، یکی از موضوعات چالش برانگیز در داده کاوی است. از طرفی در داده ها با ابعاد بالا، استخراج مجموعه کوچکی از الگوهای نوظهور با قابلیت پیش بینی قوی، از مسائل مهم در ایجاد یک کلاسه بند بر پایه الگوهای نوظهور است. در دنیای واقعی، ویژگی ها همیشه بطور کامل در دسترس نیستند؛ بر این اساس، مسئله سخت تر می شود وقتی که مجموعه ویژگی ها قبل از شروع فرآیند یادگیری ناشناخته باشد. ویژگی های جریانی عنوان ویژگی هایی است که بصورت برخط تولید می شوند و در همان زمان تولید پردازش می شوند. در این طرح، ویژگی ها یکی یکی به مرور زمان پدیدار می شوند بجای اینکه تمام ویژگی ها قبل از فرآیند یادگیری آماده باشند.

در این مطالعه، ما ساختار دینامیک از درخت الگوی مکرر پیشنهاد می دهیم تا درخت به محض ورود ویژگی های جدید ساخته شود و استخراج الگوهای نوظهور بصورت برخط صورت گیرد. DFP-SEPSF، یک روش موثر پایین به بالا ارائه می دهد تا یک درخت الگوی مکرر دینامیک نامرتب UDFP-tree و یک درخت الگوی مکرر دینامیک مرتب ODFP-tree بسازد. اولین روش ترتیب آیتم ها را در نظر نمی گیرد، در حالیکه دومین روش ترتیب آیتم ها را اعمال می کند.

بعلاوه، چارچوب پیشنهادی الگوهای نوظهور قوی را استخراج می کند تا یک کلاسه بند قوی و سریع ایجاد کند که می تواند با نویز مقابله کند.

روش پیشنهادی فضای جستجوی الگوهای نوظهور را بطور قابل توجهی کاهش می دهد و الگوهای نوظهور با قدرت تمایز قوی را با کمک حذف الگوهای بی فایده استخراج می کند.

روش ارائه شده الگوهای نوظهور را برای هر کلاس بصورت همزمان کشف می کند و بعلاوه، فرآیند تولید درخت های الگوی مکرر را بصورت کارایی در راستای کاهش محاسبات، هدایت می کند.

ارزیابی تجربیات ما بر روی محدوده وسیعی از داده ها، اثربخشی روش پیشنهادی را در مقایسه با دیگر روش های شناخته شده از نظر دقت پیش بینی، تعداد الگوهای استخراجی و زمان اجرا نشان می دهد.

ادامه مطلب...

این کتاب به عنوان مرجع داوری دهمین کنفرانس داده‌ کاوی صنعتی، ICDM 2010، درنظر گرفته شد. ۴۸ مقاله بررسی‌ شده موجود به همراه ۲ مقاله به‌ دقت بازبینی و انتخاب شده از بین ۱۷۵ مقاله ارسالی با یکدیگر ارائه شده‌ اند. مقالات در بخش های موضوعی و بر روی جنبه‌ های نظری داده کاوی، داده‌کاوی چند رسانه‌ای، داده‌کاوی در بازاریابی، داده‌کاوی در پردازش‌های صنعتی، داده‌کاوی در پزشکی، داده‌کاوی در کشاورزی، وب‌کاوی، داده‌کاوی در سرمایه‌گذاری، رویکردهای داده‌کاوی و داده‌کاوی برای نظارت بر عملکرد شبکه، مرتب و سازماندهی شده‌اند.

عنوان کتاب : Advances in Data Mining

نویسنده : Petra Perner

ناشر : Springer

سال انتشار : ۲۰۱۰

زبان کتاب : انگلیسی

تعداد صفحات : ۶۶۶

ساختار فایل : PDF

حجم فایل : ۱۲.۲ مگابایت

ادامه مطلب...