عنوان کامل پایان نامه :
تعیین اهداف جذب منابع با رویکرد منطق فازی و شبکه های عصبی در مؤسسات مالی و اعتباری
قسمتی از متن پایان نامه :
3-5- نحوه آماده سازی داده ها
برای اجرای مدلهای هوشمند نیاز است که در ابتدا دادههایی برای یادگیری مدل فراهم شود. تا با استفاده از این دادهها مدل آموزش داده شود و سپس مدل آموزشدیده در عمل بهکاررفته شود. درصورتیکه دادههایی که در این مرحله به دست میآید فاقد نویز و دارای کیفیت مطلوب باشد مرحله بعدی که فاز یادگیری مدل است بهخوبی انجام میشود و دقت مدل زیاد میشود، ولی درصورتیکه این مرحله بهدرستی انتخاب نشود فاز یادگیری ممکن است که اصلاً بهدرستی صورت نگیرد. کارهای پردازشی زیادی بر رویدادهها میتوان انجام داد که کیفیت دادهها به حد مطلوب برسد. برخی از مهمترین آنها را در ادامه نام میبریم(Kamber and Han 2011) (صنیعی آباده 1391).
3-5-1- جمع آوری داده ها و یکسان کردن داده ها
در این مرحله از آمادهسازی، باید دادهها را از منابع مختلف جمعآوری کرده و آنها را بهصورت یک فرم یکسان درآوریم. برای مثال اگر دادههای ما روی چندین سرور پراکندهشدهاند آنها را باید جمعآوری کرده و در یک سرور قرار داد.
3-5-2- پاکسازی داده ها
بعدازاینکه دادهها جمعآوری شدند باید آنها را ازلحاظ کیفیت بررسی کنیم و درصورتیکه مشکلاتی در آنها وجود داشته باشد آنها را پاکسازی کنیم. در مرحله پاکسازی باید به موارد زیر توجه داشته باشم.
الف – حذف نویز: هرگونه تغییر و تخریب غیرعمدی که ماهیت اصلی دادهها را از بین ببرد بهعنوان نویز شناخته میشود و باید آنها را از بین برد.
ب – نمونههای پرت: دادههایی هستند که مقادیر آنها در یک یا چند ویژگی با بقیه نمونهها دارای اختلاف فاحشی است. قرار دادن این نمونهها در مدلهای یادگیری میتواند مدل را دچار اشتباه کند. برای مثال اگر سن ورودی افرادی که در کنکور شرکت کردهاند را در نظر بگیریم و یک نفر در سن 90 سالگی در کنکور شرکت کرده باشد بهعنوان داده پرت شناخته میشود. باید توجه داشت که دادههای پرت را از دادههای نویز دار تشخیص داد. زیرا در بعضی موارد هدف پیدا کردن همین دادههای پرت میباشد.
ج – مقادیر مفقودشده: در برخی از رکوردها ممکن است مقادیر یک یا چند ویژگی به دلایلی وجود نداشته باشد، وجود مقادیر گمشده در دادهها به صورتهای مختلف میتواند شکل پذیرد. برای مثال ممکن است افراد از واردکردن سن و وزن خود اجتناب کنند.
برای رفع مقادیر مفقودشده روشهایی وجود دارد که عبارتاند از:
- حذف کردن: در این روش کل رکوردی که دارای مقدار مفقودشده در یک یا چند ویژگی است حذف میشود.
- تخمین زدن: در این روش مقادیر مفقودشده، با روشهای ابتکاری تخمین زده میشود. زمانی که ویژگیها باهم، همبستگی داشته باشد میتوانیم از این روش استفاده کنیم.
- نادیده گرفتن: رکوردهایی که حاوی ویژگیهای مفقودشده هستند، نادیده گرفته میشوند.
- جایگزین کردن: در این روش مقادیر مفقودشده با یک مقدار پر خواهد شد. برای دادههای کم و گرانبها میتوان از این روش استفاده کرد. میتوان از مقادیر تصادفی، مقادیر از قبل تعیینشده، میانگین مقادیر، تخمین از روی بقیه مقادیر استفاده کرد.
د – دادههای تکراری: دادههایی هستند که رکوردهای آنها بار اطلاعاتی جدیدی ندارد و اطلاعات در آنها تکرار زیادی دارد. این رکوردها باید از مجموعه دادهها حذف شوند.
سوالات یا اهداف پایان نامه :
اهداف:
هدف اصلی:
- استفاده از رویکرد شبکه عصبی فازی برای پیشبینی مانده منابع آتی در تعیین هدف جذب منابع برای شعبههای مؤسسات مالی و اعتباری.
هدف فرعی:
- تدوین الگوی مناسب برای پیشبینی دقیق منابع آتی و تعیین اهداف جذب منابع بر اساس آن،
- تعیین متغیرهای سری زمانی که بیشترین و یا کمترین تأثیر را در فرآیند پیشبینی تعیین هدف جذب منابع دارند.