
آموزش : داده های گمشده در SPSS
*** توضیحات نوشتار آموزشی (Missing Value) داده های گمشده در SPSS برگرفته شده از کتاب روش های پیشرفته آماری و کاربردهای آن – نوشته ابوالفضل قودجانی – نامزد کتاب سال ایران – انتشارات جامعهنگر***
داده های گمشده چیست؟
در یک بررسی و مطالعه بسیار اتفاق میافتد که مقادیر برخی از کمیتها اندازهگیری نشدهاند و یا قابل اندازهگیری و مشاهده نبودهاند. به عنوان مثال در یک پرسشنامه که از سوالشونده درخواست میشود اطلاعات شخصی خود را بیان کند، گاهی اوقات پاسخی به برخی از سوالات داده نمیشود. در اینگونه موارد با نتایجی تحت عنوان داده های گمشده روبهرو هستیم. در این نوشتار آموزشی میخواهیم با استفاده از نرمافزار SPSS روشهایی را برای جایگزین کردن برخی مقادیر خاص به جای Missing Value در SPSS بیان کنیم.
داده های گمشده خوب
به این نکته توجه کنید ما مقادیر متفاوت و مختلفی را میتوانیم به ازای داده های گمشده در یک تحقیق، قرار دهیم که به ماهیت و نوع تحقیق بستگی تمام دارد، ما با برخی از این مقادیر در ادامه آشنا خواهیم شد. با اینحال همواره توصیه نمیشود که به ازای داده های گمشدهی یک مطالعه، مقادیر مرتبط جایگزاری شود بلکه گاهی اوقات وجود این داده های گمشده و حجم آنها میتواند خود حامل موارد و اطلاعات مفیدی باشد.
مثال آموزشی جایگزاری داده های گمشده در SPSS
در یک تحقیق بر روی درآمد ۲۴ نفر از کارکنان یک موسسه دانشگاهی مشاهده شده است که ۷ نفر به سوال میزان درآمد ماهیانه خود پاسخ ندادهاند. نحوه ورود اطلاعات و داده های گمشده در SPSS آمده است. داده های گمشده در SPSS تحت عنوان Missing Values و با نقطه نشان داده میشوند.
در پی آن هستیم که بتوانیم به منظور ادامه تحلیلها، جایگزین مناسب عددی برای موارد عدم پاسخ و یا همان دادههای گمشدهی میزان درآمد بیابیم. برای این منظور از مسیر زیر استفاده میکنیم.
Transform → Replace Missing Values
در ابتدا کمیت (هایی) را که دارای مقادیر گمشده هستند و برخی از اطلاعات آنها در دسترس نمیباشد، انتخاب میکنیم. در کادر New Variables عبارت Revenue_1= SMEAN(Revenue) نشان داده میشود که به معنای آن است که کمیت جدیدی با عنوان Revenue_1 ایجاد میشود که در آن به جای مقادیر گمشده درآمد، میانگین دادههای موجود در کمیت درآمد را جایگزین میکند.
به این ترتیب در فایل دادهها و پنجره Data View کمیت جدیدی به صورت زیر ساخته میشود.
همانگونه که مشاهده میشود به ازای هر داده گمشده درآمد، مقدار ۳٫۷۲ که همان میانگین دادههای موجود میباشد، قرار داده شده است.
استفاده از چندین روش جایگزاری داده های گمشده در SPSS
در کادر Name and Method و در کادر متنی Name میتوانیم نام دیگری به جای Revenue_1 در کمیت جدید ساخته شده، قرار دهیم. به عنوان مثال ما نام MeanN را برگزیدهایم. چنانچه بر روی گزینهی Method کلیک کنیم، میتوانیم مقادیر خاص دیگری جهت جایگزینی با دادههای گمشده بیابیم.
با انتخاب گزینهی Series Mean میانگین کل دادههای موجود کمیت درآمد، جایگزین مقادیر گمشده خواهد شد. ما این انتخاب را در بالا انجام دادیم که مقدار ۳٫۷۲ جایگزین مقادیر گمشده قرار گرفت.
با انتخاب گزینهی Mean of nearby points میانگین دادههای چند خانه از بالا و پایین که در همسایگی داده گمشده قرار دارند، جایگزین مقدار گمشده خواهد شد. تعداد خانههای همسایگی را نیز میتوان با نوشتن یک عدد در کادر Number تعیین کرد. ما عدد ۲ را انتخاب کردهایم.
میدانید چرا پس از استفاده از این روش و در ردیف ۲۳ درآمد فرد همچنان به عنوان یک داده گمشده محسوب میشود؟ با انتخاب گزینهی Median of nearby points میانه دادههای چند خانه از بالا و پایین همسایگی داده گمشده، جایگزین آن خواهد شد. تعداد خانههای همسایگی را میتوان با نوشتن عدد در کادر Number تعیین کرد.
انتخاب گزینهی Linear interpolation سبب میشود که میانگین دو خانهای که قبل و بعد از داده گمشده قرار دارند، جایگزین خود داده گمشده شوند. ما نام ستون جدید براساس این روش را LinearI قرار دادهایم.
با انتخاب گزینهی Linear trend at point مقداری که از روند خطی دادههای موجود به دست میآید، به ازای Missing Value قرار میگیرد. نام ستون جدید براساس این روش را LinearT قرار دادهایم.
توجه شما را به این نکته جلب میکنیم که استفاده از روشها و Method های بالا بستگی به ماهیت دادهها و نحوه جمعآوری آنها دارد و نمیتوان هیچکدام را نسبت به دیگری بهتر و مناسبتر دانست.
ارایه خدمات جایگزینی (Missing Value) داده های گمشده در SPSS
ما در موسسه علمی پژوهشی داده پویا علامه ارایه خدمات جایگزاری داده های گمشده در SPSS را انجام میدهیم. جهت دریافت نکات بیشتر و نحوه کار میتوانید مختصری از کار خود را برای ما ارسال نمایید.
ما به سرعت تقاضای شما را بررسی و نتایج آنالیز جایگزاری داده های گمشده در SPSS را به صورت اختصاصی و کامل ارسال خواهیم کرد.
در این زمینه همچنین میتوانید کارگاه آموزشی جایگزینی دادههای گمشده در تحقیقات را که گراف پد برگزار کرده است، مشاهده کنید.
- کارگاه آموزشی جایگزاری داده های گمشده
- تحلیل داده های گمشده
- تماس با ما
- کتاب آماری