در بسیاری از حوزهها، ما نیاز به اندازهگیری مفاهیمی داریم که مثل قد یا وزن، به طور مستقیم قابل مشاهده نیستند. مفاهیمی مانند دانش، هوش، شخصیت، اضطراب یا رضایت شغلی، همگی مفاهیمی “پنهان” یا “نهفته” هستند. روانسنجی، علمی است که به ما کمک میکند برای این مفاهیم نامرئی، ابزارهای اندازهگیری بسازیم. اما چطور میتوانیم به کیفیت این ابزارها اعتماد کنیم؟
اینجاست که دو مفهوم بنیادی و کلیدی وارد میدان میشوند: پایایی (Reliability) و روایی (Validity). این دو، سنگ بنای هر آزمون و ابزار اندازهگیری معتبری هستند. اینها صرفاً اصطلاحات آکادمیک نیستند، بلکه اصولی هستند که پیامدهای بسیار واقعی و مهمی در زندگی ما دارند. تصمیمات سرنوشتسازی در حوزههای مختلف—از تشخیصهای پزشکی و بالینی گرفته تا استخدام کارمندان و پذیرش دانشجو در دانشگاهها—همگی به کیفیت دادههایی که از این آزمونها به دست میآید، بستگی دارد.
بنابراین، استفاده از ابزارهای پایا و معتبر، یک بخش اساسی در تصمیمگیریهای مبتنی بر شواهد است.
حالا برای اینکه این دو مفهوم را بهتر و با جزئیات بیشتر درک کنیم، بیایید هر کدام را با مثالهای ساده بررسی کنیم.
پایایی به زبان ساده یعنی ثبات، سازگاری و تکرارپذیری یک ابزار اندازهگیری. اگر یک ابزار پایا باشد، هر بار که در شرایط یکسان از آن استفاده کنیم، باید نتایج مشابهی به ما بدهد.
مثال ترازوی دیجیتال:
هدف پایایی چیست؟
در هر اندازهگیری، نمرهای که ما میبینیم (نمره مشاهدهشده) از دو بخش تشکیل شده است: نمره واقعی فرد به علاوه مقداری خطای اندازهگیری (خطاهای تصادفی مثل حدس زدن، حواسپرتی یا خستگی). هدف پایایی، به حداقل رساندن این خطای تصادفی است تا نمرهای که به دست میآید، تا حد ممکن به نمره واقعی فرد نزدیک باشد.
پایایی آزمون-بازآزمون: این نوع پایایی، ثبات نتایج را در طول زمان بررسی میکند. یک آزمون را امروز به گروهی میدهیم و مدتی بعد (مثلاً دو هفته) دوباره همان آزمون را به همان افراد میدهیم. اگر نتایج دو اجرا شبیه هم بود، پایایی بالاست. این روش برای سنجش ویژگیهای پایداری مثل صفات شخصیتی مناسب است.
پایایی بین ارزیابها: این نوع پایایی، میزان توافق بین دو یا چند ارزیاب یا داور مستقل را میسنجد. این روش زمانی حیاتی است که نمرهدهی به قضاوت انسانی وابسته است، مثل تصحیح یک انشا یا مصاحبه تشخیصی بالینی. توافق بالا بین داوران به معنای پایایی بالای این نوع است.
پایایی همسانی درونی: این نوع پایایی بررسی میکند که آیا تمام سؤالات یک آزمون با یکدیگر هماهنگ هستند و به نظر میرسد که همگی یک مفهوم واحد را میسنجند یا نه. یکی از معروفترین شاخصها برای سنجش آن آلفای کرونباخ نام دارد.
اکنون که با مفهوم پایایی (ثبات) آشنا شدیم، به سراغ ستون دوم کیفیت، یعنی روایی (صحت) میرویم.
روایی به این سؤال اساسی پاسخ میدهد: آیا ابزار ما دقیقاً همان چیزی را که برای سنجش آن طراحی شده است، اندازه میگیرد؟. روایی به صحت، درستی و معنادار بودن تفسیرهایی که از نمرات یک آزمون میکنیم، اشاره دارد.
مثال بازی دارت:
رابطه کلیدی بین پایایی و روایی:
یک قانون طلایی در روانسنجی وجود دارد: یک ابزار میتواند پایا باشد ولی معتبر نباشد، اما هرگز نمیتواند معتبر باشد، مگر اینکه اول پایا باشد. پایایی شرط لازم برای روایی است. اگر ترازوی شما هر بار یک عدد پرت و پلا نشان دهد (پایا نباشد)، چطور میتوان انتظار داشت که وزن درست را نشان دهد (معتبر باشد)؟
برای اثبات روایی یک آزمون، باید از منابع مختلف شواهد جمعآوری کنیم:
روایی محتوا: این نوع روایی بررسی میکند که آیا محتوای آزمون (سؤالات و وظایف) به خوبی کل حوزه مورد نظر را پوشش میدهد یا نه. این کار معمولاً توسط متخصصان آن موضوع انجام میشود. برای مثال، سؤالات یک آزمون نهایی ریاضی باید تمام سرفصلهای تدریس شده در طول ترم را به درستی پوشش دهند.
روایی ملاک-محور: این نوع روایی، رابطه بین نمرات آزمون و یک معیار یا ملاک خارجی را بررسی میکند.
روایی سازه: این نوع روایی، بنیادیترین نوع روایی است و به این سؤال پاسخ میدهد که آیا آزمون به درستی آن مفهوم نظری و انتزاعی (که به آن سازه میگویند) مانند “هوش” یا “خلاقیت” را اندازه میگیرد؟. دو شاهد مهم برای آن عبارتند از:
در نهایت، هم پایایی و هم روایی برای اطمینان از کیفیت، دقت و انصاف یک آزمون ضروری هستند و به ما کمک میکنند تا تصمیمات بهتر و مسئولانهتری بگیریم.
{{ excerpt | truncatewords: 55 }}
{% endif %}