کاپای کوهن محاسبات[ویرایش] مثال[ویرایش] منابع[ویرایش] منوی ناوبریAssessing agreement on classification tasks: The kappa statistic.10.1016/j.compedu.2005.04.002"Diversity of decision-making models and the measurement of interrater agreement"10.1037/0033-2909.101.1.140و
میانگینمیانگین حسابیمیانگین هندسیمیانگین همسازمیانهمددامنهانحراف معیارضریب تغییراتصدکدامنه بین چارکیواریانسچولگیکشیدگیگشتاورال-گشتاوردادههای گروهبندیشدهتوزیع فراوانیجدول پیشایندینمودار میلهایدونمودارهنمودار جعبهاینمودار کنترلهمبستگینگارنمودار جنگلیبافتنگارنمودار Q-Qنمودار توالینمودار پراکنشنمودار ساقه و برگنمودار راداریاندازه تأثیرخطای استانداردتوان آماریتعیین اندازه نمونهطراحی آزمایشآزمایش تصادفیانتساب تصادفیتکرار آزمایشبلوکبندیآزمایش عاملیطراحی بهینهتوزیع نمونهگیریآماره بسندهفراتحلیلآماره ترتیبیآماره کاوشیمقدار رکوردکامل بودنخانواده نماییآزمون جایگشتیآزمون تصادفیدنتوزیع نمونهایبوتاسترپینگآماره Uکاراییآمار باثباتاحتمال بیزیاحتمال پیشیناحتمال پسینبازه مورد قبولعامل بیزبرآوردگر بیزیبرآوردگر بیشینهگر احتمال پسینضریب همبستگی پیرسونهمبستگی جزئیاختلاطضریب تشخیصرگرسیون ساده خطی(en)کمینه مربعات خطیمدل خطی عمومی(en)رگرسیون خطی بیزی(en)خانواده نماییرگرسیون لجستیکرگرسیون دوجملهای(en)پواسونکاپای کوهنجدول پیشایندیمدل گرافیرگرسیون پواسونآزمون مکنمارتجزیهتخمین روندفرایند ماناتصحیح فصلیبودنهموارسازی نمایی(en)همجمعیعلیت گرانجرآماره Q(en)آماره دوربین-واتسون(en)خودهمبستگیتابع خودهمبستگی جزئی(en)تابع خودهمبستگی تقاطعی(en)آرمامدل آریماگارچاتورگرسیو برداریتخمین طیفیتحلیل فوریهموجکتابع بقا(en)برآوردگر کاپلان-مهیرآزمون لگرتبهای(en)نرخ خرابیمدل خطرهای متناسب(en)مدل زمان خرابی شتابیده(en)بیوانفورماتیکزیستسنجشیکارآزمایی بالینیمطالعاتهمهگیرشناسیآمار پزشکیآکچوئریسرشماریآمار جرم(en)آمار جمعیتشناسی(en)اقتصادسنجیآمار ملی(en)آمار رسمی(en)جامعه آماریروانسنجی
آمار ناپارامتریکدستهبندی داده
انگلیسیآماریتوافق درون ارزیابمحافظه کارجیکوب کوهنپیپی اسکوتکاپای فلیسجوزف فلیسپی اسکوتراست به چپ
کاپای کوهن
پرش به ناوبری
پرش به جستجو
ضریب کاپای کوهن (به انگلیسی: Cohen's kappa coefficient) یک معیار آماری توافق درون ارزیاب یا توافق درون نویس[۱] برای موارد کیفیتی (مطلق) است. بهطور عمومی یک معیار قوی تر از قرارداد محاسبه ساده درصد بهشمار میرود چون K بهطور تصادفی در قرارداد در حال رخ دادن، محاسبه میشود.
برخی محققان[۲][نیازمند منبع] درمورد احتمال اینکه K بسامدهای طبقهبندیهای مشاهده شده را بهطور دلخواه اختیار کند، نگرانیهایی عنوان کردهاند که میتواند تأثیر قرارداد دست کم گرفته شده را برای یک طبقهبندی که بهطور معمول استفاده میگردد، داشته باشد، K یک معیار قرارداد بیش از حد محافظه کار لحاظ میگردد.
دیگران،[۳][نیازمند منبع] این ادعا را که کاپا در قرارداد بهطور تصادفی «به حساب آورده میشود»، به چالش میکشند. برای انجام مؤثر این کار نیاز به یک طرح واضح از چگونگی تأثیر شانس بر روی تصمیمات ارزیاب خواهد بود. اصطلاحاً نظام تصادفی آمار کاپا عنوان میکند که وقتی اطمینان کامل وجود ندارد، ارزیاب درواقع حدس میزند – یک سناریوی به شدت غیر واقعی.
محاسبات[ویرایش]
کاپای کوهن قرارداد را بین دو ارزیاب که هر کدام N مورد را در C طبقهٔ متقابلاً انحصاری مرتب کردهاند، اندازهگیری میکند. اولین استفاده از آمار شبیه به کاپا مربوط به گالتون (۱۸۹۲) است،[۴] اسمیتون را ببینید (1985).[۵]
معادله برای K عبارتست از:
- κ=Pr(a)−Pr(e)1−Pr(e),displaystyle kappa =frac Pr(a)-Pr(e)1-Pr(e),!
که در آن Pr(a) قرارداد نسبی مشاهده شده بین ارزیابها است و Pr(e) احتمال فرضی قرارداد شانس است، با استفاده از دادهٔ مشاهده شده برای محاسبهٔ احتمالهای هر مشاهدهکننده که به صورت اتفاقی بیانگر یکی از دستهها هستند. اگر که ارزیابها در قرارداد کامل باشند آنگاه K=۱ است. اگر هیچ قراردادی بین ارزیابها به غیر از آنکه توسط تصادف قابل دست یابی باشد (که توسط Pr(e) تعریف شد)، وجود نداشته باشد، آنگاه K=۰ است.
اولین مقالهای که کاپا را به عنوان روشی جدید معرفی کرد توسط جیکوب کوهن در مجلهٔ سنجش آموزشی و روانشناسی در ۱۹۶۰ منتشر شد.[۶]
یک رقم مشابه، به نام پی توسط اسکوت در ۱۹۵۵ مطرح شد. کاپای کوهن و پی اسکوت در روش محاسبهٔ عبارت Pr(e) با هم متفاوتند.
توجه کنید که کاپای کوهن فقط قرارداد بین دو ارزیاب را اندازه میگیرد. برای یک اندازهگیری قرارداد مشابه (کاپای فلیس) که وقتی بیش از دو ارزیاب باشند، مورد استفاده قرار میگیرد، جوزف فلیس (۱۹۷۱) را ببینید. البته، کاپای فلیس تعمیم چند ارزیاب رقم پی اسکوت است، نه کاپای کوهن.
مثال[ویرایش]
فرض کنید که شما در حال بررسی دادههای مربوط به یک گروه از ۵۰ نفر که برای یک وام درخواست میکنند، هستید. هر درخواست وام توسط دو خواننده خوانده شدهاند و هر خواننده یا جواب «بله» یا جواب «نه» به درخواست داده است. فرض کنید که دادهٔ شمارندهٔ قبول/رد به شکل زیر است که A و B خوانندهها هستند، دادههای روی قطر چپ به راست نشانگر تعداد قبولیها و دادههای روی قطر راست به چپ نشانگر تعداد ردیها است:
B | |||
---|---|---|---|
بله | نه | ||
A | بله | ۲۰ | ۵ |
نه | ۱۰ | ۱۵ |
توجه کنید که ۲۰ درخواست توسط هر خواننده (A و B) قبول شده و۱۵ درخواست توسط هرکدام رد شدهاند. پس، درصد قرارداد مشاهده شده میشود Pr(a) = (۲۰ +۱۵)/۵۰ = ۰٫۷۰
برای محاسبه Pr(e) (احتمال قرارداد تصادفی) به نکات زیر باید توجه کنیم:
- خواننده A به ۲۵ متقاضی «بله» گفته و به ۲۵ متقاضی «نه» گفتهاست. پس خواننده A در ۵۰٪ مدت زمان «بله» گفتهاست.
- خواننده B به ۳۰ متقاضی «بله» گفته و به ۲۰ متقاضی «نه» گفتهاست. پس خواننده B در ۶۰٪ مدت زمان «بله» گفتهاست.
بنابراین احتمال اینکه با هم «بله» بگویند ۰٫۵۰ . ۰٫۶۰ = ۰٫۳۰ است و احتمال اینکه باهم «نه» بگویند ۰٫۵۰ . ۰٫۴۰ = ۰٫۲۰ میباشد. پس احتمال کل قرارداد تصادفی برابر است با Pr(e) = ۰٫۳ +۰٫۲ = ۰٫۵.
پس اکنون با محاسبهٔ رابطهٔ مربوط به کاپای کوهن داریم:
- κ=Pr(a)−Pr(e)1−Pr(e)=0.70−0.501−0.50=0.40displaystyle kappa =frac Pr(a)-Pr(e)1-Pr(e)=frac 0.70-0.501-0.50=0.40!
منابع[ویرایش]
↑ Carletta, Jean. (1996) Assessing agreement on classification tasks: The kappa statistic. Computational Linguistics, 22(2), pp. 249–254.
↑ Strijbos, J.; Martens, R.; Prins, F.; Jochems, W. (2006). "Content analysis: What are they talking about?". Computers & Education. 46: 29–48. doi:10.1016/j.compedu.2005.04.002..mw-parser-output cite.citationfont-style:inherit.mw-parser-output qquotes:"""""""'""'".mw-parser-output code.cs1-codecolor:inherit;background:inherit;border:inherit;padding:inherit.mw-parser-output .cs1-lock-free abackground:url("//upload.wikimedia.org/wikipedia/commons/thumb/6/65/Lock-green.svg/9px-Lock-green.svg.png")no-repeat;background-position:right .1em center.mw-parser-output .cs1-lock-limited a,.mw-parser-output .cs1-lock-registration abackground:url("//upload.wikimedia.org/wikipedia/commons/thumb/d/d6/Lock-gray-alt-2.svg/9px-Lock-gray-alt-2.svg.png")no-repeat;background-position:right .1em center.mw-parser-output .cs1-lock-subscription abackground:url("//upload.wikimedia.org/wikipedia/commons/thumb/a/aa/Lock-red-alt-2.svg/9px-Lock-red-alt-2.svg.png")no-repeat;background-position:right .1em center.mw-parser-output div[dir=ltr] .cs1-lock-subscription a,.mw-parser-output div[dir=ltr] .cs1-lock-limited a,.mw-parser-output div[dir=ltr] .cs1-lock-registration abackground-position:left .1em center.mw-parser-output .cs1-subscription,.mw-parser-output .cs1-registrationcolor:#555.mw-parser-output .cs1-subscription span,.mw-parser-output .cs1-registration spanborder-bottom:1px dotted;cursor:help.mw-parser-output .cs1-hidden-errordisplay:none;font-size:100%.mw-parser-output .cs1-visible-errorfont-size:100%.mw-parser-output .cs1-subscription,.mw-parser-output .cs1-registration,.mw-parser-output .cs1-formatfont-size:95%.mw-parser-output .cs1-kern-left,.mw-parser-output .cs1-kern-wl-leftpadding-left:0.2em.mw-parser-output .cs1-kern-right,.mw-parser-output .cs1-kern-wl-rightpadding-right:0.2em
↑ Uebersax, JS. (1987). "Diversity of decision-making models and the measurement of interrater agreement" (PDF). Psychological Bulletin. 101: 140–146. doi:10.1037/0033-2909.101.1.140. Unknown parameter|author-separator=
ignored (help)
↑ Galton, F. (1892). Finger Prints Macmillan, London.
↑ Smeeton, N.C. (1985). "Early History of the Kappa Statistic". Biometrics. 41: 795.
↑
Cohen, Jacob (1960). "A coefficient of agreement for nominal scales". Educational and Psychological Measurement 20 (1): 37–46. doi:10.1177/001316446002000104
https://en.wikipedia.org/wiki/Cohen's_kappa ویکیپدیا انگلیسی
ردهها:
- آمار ناپارامتریک
- دستهبندی داده
(window.RLQ=window.RLQ||[]).push(function()mw.config.set("wgPageParseReport":"limitreport":"cputime":"0.408","walltime":"0.558","ppvisitednodes":"value":2651,"limit":1000000,"ppgeneratednodes":"value":0,"limit":1500000,"postexpandincludesize":"value":331960,"limit":2097152,"templateargumentsize":"value":36067,"limit":2097152,"expansiondepth":"value":16,"limit":40,"expensivefunctioncount":"value":36,"limit":500,"unstrip-depth":"value":1,"limit":20,"unstrip-size":"value":9975,"limit":5000000,"entityaccesscount":"value":1,"limit":400,"timingprofile":["100.00% 406.480 1 -total"," 61.85% 251.418 15 الگو:Navbox"," 32.83% 133.435 1 الگو:پانویس"," 30.30% 123.179 3 الگو:Cite_journal"," 30.20% 122.767 1 الگو:آمار"," 28.99% 117.832 1 الگو:Navbox_with_collapsible_groups"," 23.55% 95.718 5 الگو:گرداننده_رده"," 17.84% 72.529 1 الگو:انگلیسی"," 16.54% 67.236 1 الگو:به_زبان_دیگر"," 15.67% 63.696 1 الگو:Lang"],"scribunto":"limitreport-timeusage":"value":"0.163","limit":"10.000","limitreport-memusage":"value":4602542,"limit":52428800,"cachereport":"origin":"mw1324","timestamp":"20190425232326","ttl":2592000,"transientcontent":false);mw.config.set("wgBackendResponseTime":127,"wgHostname":"mw1242"););