رگرسیون پواسون محتویات تخمین پارامترها بر اساس بیشینه درست نمایی[ویرایش] ده سازیها[ویرایش] جستارهای وابسته[ویرایش] منابع[ویرایش] منوی ناوبریوXPost1633357"Overdispersion and Poisson Regression"10.1007/s10940-008-9048-41573-7799ووو
میانگینمیانگین حسابیمیانگین هندسیمیانگین همسازمیانهمددامنهانحراف معیارضریب تغییراتصدکدامنه بین چارکیواریانسچولگیکشیدگیگشتاورال-گشتاوردادههای گروهبندیشدهتوزیع فراوانیجدول پیشایندینمودار میلهایدونمودارهنمودار جعبهاینمودار کنترلهمبستگینگارنمودار جنگلیبافتنگارنمودار Q-Qنمودار توالینمودار پراکنشنمودار ساقه و برگنمودار راداریاندازه تأثیرخطای استانداردتوان آماریتعیین اندازه نمونهطراحی آزمایشآزمایش تصادفیانتساب تصادفیتکرار آزمایشبلوکبندیآزمایش عاملیطراحی بهینهتوزیع نمونهگیریآماره بسندهفراتحلیلآماره ترتیبیآماره کاوشیمقدار رکوردکامل بودنخانواده نماییآزمون جایگشتیآزمون تصادفیدنتوزیع نمونهایبوتاسترپینگآماره Uکاراییآمار باثباتاحتمال بیزیاحتمال پیشیناحتمال پسینبازه مورد قبولعامل بیزبرآوردگر بیزیبرآوردگر بیشینهگر احتمال پسینضریب همبستگی پیرسونهمبستگی جزئیاختلاطضریب تشخیصرگرسیون ساده خطی(en)کمینه مربعات خطیمدل خطی عمومی(en)رگرسیون خطی بیزی(en)خانواده نماییرگرسیون لجستیکرگرسیون دوجملهای(en)پواسونکاپای کوهنجدول پیشایندیمدل گرافیرگرسیون پواسونآزمون مکنمارتجزیهتخمین روندفرایند ماناتصحیح فصلیبودنهموارسازی نمایی(en)همجمعیعلیت گرانجرآماره Q(en)آماره دوربین-واتسون(en)خودهمبستگیتابع خودهمبستگی جزئی(en)تابع خودهمبستگی تقاطعی(en)آرمامدل آریماگارچاتورگرسیو برداریتخمین طیفیتحلیل فوریهموجکتابع بقا(en)برآوردگر کاپلان-مهیرآزمون لگرتبهای(en)نرخ خرابیمدل خطرهای متناسب(en)مدل زمان خرابی شتابیده(en)بیوانفورماتیکزیستسنجشیکارآزمایی بالینیمطالعاتهمهگیرشناسیآمار پزشکیآکچوئریسرشماریآمار جرم(en)آمار جمعیتشناسی(en)اقتصادسنجیآمار ملی(en)آمار رسمی(en)جامعه آماریروانسنجیروشهای گردآوریسرشمارینمونه گیری در پژوهشنمونه گیری تصادفیپرسشنامهمصاحبهساختارمندنیمه-ساختاریافتهبدون چارچوبتحقیق بازارجمعیتشناسینظرسنجیرهگیری نظرسنجیهاافکار عمومیموسسه بین المللی آمار(en)انجمن جهانی نظرسنجی عمومی(en)انجمن آمریکایی نظرسنجی عمومی(en)انجمن اروپایی نظرسنجی و تحقیقات بازاریابی(en)مرکز تحقیقات پیو
اقتصادسنجیتحلیل رگرسیونتوزیع پواسوندستهبندی دادهمدل خطی تعمیمیافته
آمارتحلیل رگرسیونمدلهای خطی تعمیمیافتهمتغیر وابسته و مستقلگرادیان کاهشیstatistics packages
رگرسیون پواسون
پرش به ناوبری
پرش به جستجو
| بخشی از مجموعه مباحث دربارهٔ آمار |
| تحلیل رگرسیون |
|---|
مدلها |
|
|
|
|
|
تخمین |
|
|
|
|
پیشزمینه |
|
|
در آمار، رگرسیون پواسون نوعی از تحلیل رگرسیون و زیرمجموعهای از مدلهای خطی تعمیمیافته است که برای تحلیل دادههای حاصل از شمارش به کار میرود.اگر x∈Rndisplaystyle mathbf x in mathbb R ^n برداری از متغیر وابسته و مستقل باشد، فرم زیر را میگیرد:
- log(E(Y|x))=a′x+b,displaystyle log(operatorname E (Y
که در آن a∈Rndisplaystyle mathbf a in mathbb R ^n و b∈Rdisplaystyle bin mathbb R . میتوان فرم بالا را به این صورت نیز نوشت:
- log(E(Y|x))=θ′x,displaystyle log(operatorname E (Y
که در آن x بردار (n+1displaystyle mathbf n+1 )-بعدی از متغیرهاست. با داشتن پارامتر رگرسیون پواسون θdisplaystyle mathbf theta و بردار ورودی xdisplaystyle mathbf x ، میتوان پیشبینی را به اینصورت بدست آورد:
- E(Y|x)=e(θ′x).mathbf x )=e^left(boldsymbol theta 'mathbf x right).,
محتویات
۱ تخمین پارامترها بر اساس بیشینه درست نمایی
۲ ده سازیها
۳ جستارهای وابسته
۴ منابع
تخمین پارامترها بر اساس بیشینه درست نمایی[ویرایش]
بردار متغیر وابسته xdisplaystyle x است و θdisplaystyle theta پارامتر مدل رگرسیون پوسان است، Ydisplaystyle Y متغیر مستقل است که آنرا با یک توزیع پوسان شبیه سازی میکنیم که میانگین آن در معادله پایین آمده است [۱]:
λ:=E(Y∣x)=eθ′x,displaystyle lambda :=operatorname E (Ymid x)=e^theta 'x,,
از این رو تابع احتمال این توزیع برابر است با:
p(y∣x;θ)=λyy!e−λ=eyθ′xe−eθ′xy!displaystyle p(ymid x;theta )=frac lambda ^yy!e^-lambda =frac e^ytheta 'xe^-e^theta 'xy!
حال اگر فرض کنیم که mdisplaystyle m داده داریم یعنی (x1,y1),⋯,(xm,ym)displaystyle (x_1,y_1),cdots ,(x_m,y_m) و مقادیر متغیر مستقل از مجموعه اعداد طبیعی میآید یعنی y1,…,ym∈Ndisplaystyle y_1,ldots ,y_min mathbb N و متغیرهای وابسته n+1displaystyle n+1 هستند یعنی xi∈Rn+1,i=1,…,mdisplaystyle x_iin mathbb R ^n+1,,i=1,ldots ,m آنگاه احتمال متغیرهای مستقل به شرط مشاهده متغیرهای وابسته برابر خواهد شد با:
p(y1,…,ym∣x1,…,xm;θ)=∏i=1meyiθ′xie−eθ′xiyi!.displaystyle p(y_1,ldots ,y_mmid x_1,ldots ,x_m;theta )=prod _i=1^mfrac e^y_itheta 'x_ie^-e^theta 'x_iy_i!.
حال بر حسب اصل بیشینهسازی درست نمایی باید به دنبال پارامتری بگردیم که این درست نمایی به بیشترین مقدار خود برسد، یعنی تابع پایین بیشینه شود:L(θ∣X,Y)=∏i=1meyiθ′xie−eθ′xiyi!.displaystyle L(theta mid X,Y)=prod _i=1^mfrac e^y_itheta 'x_ie^-e^theta 'x_iy_i!.
از آنجا که تابع لگاریتم مطلقاً صعودی است بجای بیشینه کردن تابع درست نمایی میتوان لگاریتم آن را بیشینه کرد که تابع را سادهتر میکند. به عبارتی دیگر همان پارامتری که لگاریتم تابع درست نمایی را بیشینه میکند، همان پارامتر، خودِ تابع درست نمایی را نیز بیشنه میکند. لگاریتم تابع با معادله پایین برابر خواهد شد:
ℓ(θ∣X,Y)=logL(θ∣X,Y)=∑i=1m(yiθ′xi−eθ′xi−log(yi!)).displaystyle ell (theta mid X,Y)=log L(theta mid X,Y)=sum _i=1^mleft(y_itheta 'x_i-e^theta 'x_i-log(y_i!)right).
از آنجا که ∑i=1mlog(yi!)displaystyle sum _i=1^mlog(y_i!) ثابت است و پارامتر θdisplaystyle theta را در خود ندارد میتوان آنرا از تابع حذف کرد و به تابع پایین رسید[۱]
ℓ(θ∣X,Y)=∑i=1m(yiθ′xi−eθ′xi).displaystyle ell (theta mid X,Y)=sum _i=1^mleft(y_itheta 'x_i-e^theta 'x_iright).
حال برای پیدا کردن بیشینه تابعِ ℓ(θ∣X,Y)displaystyle ell (theta mid X,Y) باید گرادیان آنرا با صفر یکی کرد، یعنی ∂ℓ(θ∣X,Y)∂θ=0displaystyle frac partial ell (theta mid X,Y)partial theta =0. این معادله اما جوابی در فرم بسته ندارد و باید جواب آنرا از روشی دیگر پیدا کرد. از آنجا که −ℓ(θ∣X,Y)displaystyle -ell (theta mid X,Y) تابعی محّدب است، میتوان به پارامتر بهینه یعنی پارامتری که −ℓ(θ∣X,Y)displaystyle -ell (theta mid X,Y) را کمینه و ℓ(θ∣X,Y)displaystyle ell (theta mid X,Y) را بیشینه کند با روشهای بهینهسازی محّدب مانند گرادیان کاهشی رسید.
ده سازیها[ویرایش]
Some statistics packages include implementations of Poisson regression.
متلب Statistics Toolbox: Poisson regression can be performed using the "glmfit" and "glmval" functions.[۲]
مایکروسافت اکسل: Excel is not capable of doing Poisson regression by default. One of the Excel Add-ins for Poisson regression is XPost
آر (زبان برنامهنویسی): The function for fitting a generalized linear model in R is glm(), and can be used for Poisson Regression
ساس (نرمافزار): Poisson regression in SAS is done by using GENMOD
اسپیاساس: In SPSS, Poisson regression is done by using the GENLIN command
Stata: Stata has a procedure for Poisson regression named "poisson"
mPlus: mPlus allows for Poisson regression using the command COUNT IS when specifying the data
جستارهای وابسته[ویرایش]
- توزیع پواسون
- رگرسیون خطی
- رگرسیون لجیستیک
منابع[ویرایش]
- Cameron, A.C. and P.K. Trivedi (1998). Regression analysis of count data, Cambridge University Press. ISBN 0-521-63201-3
Christensen، Ronald (۱۹۹۷). Log-linear models and logistic regression. Springer Texts in Statistics (ویراست Second). New York: Springer-Verlag. صص. xvi+۴۸۳. MR 1633357. شابک ۰-۳۸۷-۹۸۲۴۷-۷..mw-parser-output cite.citationfont-style:inherit.mw-parser-output qquotes:"""""""'""'".mw-parser-output code.cs1-codecolor:inherit;background:inherit;border:inherit;padding:inherit.mw-parser-output .cs1-lock-free abackground:url("//upload.wikimedia.org/wikipedia/commons/thumb/6/65/Lock-green.svg/9px-Lock-green.svg.png")no-repeat;background-position:right .1em center;padding-right:1em;padding-left:0.mw-parser-output .cs1-lock-limited a,.mw-parser-output .cs1-lock-registration abackground:url("//upload.wikimedia.org/wikipedia/commons/thumb/d/d6/Lock-gray-alt-2.svg/9px-Lock-gray-alt-2.svg.png")no-repeat;background-position:right .1em center;padding-right:1em;padding-left:0.mw-parser-output .cs1-lock-subscription abackground:url("//upload.wikimedia.org/wikipedia/commons/thumb/a/aa/Lock-red-alt-2.svg/9px-Lock-red-alt-2.svg.png")no-repeat;background-position:right .1em center;padding-right:1em;padding-left:0.mw-parser-output div[dir=ltr] .cs1-lock-subscription a,.mw-parser-output div[dir=ltr] .cs1-lock-limited a,.mw-parser-output div[dir=ltr] .cs1-lock-registration abackground-position:left .1em center;padding-left:1em;padding-right:0.mw-parser-output .cs1-subscription,.mw-parser-output .cs1-registrationcolor:#555.mw-parser-output .cs1-subscription span,.mw-parser-output .cs1-registration spanborder-bottom:1px dotted;cursor:help.mw-parser-output .cs1-hidden-errordisplay:none;font-size:100%.mw-parser-output .cs1-visible-errorfont-size:100%.mw-parser-output .cs1-subscription,.mw-parser-output .cs1-registration,.mw-parser-output .cs1-formatfont-size:95%.mw-parser-output .cs1-kern-left,.mw-parser-output .cs1-kern-wl-leftpadding-left:0.2em.mw-parser-output .cs1-kern-right,.mw-parser-output .cs1-kern-wl-rightpadding-right:0.2em- Hilbe, J. M. (2007). Negative Binomial Regression, Cambridge University Press. ISBN 978-0-521-85772-7
↑ ۱٫۰۱٫۱ MacDonald, John M.; Berk, Richard (2008-09-01). "Overdispersion and Poisson Regression". Journal of Quantitative Criminology. 24 (3): 269–284. doi:10.1007/s10940-008-9048-4. ISSN 1573-7799..mw-parser-output cite.citationfont-style:inherit.mw-parser-output qquotes:"""""""'""'".mw-parser-output code.cs1-codecolor:inherit;background:inherit;border:inherit;padding:inherit.mw-parser-output .cs1-lock-free abackground:url("//upload.wikimedia.org/wikipedia/commons/thumb/6/65/Lock-green.svg/9px-Lock-green.svg.png")no-repeat;background-position:right .1em center.mw-parser-output .cs1-lock-limited a,.mw-parser-output .cs1-lock-registration abackground:url("//upload.wikimedia.org/wikipedia/commons/thumb/d/d6/Lock-gray-alt-2.svg/9px-Lock-gray-alt-2.svg.png")no-repeat;background-position:right .1em center.mw-parser-output .cs1-lock-subscription abackground:url("//upload.wikimedia.org/wikipedia/commons/thumb/a/aa/Lock-red-alt-2.svg/9px-Lock-red-alt-2.svg.png")no-repeat;background-position:right .1em center.mw-parser-output div[dir=ltr] .cs1-lock-subscription a,.mw-parser-output div[dir=ltr] .cs1-lock-limited a,.mw-parser-output div[dir=ltr] .cs1-lock-registration abackground-position:left .1em center.mw-parser-output .cs1-subscription,.mw-parser-output .cs1-registrationcolor:#555.mw-parser-output .cs1-subscription span,.mw-parser-output .cs1-registration spanborder-bottom:1px dotted;cursor:help.mw-parser-output .cs1-hidden-errordisplay:none;font-size:100%.mw-parser-output .cs1-visible-errorfont-size:100%.mw-parser-output .cs1-subscription,.mw-parser-output .cs1-registration,.mw-parser-output .cs1-formatfont-size:95%.mw-parser-output .cs1-kern-left,.mw-parser-output .cs1-kern-wl-leftpadding-left:0.2em.mw-parser-output .cs1-kern-right,.mw-parser-output .cs1-kern-wl-rightpadding-right:0.2em
↑ http://www.mathworks.com/help/toolbox/stats/glmfit.html
ردهها:
- اقتصادسنجی
- تحلیل رگرسیون
- توزیع پواسون
- دستهبندی داده
- مدل خطی تعمیمیافته
(window.RLQ=window.RLQ||[]).push(function()mw.config.set("wgPageParseReport":"limitreport":"cputime":"0.592","walltime":"0.810","ppvisitednodes":"value":4694,"limit":1000000,"ppgeneratednodes":"value":0,"limit":1500000,"postexpandincludesize":"value":483576,"limit":2097152,"templateargumentsize":"value":49351,"limit":2097152,"expansiondepth":"value":16,"limit":40,"expensivefunctioncount":"value":83,"limit":500,"unstrip-depth":"value":1,"limit":20,"unstrip-size":"value":6781,"limit":5000000,"entityaccesscount":"value":3,"limit":400,"timingprofile":["100.00% 549.364 1 -total"," 52.18% 286.633 18 الگو:Navbox"," 27.25% 149.718 1 الگو:پانویس"," 26.14% 143.602 1 الگو:Cite_journal"," 21.63% 118.825 1 الگو:آمار"," 20.64% 113.416 1 الگو:Navbox_with_collapsible_groups"," 19.14% 105.142 1 الگو:یادکرد_کتاب"," 18.75% 103.004 1 الگو:تحلیل_رگرسیون"," 18.53% 101.798 84 الگو:پم"," 17.88% 98.226 1 الگو:Sidebar"],"scribunto":"limitreport-timeusage":"value":"0.235","limit":"10.000","limitreport-memusage":"value":5220380,"limit":52428800,"cachereport":"origin":"mw1268","timestamp":"20190425232151","ttl":2592000,"transientcontent":false);mw.config.set("wgBackendResponseTime":105,"wgHostname":"mw1271"););