منابع و ماخذ پایان نامه اثرات ثابت، داده های تابلویی، ماشین بردار پشتیبان، رگرسیون

عموما از سه لایه ورودی106 ،لایه میانی (مخفی)107 و لایه خروجی108 تشکیل شده است. تعداد لایه ها میانی را در هر شبکه می توان تغییر داد. هر لایه در شبکه عصبی متشکل از گره هایی است. گره های لایه ورودی نشان دهنده متغیرهای ورودی مورد استفاده و گره های لایه خروجی نشان دهنده متغیرهای خروجی (متغیرهای هدف) می باشند. گره های هر لایه با تمامی گره های لایه های بعدی خود در ارتباط است. به عبارتی هر گره از لایه ورودی با تمامی گره های لایه میانی و هر گره از لایه میانی با تمامی گره های لایه بعدی خود در ارتباط اند. هر ارتباط بین گره ها دارای وزن (Wij) است. در اولین دور آموزش شبکه، وزن های بین گره ها به صورت تصادفی و در بازه صفر الی یک تعیین می شود. از تکنیک شبکه های عصبی مصنوعی به عنوان یک تکنیک یادگیری با نظارت یاد می شود. این تکنیک به منظور ساخت مدل نیاز به یک مجموعه داده آموزشی بزرگ برای یادگیری دارد (کانتاردزیک109، 2003). برای مثال در حوزه وام بانکی برای تایید یک وام، اطلاعات شخصی فرد متقاضی و اطلاعات اقتصادی وی به عنوان متغیرهای ورودی و تصمیمات مربوط به تایید وام به عنوان متغیرهای خروجی شبکه مورد استفاده است. در فرآیند ایجاد شبکه، هدف اصلی کاهش اندازه اشتباهات میان خروجی واقعی و خروجی مورد انتظار است (عرب مازار و مصطفی زاده، 1386). به طور کلی فعالیت با ورود متغیرهای X1 الی Xn آغاز می شود و هر کدام از متغیرهای ورودی در یک وزن خاص خود یعنی W1 الی Wn ضرب می شود. حاصل جمع این مجموعه را ارزش شبکه ای گره گویند :
Neti = X0 . W0 + X1 . W1 + X2 . W2 + . . . + Xi . Wj = ∑Xi .Wij
سپس از تابع سیگموئید 110 به عنوان تابع انتقال (Y = F(Neti)) استفاده می شود.

در ساخت یک مدل شبکه عصبی مصنوعی مشخص کردن توپولوژی شبکه (تعیین تعداد لایه ها و گره های شبکه و از همه مهمتر تعداد لایه های مخفی و گره های مخفی) از اهمیت زیادی برخوردار می باشد. زیرا گره ها و لایه های مخفی به شبکه اجازه می دهند تا خصوصیات داده ها را کشف و شناسایی نماید و بدین وسیله نگاشت های غیر خطی پیچیده را در بین متغیرهای ورودی و خروجی برقرار نماید. اکثر محققان برای تعیین توپولوژی شبکه از روش سعی و خطا استفاده نموده اند (آذر و کریمی، 1388). البته در این زمینه یکسری قواعد سر انگشتی مانند n⁄2 ، n ، n + 1 و 2n + 1 گره (n نشان دهنده تعداد گره های لایه ورودی است) به منظور تعیین تعداد گره های لایه میانی نیز وجود دارد که نهایتا در این تحقیق توپولوژی انتخاب خواهد شد تا دقت مدل را افزایش دهد. در مسائل از نوع دسته بندی تعداد گره های لایه ورودی برابر با تعداد متغیرهای مستقل و تعداد گره های لایه خروجی برابر با تعداد متغیرهای هدف است (راعی و فلاح پور، 1382).
3-7-2. ماشین بردار پشتیبان
ماشین بردار پشتیبان یکی از روش های یادگیری با نظارت است که هم برای دسته‌بندی و هم رگرسیون قابل استفاده است. ماشین بردار پشتیبان در اصل یک دسته‌بندی کننده دو کلاسی است که کلاس‌ها را توسط یک مرز خطی از هم جدا می کند. در این روش نزدیک ترین نمونه‌ها به مرز تصمیم‌گیری را بردارهای پشتیبان می‌نامند. این بردارها معادله مرز تصمیم‌گیری را مشخص می‌کنند. این روش به دلیل استفاده از اصل کمینه‌سازی ریسک ساختاری که از طریق بیشینه کردن فاصله بین دو ابر صفحه گذرا از بردارهای پشتیبان هر دو کلاس، اعمال می‌شود برخلاف حالت کمینه سازی ریسک تجربی که سعی در کمینه کردن خطای آموزش را دارد عملکرد بهتری بر روی داده‌هایی که مدل با آن‌ها ساخته نشده است؛ از خود نشان می‌دهند. به منظور سادگی در فهم برای بیان تئوری ماشین بردار پشتیبان از ساده‌ترین حالت ممکن برای یعنی دسته بندی دو کلاسی در حالت جدایی پذیر به صورت خطی شروع می شود (هامل، 2009).
در این روش فرض می‌شود که نمونه‌ها دارای برچسب y_i={-1,+1} باشند. هر نمونه به صورت یک بردار نشان داده می‌شود. برای یافتن مرز تصمیم‌گیری بهینه از روش حاشیه بیشیه استفاده می‌شود. بنابراین مرز تصمیم‌گیری علاوه بر اینکه بایستی تمام نمونه‌های هر دو کلاس را به درستی به دو دسته تقسیم کند همچنین باید مرز تصمیم گیری‌ای (ابرصفحه) را پیدا کند که بیشترین فاصله از همه بردارهای پشتیان را نیز داشته باشد. بیان ریاضی مرز تصمیم‌گیری در فضای برداری میتواند به صورت
f(x┴¯ )=sgn(w┴¯.x┴¯+b) (3-1)
باشد. که w┴¯ بردار نرمال ابرصفحه و b عرض از مبدا آن باشد(هامل، 2009). همان طور که بیان شد مرز تصمیم گیری بایستی نمونه‌ها را به درستی دسته‌بندی کند که بیان ریاضی آن به صورت
y_i (w┴¯.x┴¯+b)≥1 (3-2)
است. از طرف دیگر مرز تصمیم‌گیری بایستی بیش ترین فاصله را با نمونه‌های هر کلاس داشته باشد که مطابق با شکل (1) به معنای بیشینه کردن 2/w┴¯ است(هامل، 2009).

مطلب مرتبط با این موضوع :  پایان نامه با واژگان کلیدیقانون مجازات، حقوق فرانسه، ضرب و جرح، حقوق جزا

بنابراین می‌توان یک مساله بهینه سازی‌ به صورت زیر تعریف کرد.
■(min  1/2 〖‖w┴¯ ‖〗^2 (3-3)@s.t.   y_i (w┴¯.x┴¯_i+b)≥1 (4-3) )
برای حل این مساله بهینه‌سازی از روش ضرائب لاگرانژ استفاده می‌شود. بنابراین مساله به صورت
■(min┬(w,b)   max┬(α≥0)  {1/2 ‖w‖^2-∑_(i=1)^n▒〖α_i [y_i 〗(w┴¯.x┴¯_i+b)-1]} (5-3) @s.t.  α_i≥0 (6-3)@ ∑_(i=1)^n▒α_i y_i=0 (7-3))
در می‌آید که α_i ضرائب ل
اگرانژ می‌باشد. در ادامه این فرم(که فرم اولیه نامیده می‌شود) به فرم همزاد111 آن با جایگذاری مشتق‌های لاگرانژین نسبت به متغیر‌های اولیه (w┴¯,b) در لاگرانژین تبدیل می‌شود. با حل مساله بهینه سازی با فرم همزاد مقادیر ضریب لاگرانژ یافته می‌شود. شرایط کاروش – کوهن – تاکر112 بیان می‌کند که مقدار بهینه w┴¯ به صورت زیر است (برگیز، 1998).
w=∑_(i=1)^n▒α_i x_i y_i (3-8)
همچنین به راحتی قابل اثبات است که مقدار b از طریق زیر محاسبه می‌شود.
b=1/N_sv ∑_(i=1)^n▒〖y_i-w┴¯.x┴¯_i 〗 (9-3)
که N_sv تعداد بردارهای پشتیبان است. در انتها تابع تصمیم‌گیری به صورت زیر بیان می شود (برگیز، 1998).
f(x┴¯ )=sgn(w┴¯.x┴¯+b) (10-3)
حالت جدایی‌پذیر با استثنا
در این حالت با مستثنی در نظر گرفتن برخی از نقاط می‌توان نمونه‌ها را به صورت خطی از هم جدا کرد. در این حالت متغیری به نام اسلک (ξ_i ) تعریف می‌شود که مقدار آن برابر با فاصله نقطه استثنا از مرز تصمیم‌گیری است.در این حالت تابع هدف به صورت
■(min  1/2 〖‖w┴¯ ‖〗^2+C∑_(i=1)^n▒ξ_i (11-3)@s.t.   y_i (w┴¯.x┴¯_i+b)≥1-ξ_i (12-3))
در می‌آید کهC پارامتری است که توسط کاربر بایستی مشخص شود و میزان جریمه اعمالی بر تابع هدف را به ازای هر استثنا کنترل می‌کند (برگیز، 1998).
حالت جدایی‌پذیر غیر خطی
در این حالت که نزدیک‌ترین حالت به موارد واقعی می‌باشد؛ نمونه‌ها به صورت غیر خطی از هم جدا می‌شوند. بردارهای ورودی به فضایی با ابعادی بیش‌تر (فضای ویژگی) از ابعاد فضای نمونه های ورودی نگاشته می‌شود. با بیش‌تر شدن ابعاد به طور کلی امکان جدایش خطی نمونه‌ها نیز بیش‌تر می‌شود. ماشین بردارپشتیبان مرز بهینه تصمیم‌گیری را در فضای ویژگی پیدا می‌کند و با نگاشت ابرصفحه به فضای ورودی معادله مرزتصمیم‌گیری مشخص می‌شود. به منظور کم کردن حجم محاسبات به دلیل زیاد‌ شدن ابعاد، از ترفند کرنل استفاده می‌شود.به کمک کرنل معادل ضرب داخلی دو بردار نگاشت شده به فضای ویژگی بدون نیاز به نگاشت تک‌تک آن دو، محاسبه می‌شود. در این حالت فرم همزاد به صورت
■(max L_d (α)=∑_(i=1)^n▒α_i -1/2 ∑_(i,j=1)^n▒〖α_i α_j K(x┴¯_i,x┴¯_j ) (13-3) 〗@s.t.   c≥αi≥0 (14-3)@∑_(i=1)^n▒α_i y_i=0 (15-3))
و تابع تصمیم‌گیری به صورت تابع 3-16 می‌باشد (برگیز، 1998).
D(x)=sgn(∑_(i=1)^n▒〖y_i α_i K(x┴¯,x┴¯_i)+b) (16-3)〗
3-7-3. الگوی اقتصاد سنجی پانل دیتا
به طور کلی می توان گفت مزیت استفاده از داده های تابلویی نسبت به سری های زمانی و داده های مقطعی، آن است که داده های تابلویی، با ترکیبی از سری های زمانی و مقطعی اطلاعات بیشتر، تنوع یا تغییر پذیری بیشتر، هم خطی کمتر بین متغیرها، درجات آزادی و کارایی بیشتر را فراهم می کند. سری زمانی معمولا دچار هم خطی هستند در حالی که داده های تابلویی، بعد مقطعی داده ها موجب افزایش تغییر پذیری یا تنوع بسیار زیادی می شود که با در دست داشتن این اطلاعات می توان برآوردهای معتبرتری انجام داد. در ضمن این روش امکان بیشتری برای شناسایی و اندازه گیری اثراتی را فراهم می کند که تنها به وسیله آمار های مقطعی و یا سری زمانی، به سادگی قابل شناسی نیست. برای آشنایی بیشتر مدل پانل دیتایی زیر را در نظر می گیریم:
Y_it=α_i+β_it μ_it+u_it
که در آن α_i عرض از مبدا
β=(β_1، β_2،…،β_k ) بردار ضرایب یا پارامترها
μ_itشامل k متغیر توضیحی است.
u_it، جمله اخلال مدل می باشد که از فروض کلاسیک رگرسیون خطی پیروی می کند.
t=1,2,…, T ، دوره زمانی است.
در این صورت تخمین معادله فوق به فروض ما درباره عرض از مبدا، ضریب شیب و جمله ی خطا u_it بستگی دارد. روش های متداول برای تخمین معادله فوق با استفاده از داده های تابلویی عبارتند از (صالحی دزفولی، 1388):
1-روش مدل اثرات مشترک113 2- روش مدل اثرات ثابت114 3- روش مدل اثرات تصادفی115
3-7-3-1) مدل اثرات مشترک
ساده ترین روش، حذف ابعاد فضا (مکان) و زمان از داده های تابلویی و تخمین مدل رگرسیون (3-1)، با استفاده از روش حداقل مربعات OLS است. که آن را مدل داده های ترکیبی (pool) می نامند. یعنی همه مشاهدات سری زمانی را برایهر مقطع از بالا به پایین برای هر متغیر مدل مرتب کنیم و بعد مدل را به روش OLS معمولی تخمین بزنیم در این صورت مدل (3-1) به صورت زیر در می آید :
Y_it=α+βμ_it+u_it
که در آن ،α عرض از مبدا مشترک برای تمامی مقاطع است.
در مدل (3-2) فرض می شود که مقدار عرض از مبدا برای مقاطع مختلف یکسان است. هم چنین فرض می شود که ضرایب شیب متغیر های توضیحی برای مقاطع مختلف یکسان است.
3-7-3-2) مدل اثرات ثابت
یک روش برای ملاحظه ” تکی” (وجود مستقل) هر یک از واحدهای مقطعی آن است که عرض از مبدا برای هریک از مقاطع، متفاوت باشد. اما فرض می کنیم ضرایب شیب میان مقاطع ثابت می باشند. به منظور توضیح بیشتر مدل (3-1) را دوباره می نویسیم :
Y_it=α_i+β_it μ_it+u_it
لازم به ذکر است که در این حالت اندیس i در جمله عرض از مبدا نشان می دهد که عرض از مبدا های مقاطع مختلف می توانند متفاوت باشند، این تفاوت می تواند به دلیل ویژگی های خاص هر مقطع نظیر سبک مدیریتی، اصول کلی، فلسفه مدیریت، شرایط محیطی و اقتصادی و غیره باشد. در ادبیات اقتصاد سنجی، مدل (3-3)، مدل اثرات ثابت نامیده می شود.
اصطلاح ” اثرات ثابت” ناشی از این واقعیت است که با وجود تفاوت عرض از مبدا میان مقاطع، عرض از مبد
ا هر مقطع طی زمان تغییر نمی کند. باید اشاره کرد که در روش اثرات ثابت در مدل (3-3) فرض شده ضرایب(شیب) متغیرهای توضیحی بین مقاطع یا طی زمان تغییر نمی کنند. برای اینکه تغییر عرض از مبدا (اثرات ثابت) بین مقاطع در مدل (3-3) ملاحظه و بررسی شود از تکنیک

مطلب مرتبط با این موضوع :  منابع پایان نامه ارشد دربارهفضای مجازی، عقود معین، تعیین مصداق، دولت الکترونیک

دیدگاهتان را بنویسید