منابع و ماخذ پایان نامه داده کاوی، میان رشته ای، مدیریت سود، یادگیری ماشین

دانلود پایان نامه

انتخاب کردند. در هر دو تحقیق رابطهای منفی بین تخصص صنعتی حسابرس و وجود مدیریت مشاهده شد. شاخص دیگر کیفیت حسابرسی که مکررا استفاده میشود، اندازه حسابرس است. جردن و همکاران (2010) به اثر کیفیت حسابرسی بر مدیریت سود شرکت‌ها (به منظور بالا بردن سود هر سهم) پرداختند. نتایج نشان داد که مدیریت سود در شرکت‌هایی که توسط 4 موسسه بزرگ حسابرسی مورد رسیدگی بوده‌اند نسبت به شرکت‌هایی که موسساتی غیر از 4 بزرگ آنها را حسابرسی کرده‌اند، به‌طور قابل توجهی کمتر بوده است. لای و گول (2008) در پژوهشی به این نتیجه رسیدند که شرکت‌هایی که تحت حسابرسی موسسات بزرگ، حسابرسی شده‌‌اند اقلام تعهدی کمتری نسبت به بقیه شرکت‌ها نشان می‌دهند.
2-8-3) ویژگی‌های شرکت
وجود برخی خصوصیات، رویه‌ها و نهادها در شرکت‌ها باعث می‌گردد مشکلات ناشی از جدایی مالکیت از مدیریت کاهش یافته و شرکت در مسیر از پیش طراحی شده راهبری گردد. به‌علاوه این خصوصیات، رویه‌ها و نهادها باعث تنظیم روابط شرکت با ذی‌نفعان شده و موجب تامین اهداف پاسخگویی، شفافیت، عدالت (انصاف) و رعایت حقوق ذی‌نفعان می‌گردد. به مجموعه این خصوصیات، رویه‌ها، قوانین و نهادها حاکمیت شرکتی گفته می‌شود. ارکان حاکمیت شرکتی با ساختار هیات مدیره، استقلال هیأت مدیره، وجود کمیته حسابرسی، ساختار مالکیت، ساختار حسابرسی و ساختار سرمایه مرتبط می‌باشند. به‌طور کلی، تحقیقات تجربی یک رابطه مستقیم میان مکانیزمهای حاکمیتی و اتکاءپذیری به گزارش‌گری مالی را نشان میدهند (پرگولا و همکاران،2009).
کلین (2002) در مورد ارتباط ویژگیهای کمیته حسابرسی و هیئت مدیره با مدیریت سود مطالعه‌ای انجام داد. او دریافت که بین استقلال این دو هیئت و وجود اقلام تعهدی غیرعادی ارتباطی معکوس وجود دارد.
2-9)داده کاوی
2-9-1)تاریخچه داده کاوی
دنیای مدرن در واقع دنیای داده گراست. ما با داده های عددی و غیر عددی در بخش های صنعتی، بازرگانی، مدیریتی، مالی و علمی احاطه شده ایم که می باید این داده ها تحلیل و پردازش شوند تا تبدیل به اطلاعاتی شوند که آگاهی بخش، آموزش دهنده و پاسخگو باشند یا به شکل دیگری به درک و تصمیم گیری ما کمک کنند. در سال های اخیر رشد انفجار آمیزی از روش ها برای اکتشاف دانش جدید از داده های خام به وقوع پیوسته است. در پاسخ به این امر، رشته جدیدی از کاوش داده ها موسوم به داده کاوی به طور ویژه گسترش یافته است تا اطلاعات با ارزشی را از چنین مجموعه داده های عظیم استخراج نماید. داده کاوی از جمله موضوع هایی است که همزمان با ایجاد و استفاده از پایگاه داده ها در اوایل دهه80 برای جستجوی دانش در داده ها شکل گرفت. توسعه سیستم های پایگاهی پیشرفته در دهه 80 باعث توسعه همه جانبه و کاربردی شدن این سیستم ها در سراسر جهان گردید. بدین ترتیب سیستم های مدیریت بانک های اطلاعاتی همچون Oracle ، Sql Server و … ایجاد شدند و حجم زیادی از اطلاعات با استفاده از این سیستم ها مورد پردازش قرار گرفتند. موضوع داده کاوی در اوایل دهه 90 پا به عرصه ظهور گذاشته، از سال 1995 به طور جدی وارد مباحث آمار شده و در سال 1996 اولین شماره مجله کشف دانش از پایگاه داده ها منتشر شد (کانتاردزیک و علیخانزاده، 1385).
2-9-2 ) تعریف داده کاوی
داده کاوی به استخراج و کاوش دانش از حجم زیاد داده اطلاق می شود که در واقع تشبیهی از کاوش طلا از صخره ها و سنگ ها است. کاوش، واژه صریح و روشن است که فرآیند یافتن یک مجموعه کوچک از مواد با ارزش در حجم زیادی از مواد خام را توصیف می کند. به این ترتیب مفهوم “داده کاوی” به عنوان یک مفهوم کلی و عام مشخص می شود. داده کاوی یک حوزه میان رشته ای با رشد سریع است که حوزه های مختلفی همچون پایگاه داده،آمار،یادگیری ماشین و سایر زمینه های مرتبط را با هم تلفیق کرده است تا اطلاعات ودانش ارزشمند نهفته درحجم بزرگی از داده هارا استخراج نمایید.
بطور کلی، داده کاوی یک فعالیت میان رشته ای و ماحصل رویارویی و هم افزایی علوم مختلفی چون آمار، یادگیری ماشینی، هوش مصنوعی، تکنولوژی پایگاه داده و مصور سازی(توصیف و نمایه سازی) می باشد(قیلدرز و همکاران،2000). در عین حال این محصول مشترک وجوه افتراق مشخصی یا پدیدآورندگان خود دارد. برای مثال اگر چه استخراج دانش از داده، ماهیتا موضوع علم آمار بوده است اما توسعه و تجزیه و تحلیل داده ها به وسیله رایانه که برای نخستین بار در دهه 60 معرفی شد. اثر تلویحی نگران کننده ای بر علم آمار گذاشت این نگرانی ناشی از آن بود که الگوهایی که در یک مجموعه داده به لحاظ آماری معنی دار به نظر میرسیدند، هنگامی که این مجموعه به وسیله رایانه به دفعات زیاد تغییر میکرد(حتی در حالتی که این مجموعه ها به تصادف تولید می شدند)، از درجه اعتبار ساقط می شد. واضح است که این معضل فرایند استخراج دانش از داده را با یک چالش اساسی مواجه می نمود بنابراین داده کاری با ایجاد امکان کاوش در مجموعههای عظیم داده، خطای طبیعی نمونهگیری را به صفر رسانده و فرصتی برای رها شدن از این کابوس فراهم آورد. علاوه بر این داده کاوی با پوشش دامنه وسیع تری از فرایند مدل سازی، ابزارهایی را برای خود کارکردن کل فرایند استخراج الگو فراهم میکند، در حالی که تحلیل های آماری هنگامی وارد میدان عمل میشوند که هنر فرضیه سازی قبلا انجام شده باشد(قایاد و همکاران،1996).
2-9-3 ) دلایل استفاده از داده کاوی
در سال های اخیر استفاده از تکنیک های داده کاوی رشد بسیار سریع
ی داشته است که از دلایل این امر می توان به موارد زیر اشاره کرد:
سهولت تولید داده ها با استفاده از پردازش تحلیل برخط.
افزایش داده های ایجاد شده از طریق ابزارهای الکترونیکی از قبیل تراکنش های خرید، عملیات بانکی، کارت های اعتباری و ماهواره ها.
افزایش داده های ایجاد شده از طریق وب سایت ها.
افزایش حجم ابزارهای ذخیره داده ها شامل انواع حافظه ها.
کاهش هزینه های پردازش اطلاعات.
وجود محیط های رقابتی با توجه به جهانی شدن کسب و کار.
وجود نرم افزارهای مفید داده کاوی.
2-9-4 ) پیش نیاز یک داده کاو موفق
برای انجام یک داده کاوی موثر لازم است قبل از شروع به موارد زیر توجه داشته باشیم:
ضمن آشنایی کامل با موضوع مورد بحث، مسئله داده کاوی به درستی تعریف و تبیین شود.
داده ها موجود باشند.
داده های موجود مرتبط، کافی، مناسب و پاکسازی شده باشند.
مسئله با روش های پرس و جو یا سایر ابزارهای کار با بانک های اطلاعاتی قابل حل نباشد.
نتایج حاصل از داده کاوی قابل اجرا و عملیاتی باشند.
2-9-5) مراحل فرایند کشف دانش از پایگاه داده ها
برای کشف دانش از پایگاه داده ها پنج مرحله داریم که عبارتند از :
انبارش داده ها
انتخاب داده ها
تبدیل داده ها
کاوش در داده ها
تفسیر نتیجه
همانگونه که مشاهده می شود داده کاوی یکی از مراحل این فرایند است که به عنوان بخش چهارم آن نقش مهمی در کشف دانش از داده ها ایفا می کند.
2-9-5-1) انبارش داده ها
وجود اطلاعات صحیح و منسجم یکی از ملزوماتی است که در داده کاوی به آن نیازمندیم. اشتباه و عدم وجود اطلاعات صحیح باعث نتیجه گیری غلط و در نتیجه اخذ تصمیمات ناصحیح در سازمانها می گردد و منتج به نتایج خطرناکی خواهد گردید که نمونه های آن کم نیستند. اکثر سازمانها دچار یک خلا اطلاعاتی هستند. در اینگونه سازمانها معمولا سیستم های اطلاعاتی در طول زمان و با معماری و مدیریت های گوناگون ساخته شده اند، به طوری که سازمان اطلاعاتی یکپارچه و مشخصی مشاهده نمی گردد. علاوه بر این برای فرایند داده کاوی به اطلاعات خلاصه و مهم در زمینه تصمیم گیریهای حیاتی نیازمندیم. هدف از فرایند انبارش داده ها فراهم کردن یک محیط یکپارچه جهت پردازش اطلاعات است. در این فرایند، اطلاعات تحلیلی و موجز در دوره های مناسب زمانی سازماندهی و ذخیره می شود تا بتوان از آنها در فرایند های تصمیم گیری که از ملزومات آن داده کاوی است، استفاده شود. به طور کلی تعریف زیر برای انبار داده ها ارائه می گردد :
انبار داده ها، مجموعه ای است موضوعی، مجتمع، متغیر در زمان و پایدار از داده ها که به منظور پشتیبانی از فرایند مدیریت تصمیم گیری مورد استفاده قرار می گیرد.
2-9-5-2) انتخاب داده ها
انبار داده ها شامل انواع مختلف و گوناگونی از داده ها است که همه آنها در داده کاوی مورد نیاز نیستند. برای فرایند داده کاوی باید داده ها ی مورد نیاز انتخاب شوند. به عنوان مثال در یک پایگاه داده های مربوط به سیستم فروشگاهی، اطلاعاتی در مورد خرید مشتریان، خصوصیات آماری آنها، تامین کنندگان، خرید، حسابداری و … وجود دارند. برای تعیین نحوه چیدن قفسه ها تنها به داده ها یی در مورد خرید مشتریان و خصوصیات آماری آنها نیاز است. حتی در مواردی نیاز به کاوش در تمام محتویات پایگاه نیست بلکه ممکن است به منظور کاهش هزینه عملیات، نمونه هایی از عناصر انتخاب و کاوش شوند.
2-9-5-3)تبدیل داده ها
هنگامی که داده های مورد نیاز انتخاب شدند و داده ها ی مورد کاوش مشخص گردیدند، معمولا به تبدیلات خاصی روی داده ها نیاز است. نوع تبدیل به عملیات و تکنیک داده کاوی مورد استفاده بستگی دارد، تبدیلاتی ساده همچون تبدیل نوع داده ای به نوع دیگر تا تبدیلات پیچیده تر همچون تعریف صفات جدید با انجام عملیاتهای ریاضی و منطقی روی صفات موجود.
2-9-5-4) کاوش در داده ها
داده های تبدیل شده با استفاده از تکنیکها و عملیاتهای داده کاوی مورد کاوش قرار می گیرند تا الگوهای مورد نظر کشف شوند.
2-9-5-5) تفسیر نتیجه
اطلاعات استخراج شده با توجه به هدف کاربر تجزیه و تحلیل و بهترین نتایج معین می گردند. هدف از این مرحله تنها ارائه نتیجه (بصورت منطقی و یا نموداری) نیست، بلکه پالایش اطلاعات ارایه شده به کاربر نیز از اهداف مهم این مرحله است.
2-9-6) الگوریتمهای داده کاوی
فرایند داده کاوی برای ساخت مدلهایی که بتواند دانش ارزشمند برای کسب و کار را از میان انبوه دادهها استخراج کند، از الگوریتمهای زیادی بهره میگیرد. دسته بندی مشهوری از این الگوریتمها ارائه شده است که نشان دهندهی ریشههای علمی داده کاوی نیز میباشند. در این دسته بندی الگوریتمهای مورد نیاز داده کاوی از سه منبع عمده تامین میشوند. برخی از معروفترین این الگوریتمها به همراه شاخه مولد آن در نگاره شماره 2-1 آمده است.

مطلب مرتبط با این موضوع :  پایان نامه با کلمات کلیدیعقد نکاح، قانون مدنی، نکاح و طلاق، قانون حمایت خانواده

نگاره شماره 2-1: الگوریتمهای مشهور داده کاوی و خواستگاه آنان
2-9-7) روشهای داده کاوی
روشهای اصلی داده کاوی به دو دسته توصیفی و پیش بینانه تقسیم می شوند:
روش های توصیفی خواص عمومی دادهها را مشخص میکنند و هدف از توصیف، یافتن الگوهایی در مورد داده است که برای انسان قابل تفسیر باشد.
روش های پیشبینانه به منظور پیشبینی رفتارهای آینده آنها استفاده میشود. عملکردهای داده کاوی در نگاره شماره 2-2 نشان داده شده اند.

نگاره شماره 2-2: عملکردهای داده کاوی
طبقهبندی(دستهبندی): یکی از رایج تری
ن کارکردهای دادهکاوی، طبقه بندی میباشد. هدف آن ساخت مدلهایی برای پیش بینی رفتارهای آتی پدیده مورد مطالعه، از طریق نگاشت رکوردهای پایگاه داده به تعدادی کلاسهای از پیش تعریف شده بر اساس معیارهای معین میباشد. به عبارت دیگر، طبقه بندی، فرآیند یافتن مدلی است که با تشخیص دستهها یا مفاهیم داده میتواند دسته ناشناخته اشیاء دیگر را پیشبینی کند. برخی از روشهای متداول دسته بندی عبارتند از:
درخت تصمیم: شامل دو نمونه از الگوریتمهای درخت تصمیم CARTوC4,5 است.
دسته بندی بیزی: دارای دو نوع بیز ساده و شبکههای بیزی است.
شبکههای عصبی پس انتشار
ماشینهای بردار پشتیبان
دستهبندی تلازمی
یادگیرندگان کامل: نزدیکترین همسایگان، استدلال مبتنی بر مورد
روشهای دیگر: ژنتیک، مجموعههای نادقیق، مجموعههای فازی
پیش بینی: در حالی که دسته بندی، برچسبهای طبقهای (گسسته و بدون ترتیب) را پیش بینی میکنند. روشهای پیشبینی، توابع مقدار پیوسته را مدل میکنند و این کارکرد به برآورد

دیدگاهتان را بنویسید