تارا فایل

پاورپوینت بررسی موضوعی داده کاوی در رهاسازی کشت های زراعی با GIS



کاری از دانشگاه آزاد اسلامی واحد ملارد
تهیه و تنظیم : ندا آقاخانی

موضوع مقاله :
بررسی موضوعی داده کاوی دررهاسازی کشت های زراعی با GIS
نام رشته : کامپیوتر (نرم افزار)
نام درس : داده کاوی
نام استاد :دکتر مجید خلیلیان

چکیده :
در این مقاله به توسعه رویکرد داده کاوی بر مبنای سیستم اطلاعات جغرافیایی پرداخت شده است. در این مقاله نقشه های خود سازمانده (SOM) کامل شرح داده می شود.
برای تقسیم کردن مناطق از الگوریتم خوشه بندی K-Modoid استفاده می شود که کل مناطق را به تعدادی روستا تقسیم کرده است و این روش بخش بندی به طور گسترده برای پایگاه داده های عظیم و بویژه قابلیت های کاربردی GIS مبنا استفاده می شود.
بیشتر الگوریتم های خوشه بندی در داده های فضایی به محاسبه نتایج کمی فضای چهار گوش داده ها کمک می کنند. فضای چهار گوش کوچک مجموعه ای از صفحات غیر متقاطع دستی است که یک منطقه را پوشش دهی می کنند.
خوشه سازی از مولفه های اساسی داده کاوی است و به فرایند ترکیب در مجموعه های اشیای فیزیکی و انتزاعی در گروه ها یا طبقات مشابه اشاره دارد . این اشیا در خوشه ها طوری طبقه بندی می شوند که مشابه همدیگر باشند ولی با دیگر خوشه ها متفاوت اند. مقدار بهینه k به طور متناوب با اجرای الگوریتم در جستجوی کل فضای موجود در سیستم معین می شود .

مقدمه :
واگذاری (رها سازی) کشت های زراعی پدیده گسترده ی جهانی است که مربوط به کاهش تصاعدی در عملکرد روش های سنتی این کشت های زراعی است.
واگذاری کشت اراضی یکی از تغییرات اصلی در اراضی کشورهای مدیترانه اتحادیه اروپا است. علت اصلی چنین تغییراتی اغلب مربوط به افزایش شهرنشینی ، جهانی سازی و بیابان سازی است.
جیمز مادیسیون بعد از سرشماری سال 1790 آمریکا استدلال کرد که سرشماری باید توسعه یابد و منازل مسکونی خالی از سکنه را نیز دربربگیرد. ایده­ی وی دانستن اطلاعاتی درباره ویژگیهای جمعیت محلی بوده است. طرح مادیسیون برای گسترش این سرشماری شامل اشتغال ساکنین بود.
از این رو در این مقاله از الگوریتم نقشه های خود سازمانده برای بهبود طبقه بندی آمارگیری افراد موجود در کره زمین استفاده می کنیم. این نقشه ها عملکردهای آمارگیری افراد را با انطباق فضاسازی بین فاصله اجتماعی (توزیع) و فاصله جغرافیایی را مجاز می کند. از این نقشه ها حتی می توان در اراضی رهاشده نیز استفاده کرد.

حامیان و دانشمندان جامعه شناسی دریافتند که نباید ورای سیستم های طبقه بندی چارلز بوث که با استفاده از 7 مقوله طبقه بندی کرده است: فقیر – مفلس – بزهکار – ثروتمند – نسبتاً مرفه – مرفه حرکت کنند. همسایگان با توزیع های اندکی فقط متمایز هستند.
در این بخش یک مطالعه موردی برای ارزیابی روش استنتاج داده در فرایندهای رهاسازی اراضی بکارگرفته شده است. در ابتدا لازم است که محدوده بررسی را در جائیکه به آسانی قابل مشاهده است و به طور گسترده در حال بررسی است، انتخاب کنیم. در این مطالعه از مجموعه ای از منابع داده ای GIS و منابع نرم افزاری آزاد استفاده شده است.

انتخاب مشخصه ها با استفاده از تکنیک های داده کاوی :
در سالهای اخیر، مقدار داده های جمع آوری ذخیره شده توسط وسیله های نوین انباره الکترونیکی به طور چشمگیری افزایش یافته است.
برای تحلیل داده های عظیم، اکتشاف دانش در مجموعه داده ها ( KDD) ، تکنیک های استخراج اطلاعات را ارائه و الگوهای مجموعه داده ها می باشد.
معمولاً در انجام استنتاج داده 2 عملکرد وجود دارد :
1.فعالیت تشریحی که ویژگی های کلی داده های موجود را توضیح می دهد.
2.فعالیت های پیش بینی گر که سعی به پیش بینی بر مبنای نتایج مشخص حاصل از داده های قابل دسترس است.

نقشه های خود سازمانده (SOM) :
نقشه ها روابط موقعیت شناسی بین اشیاء را به طور فاصله ای نشان می دهند. دریافت نقشه کشی هویت ها و ویژگی هایی که در دنیای واقعی نزدیک به هم هستند روی نقشه هم نزدیک به هم ترسیم می شوند.
نقشه ها اغلب برای ارائه ی اطلاعات درباره محدوده های مناطق شهرنشینی کاربرد دارند، ترسیم نقشه کشی های سنتی محدودند چرا که تنها می توانند تصویر یک بعدی از ویژگی های اجتماعی محدوده جغرافیایی ارائه دهند.
SOM نوعی از شبکه های بدون بازنگری عصبی مصنوعی هستند. شبکه های عصبی از مفهوم "عصب" استفاده کرده تا داده ها را تحلیل کنند و این نورون ها در لایه هایی مرتب شده و به هم متصل هستند پاسخ نورون به داده همراه با استفاده تبدیل داده صورت می گیرد.
خروجی های SOM نقشه های توزیعی هستند. برخلاف نقشه های مصنوعی، نقشه های برجسته ی SOM در نمایش مجموعه داده های با ابعاد پیشرفته تری دارند.

SOM شمار سطر و ستون ها را به ماتریس داده ها کاهش می دهد. این روش ترکیبی از نمایش داده و تدریج سازی داده ها است با نقشه های خود سازمانده. خواننده نقشه می تواند تشابهات یا غیرتشابهات مکانها (اشیا) را بر مبنای مجاورت آنها مورد قضاوت قرار دهد. این رویکرد برخی ویژگی های مقیاس سنجی چند بعدی، رگرسیون و تحلیل خوشه ها را به اشتراک می گذارد. فرایند مشاهدات تنظیمی در SOM متفاوت بوده و فرایندی تصادفی بسته به ارزش دهی آغازی تصادفی نقشه است.
شکل 1 – اندازه نقشه خودسازنده

تطبیق نقشه های هم گذاری در فضاسازی توزیعی یا نقشه های آماری جغرافیایی کاربر را قادر به کشف گروه بندی سرشماری در نقشه های توزیعی با فضاسازی جغرافیایی می کند و بالعکس. برای مقایسه این دو نقشه مسافت میانگین بین تمامی جفت های واحدهای سرشماری و جفت های انباره (نورون) SOM را محاسبه کرده که معیار از پیش تعیین شده ای را ارائه کند. در این نقشه مسافت بین این موارد (نمونه ها) با مسافت میانگین بین تمامی مشاهدات واحدها مقایسه شده تا مقیاس نسبی پراکندگی را بدست دهد. این شاخص نسبی ساختاری مطابق فرمول زیر دارد :
در این فرمول dij مسافت اقلیدسی بین مشاهدات i و j است.

روش پیشنهادی :
در این مقاله روش پیشنهادی ما استفاده از یک الگوریتم خوشه­ای است.
الگوریتم خوشه ای ( فضاسازی چهار گوش کوچک) :
بیشتر الگوریتم های خوشه ای در داده های فضایی به محاسبه نتایج کمی فضای چهار گوش داده ها کمک می کند. فضاسازی چهار گوش کوچک با تکرار یک شکل برای پوشش سطح بدون فاصله یا روی هم افتادگی است.فضای چهار گوش کوچک مجموعه ای از صفحات غیر متقاطع دستی است که یک منطقه را پوشش دهی می کند که به قرار زیر تعریف می شود :

در الگوریتم های خوشه ای متفاوت، روش بخش بندی به طور گسترده برای پایگاه داده های عظیم و بویژه قابلیت های کاربردی GISمبنا استفاده می شود. خوشه بندی بخش ها شامل، بخش بندی پایگاه داده D از n شی در مجموعه k خوشه است. با دادن k، بخش خوشه k را که معیاز بهینه سازی است را پیدا کنید. در خوشه K-Modoid ، K از قبل مشخص شده و الگوریتم پارتیشن k از n شی را با استفاده از خوشه k بعنوان نقطه مرجع دریافتن غیر تشابهات با دیگر اشیا تعیین می کند.

پیاده سازی و بکار گیری روش پیشنهادی :
نقشه نیویورک سیتی:
نیویورک سیتی موضوع ایده آل بررسی روش های آمارگیری فاصله ای است.
SOM با استفاده از انتخاب تصادفی 50 درصد رشته های آماری صورت گرفت، پارامتری سازی هر مرحله تاثیر شگرفی روی نقشه منظم دارد.
پارامترهای مناسب SOM را طی آزمون و خطا انتخاب می کنیم.نقشه های نهایی طی فرایندهای متناوب انتخاب می شوند.
ماتریکس (u-ماتریکس) یک تجسم سازی از SOM است که مسافت بین نورون های مجاور در فضاسازی توزیعی است.

ماتریس u نشان می دهد که مسافت یا وجه های غیر مشابه بین بردارهای توصیفی در نورون های مجاور صورت گرفته که این ساختار خوشه را با توده ها یا تپه هایی در سطح مسافت نشان می دهند.
در شکل بالا خانه های تیره تر وجه های تشابهی با همسایگان خود دارند.
هر انباره در SOM مقدار منحصر به فردی برای 79 توزیع در مجموعه داده ها دارند. مولفه های سطح تراز از رنگ برای نشان دادن مخزن معین در متغییر واحد ورودی در هر نورون استفاده می کند.
بررسی تمام 79 مولفه سطح تراز به طوراصولی کاربر را قادر به تشکیل ویژگیهای دقیق هر نورون می کند.
رویکرد جایگزین عملکردی وارونه دارد یعنی با انتخاب رشته سرشماری یا گروه هایی از رشته ها با ویژگی های مشخص می توان نقشه برجسته SOM را بررسی کرد و سپس شخص می تواند اطلاعات مربوط به شهر مورد بررسی را استفاده کرده تا جغرافیایی نقشه های برجسته SOM را کشف کند.

در شکل بعدی رویکرد دوم SOM را بر مبنای جغرافیای نقشه اجتماع کرانه 8 را در یک نقطه تعریف شده SOM نشان می دهد و اینکه اجتماع کرانه 8 نسبتاً یک واحد متجانس اجتماعی سیاسی است و یکی از بزرگترین شهرهای موجود در نیمه جنوب شرقی سنترال پارک در منهتن است.
اکثر این 32 مسیر با 26 نورون ترسیم شده اند که در نقطه بالای سمت راست نقشه SOM بصورت یکجا آمده اند.
2 یا 3 نقطه دور افتاده قابل نمایان هستند که این نقاط مطابق مسیرهای سرشماری در جامعه کرانه 8 می باشد که شامل توسعه منازل عمومی است. سمت راست این سه نقطه مسیر ظهور شهرهای قدیمی کم درآمد است. دو نقطه دور افتاده شامل نمایش ظهور قشر کم کم درآمد است.
این مسیرها نشان می دهد که این مسیرها وجه تشابه زیادی با جوامع کرانه 8 دارند و معمولاً نزدیک به آن هستند. تفسیر این تصویر با آمارهای پراکندگی نسبی در نقشه های فضاسازی اجتماعی هستند که در جدول 1 می بینید.

ارزیابی و بحث :
نرم افزارهای GIS :
در تقدم آنالیز داده کاوی دو برنامه نرم افزاری برای ایجاد نماها و فرایندهای استنتاجی استفاده شده است. برای اجرای ویژگی های استنتاجی تصاویر ICV، نرم افزار FETEX کاربرد دارد. این برنامه توسط کارتوگرافی ژئوزیست محیطی و گروه تحقیقی دریافتی دوربرد در دانشکده مهندسی کارتوگرافی، زمین سنجی و سنجش مساحی عکس هوایی در دانشگاه های وانسیا بدست آمده است.
قابلیت برنامه نویسی در IDL 6.2 در تعمیم ENVI است و برای فعالیت های پوشش زمین را با مقایسه مجموعه داده های اخیر و اولیه تعیین کند. با استفاده از این نرم افزار دستیابی به بیش از 50 مشخصه پلات های اراضی کشت (ویژگی های طیفی، بافتی و ساختاری پلات تصاویر) ممکن است .با استفاده از نرم افزار SAGA GIS (سیستم آنالیز خودکار علوم زمین شناسی) و داده های ICV مرتفع (نقاط و منحنی های برجسته)، با استفاده از روش های مثلث بندی مساحی ایجاد شد و سپس DEM تبدیل به فورمت های تصویری با اندازه سلولی (2 در 2 متر) شد تا استنتاج تصاویر را تسهیل کند. پس SAGA GIS برای ایجاد و استنتاج تصاویر مربوط به DEM مفید است.

الگوریتم RBS و اندازه گیری aci :
در این مقاله بعد مسئله عرض است نه طول. پس در این مقاله مقیاس aci (شاخص نسبی توزیع) توسط الگوریتم RBS اجرا شده است.
RBS الگوریتمی است که اهمیت اصولی و مرز اطمینان برای طبقه بندی هر قانونی را در نقاط مشخص دارای اهمیت محاسبه می کند. A1 شامل قوانین مهم و تفکیک پذیر است. A2 شامل قوانین پایا و قابل پوشش دهی است و A3 شامل قوانین با پوشش نامطلوب است که برحسب اهمیت این الگوریتم مقیاس تجربی در نسبت های متغییرها را محاسبه می کند.

Aci مربوط به مجموعه قوانینی است که به صورت زیر نوشته می شود :

دستیابی به دانش جغرافیایی با استفاده از الگوریتم RBS :
با در نظر گرفتن10 متغییر در هر معادله، تنها 5 عدد ممکن می تواند ماکسیمم 100000 rule را بدست دهد و هنگامی که این معادله حاوی متغییرهای کاربردی زمین است این ساختار می تواند 16877276 rule برسد. این متغییرها که مربوط به رهاسازی است می تواند با استفاده از الگوریتم RBS انتخاب شود

تعریف زمین قابل کشت در بسیاری موارد با تعریف پدیده رهاسازی موجود در این مقاله هماهنگی دارد اما نمی تواند نواحی مرزی را تخمین بزند و به همین منظور متغییرهای کاربردی زمین را باید همواره با دیگر متغییرها ترکیب کرد. در تطبیق نمودار میله ای انباره می توان دریافت که پدیده رهاسازی کشت های زراعی بیشتر در زمین های دیمی صورت می گیرد. علاوه بر این تراکم جمعیت شهری مربوط به احتمال بالای رهاسازی است.
پدیده رهاسازی بیشتر مربوط به محدوده های کمتر از 1 هکتار می باشد.

نتیجه گیری :
مقایسه الگوها یا ساختارها در فضا سازی توزیعی و جغرافیایی سودمند است چرا که فرضیه های اصولی رویکرد اکولوژی انسانی را در آنالیزهای شهری روشن می سازد.
مشخصه پیچیدگی جمعیت های شهرنشینی طی نقشه کشی از دهه 1890 یکی از زمینه های تحقیق بوده است. با بیشتر شدن داده ها، تکنیک های آماری نیز تصحیح می شوند. نقشه خود سازمانده متعلق به طبقه جدیدی از رویکردهایی برای توصیف جمعیت های شهر نشینی است. هنگام ترکیب با سیستم های اطلاعات جغرافیایی (GIS)، شخص را قادر به فیلتر واقعیت های آمارگیری کرده است.
این مقاله تائید کرده است که الگوریتم / متریک aci ما را قادر به کشف مسائل ویژه جغرافی مثل پدیده رها سازی اراضی کشت می کند. برخی از متغییرهای بدست آمده از مجموعه های داده کاربری زمین (SIGPAC) مثل محدوده طرح با آبیاری مربوط به پدیده رهاسازی است. علاوه بر این، شاخص زندگی نباتی (NDVI) و شاخص توپوگرافی رطوبت یا متغییرهای کاربردی متنوع مثل مشتق اول ریشه برای توضیح برخی جنبه های پدیده رهاسازی ضروری است.

منابع
Modelling farmland abandonment: A study combining GIS and data mining techniques – B. Zaragoz, A. Rabasa, J.J. Rodr guez-Sala, J.T. Navarro, A. Belda, A. Ramn (2012)
Social area analysis, data mining, and GIS – Seth E. Spielman, Jean-Claude Thill (2008)
A GIS (geographical information system)-based spatial data mining approach for optimal location and capacity planning of distributed biomass power generation facilities: A case study of Tumkur district, India – Deepak Paramashivan Kaundinya, P. Balachandra, N.H. Ravindranath , Veilumuthu Ashok (2013)

با تشکر
با تشکر از استاد گرامی جناب دکتر مجید خلیلیان و دوستان که وقت گران قدر خود را برای بنده ی حقیر قرار دادند.
24


تعداد صفحات : 25 | فرمت فایل : pptx

بلافاصله بعد از پرداخت لینک دانلود فعال می شود