تارا فایل

پاورپوینت کلان داده Big Data


بسم الله الرحمن الرحیم

مقدمه‏ای بر Big Data
استاد : دکتر فاطمه شبستری
ارایه کننده:علیرضا بازاری

فهرست مطالب
1
Big Data چیست؟
چرا Big Data؟
چالش‏های پیشه‏روی Big Data
آینده‏ی Big Data
جنبش NoSQL
انواع NoSQL
MapReduce
Hadoop

Big Data چیست؟
2
معنای لغوی
کلان داده
داده‏های حجیم
بزرگ داده
تعریف
تعریف واحدی وجود ندارد!
دو عنصر اصلی در تمامی تعریف‏ها
وجودِ حجم زیادی از داده‏ها
ناتوانیِ پایگاه‏های داده سنتی در مدیریت داده‏ها

Big Data چیست؟
3
ویژگی‏ها
حجم داده‏ها
Big Data

Big Data چیست؟
4
حجم داده‏ها(Volume)
تا سال 2003 حجم کل داده‏های موجود، حدود 5 اگزابایت بوده است
امروزه در هر دو روز، حدود 5 اگزابایت داده تولید می‏شود
گزارش IBM
تولید 2.5 اگزابایت داده در روز
تولید 90 درصد کل داده‏های موجود در دو سال اخیر

0.8 Zb
35.2 Zb
رشدی 44 برابری
2009
2020

Big Data چیست؟
5
حجم داده‏ها(Volume)
تا سال 2003 حجم کل داده‏های موجود، حدود 5 اگزابایت بوده است
امروزه در هر دو روز، حدود 5 اگزابایت داده تولید می‏شود
گزارش IBM
تولید 2.5 اگزابایت داده در روز
تولید 90 درصد کل داده‏های موجود در دو سال اخیر

EXA
218

PETA
215

TERA
212

ZETTA
221
GIGA
29

2018
2015
2012
2003

Big Data چیست؟
6
حجم داده ها(Volume)

Big Data چیست؟
7
نمونه‏ها
فیسبوک (1392)
بیش از یک میلیارد کاربر
بیش از 300 پتابایت داده
اضافه شدنِ بیش از 50 ترابایت داده در روز
بیش از 35 درصد از کلِ تصاویر دنیای مجازی

گوگل (1390)
بیش از صد پتابایت داده
بیش از 1000 میلیارد صفحه وب
حدود 7.2 میلیارد جست‏وجو در روز

Big Data چیست؟
8
نمونه‏ها
یوتیوب (1393)
بیش از یک اگزابایت داده
بازدیدِ بیش از یک میلیارد کاربر در ماه
80 درصد ترافیک خارج از آمریکا
اضافه شدن صد ساعت فیلم در دقیقه
توییتر (1393)
حدود یک میلیارد کاربر
بیش از 124 میلیارد توییت در سال
حدود 4500 توییت در ثانیه
271 میلیون کاربر فعال در ماه

Big Data چیست؟
9
نمونه‏ها
شبکه‏های حسگر
سازمان‏های هواشناسی
دستگاه‏های پزشکی
بیوانفورماتیک
سازمان‏های بزرگ
و …

Big Data چیست؟
10
ویژگی‏ها
Big Data
حجم داده ها
تنوع در داده‏ها

Big Data چیست؟
11
تنوع در داده‏ها(Variety)
داده‏های ساختارمند (Structured)
داده‏هایی که دارای ساختارِ مشخصی هستند
رشته ها
اعداد
تاریخ
و…
حدود 20 درصد از کل داده‏های موجود، ساختارمند هستند
استفاده از پایگاه‏های داده‏ی رابطه‏ای

Big Data چیست؟
12
تنوع در داده‏ها(Variety)
داده‏های ساختارمند (Structured)
داده‏های نیمه ساختارمند (Semi-Structured)
ساختاری سازگار و مشابه ندارند
XML
Tweets
SGML
Logs
و …
عدم امکان استفاده از پایگاه های داده ی رابطه‏ای

Big Data چیست؟
13
تنوع در داده‏ها(Variety)
داده‏های ساختارمند (Structured)
داده‏های نیمه ساختارمند (Semi-Structured)
داده‏های فاقد ساختار (Unstructured)
فاقد هرگونه ساختاری هستند
داده‏های چند رسانه‏ای (فیلم، صوت و …)
ایمیل‏ها
گزارشات
ارائه‏ها
و ….
حدود 70 تا 90 درصد از کل داده‏های موجود

Big Data چیست؟
14
تنوع در داده ها(Variety)

Big Data چیست؟
15
ویژگی‏ها
Big Data
حجم داده‏ها
تنوع در داده‏ها
رشد سریع داده‏ها

Big Data چیست؟
16
رشد سریع داده‏ها (velocity)
سرعت بالا در تولیدِ داد‏ه‏های جدید

Big Data چیست؟
17
رشد سریع داده‏ها (velocity)
سرعت بالا در تولید داده‏های جدید
سرعت بالا در ایجاد پرس و جوها

تجهیزات علمی
شبکه‏های حسگر

Big Data چیست؟
18
پیچیدگی (complexity)
تغییرپذیری (Variability)
و …
Big Data
حجم داده‏ها
تنوع در داده‏ها
رشد سریع داده‏ها
3V’s
ویژگی‏ها

چرا Big Data؟
19
رشد روز افزون ظرفیت ادوات ذخیره سازی

چرا Big Data؟
20
رشد روز افزون ظرفیت ادوات ذخیره سازی
افزایش چشم‏گیر قدرت پردازشی سیستم‏ها

چرا Big Data؟
21
رشد روز افزون ظرفیت ادوات ذخیره سازی
افزایش چشم‏گیر قدرت پردازشی سیستم‏ها
افزایش حجم داده‏های موجود

چالش‏های پیش‏روی Big Data
22
عدم کارایی روش‏های سنتی تحلیل اطلاعات
تحلیل داده
امنیت و حریم شخصی
مشکلات فنی و پردازشی

آینده‏ی Big Data
23
Big Data در Google Trend

آینده‏ی Big Data
24
Big Data در Google Trend

آینده‏ی Big Data
25
جایگاه پژوهشی Big Data از نظر موسسه‏ی گارتنر

چه تکنولوژی برای Big Data وجود دارد ؟

استفاده از یک مدل بدون ساختار و توزیع شده

دلیل استفاده از این مدل
26

جنبش NoSQL
27

تاریخچه
Not Only SQL

NoSQL بیان نمی کند که SQL هیچگاه نباید استفاده شود و یا مرده است

مثال هایی از پایگاه داده های غیر رابطه ای
Company LOGO
28

جنبش NoSQL – Key Value
29
1 – ذخیره سازی Key – Value :

مدل داده ای : مجموعه ای از زوج های کلید – مقدار
مثال : Tokyo , Redis , Voldemort

جنبش NoSQL – Column
30
2 – ذخیره سازی ستون محور:

مدل داده ای : ذخیره سازی ستون ها به جای سطرها
مثال : Cassandra, HyperTable, HBase

جنبش NoSQL – Document
31
3 – ذخیره سازی سندگرا:

مدل داده ای : مجموعه ای از مجموعه ی کلید – مقدارها
مثال : CouchDB , MongoDB

جنبش NoSQL – Graph
32
4 – ذخیره سازی گراف :

مدل داده ای : گره ها، ارتباط ها، کلید – مقدار روی هرکدام
مثال : Sones, AllegroGraph , Neo4j

مثال هایی از پایگاه داده های غیر رابطه ای
Company LOGO
33

مقایسه فریم ورک های NoSQL
34
MySQL
MongoDB یا CouchDB
Neo4j

Map Reduce
Company LOGO
35

Hadoop
36

Hadoop ، همان VMware هست اما در راهی متفاوت

تفاوت Hadoop و ماشین مجازی
Company LOGO
37
Hadoop

1. چند سرور فیزیکی را می گیرد
2. آنها را با هم ترکیب می کند
3. یک سرور بزرگ مجازی ارائه می دهد
Vmware

1. یک سرور فیزیکی می گیرد
2. آن را می شکند
3. چند سرور مجازی ارائه می دهد

نتیجه گیری
38

نمی توان با قاطعیت گفت که یک فریم ورک NoSQL
مختص یک کار است

منابع
Company LOGO
39
1 – http://www.economistinsights.com/sites/default/files/downloads/ EIU_SAS_BigData_4.pdf
2 – http://en.wikipedia.org/wiki/MapReduce
3 – http://en.wikipedia.org/wiki/NoSQL
4 – http://www.ibm.com/big-data/us/en/
5 – Marco Grobelink,Jozef stefan Institute,Big-Data Tutorial, 2013.

پرسش و پاسخ
40


تعداد صفحات : 42 | فرمت فایل : pptx

بلافاصله بعد از پرداخت لینک دانلود فعال می شود