1
اسپم تصویر یا Image spam
2
فهرست مطالب
تعریف اسپم تصویر
تکنیک های موجود در ایجاد اسپم تصویر
روشهای مقابله با اسپم تصویر
بررسی سه روش مقابله با اسپم
نتیجه گیری
منابع
3
تعریف اسپم تصویر
جاسازی پیام های متنی اسپم در محتوای گرافیکی فایل تصویر
بدنه ایمیل
الصاق تصاویر در ایمیل
لینک ها
هدف:
دور زدن سیستم های ضد اسپم
4
تعریف اسپم تصویر(ادامه)
ایجاد مشکل برای کاربران
حجم ایمیل اسپم کمتراز 5k مضرات اسپم تصویر: پهنای باند
حجم تصاویر اسپم بیشتراز12k هزینه مربوط به سرورها
5
تعریف اسپم تصویر(ادامه)
به سرعت مشهور شدند.
آغاز روش در سال 2004
6
7
تعریف اسپم تصویر(ادامه)
8
تکنیک های موجود در ایجاد اسپم تصویر
مبهم و تاریک کردن
غلط املایی
چرخاندن متن
اضافه کردن سایه
تاری خطوط متن
اضافه کردن noise
9
تکنیک های موجود در ایجاد اسپم تصویر(ادامه)
فقط متن
استخراج متن از تصویر
هزینه محاسباتی بالا
10
تکنیک های موجود در ایجاد اسپم تصویر(ادامه)
بخش های چندگانه
تقسیم بندی یک کلمه در تصاویر مختلف
11
تکنیک های موجود در ایجاد اسپم تصویر(ادامه)
تصاویر دست نوشته
تلاش در مخفی کردن متن از سیستم های ضد اسپم
12
تکنیک های موجود در ایجاد اسپم تصویر(ادامه)
پس زمینه های عجیب
استفاده از اشکال هندسی
13
تکنیک های موجود در ایجاد اسپم تصویر(ادامه)
واریانس هندسی
14
تکنیک های موجود در ایجاد اسپم تصویر(ادامه)
کارتون
15
تکنیک های موجود در ایجاد اسپم تصویر(ادامه)
استفاده از تصاویر طبیعی
16
تکنیک های موجود در ایجاد اسپم تصویر(ادامه)
فونت تکه ای
17
روشهای مقابله با اسپم تصویر
طبقه بندی بر اساس محتویات
طبقه بندی بر اساس مشخصه های متن
طبقه بندی بر اساس ویژگی های تصویر
18
روش اول
استفاده از روش شبکه های عصبی مصنوعی
یک متد بهینه classification
استفاده برای حل مسائل استخراج ویژگی
در دهه های اخیر بیشتر و بیشتر مورد توجه قرار گرفته است.
برای آموزش داده های پیچیده مفید است.
کار سریع با تعداد زیادی داده.
یک نورون ورودی،یک نورون خروجی و چند لایه پنهان
هر نورون دارای وزن ارتباط هست.
19
روش اول(ادامه)
استفاده از 5000 تصویر
JPEG, GIF, PNG ,BMP
جمع شده توسط Giorgio Fumera
استخراج ویژگی:
هیستوگرام رنگ، توزیع رنگ در یک صفحه را نشان می دهد:
مزایای استفاده:
به راحتی قابل محاسبه است.
در اسپم ها طیف وسیعی از رنگ ها استفاده نمی شود.
میانگین تعداد بلاک ها در یک تصویر:
تغییر سایز تصاویر 256*256
20
روش اول(ادامه)
تقسیم بندی تصویر به چندین بلاک بر حسب شباهت پیکسل ها
محاسبه mean value برای بلاک
یک روش supervised
آموزش سیستم در ده بار.
80/20 برای آموزش و تست
21
روش اول(ادامه)
ارزیابی
22
روش اول(ادامه)
ارزیابی
23
یک روش ساده
تعریف:
ابتدا مشخص شود که آیا ایمیل اسپم هست یا خیر؟
اگر ایمیل در whitelistقرار دارد،ایمیل قانونی است.
در زمانی که 35 درصد از ایمیل های اسپم، تصاویر اسپم بودند، 70 در صد پهنای باند اشغال شدند.
24
یک روش ساده(ادامه)
ایده:
به طور معمول در دسته های بزرگ ارسال می شوند.
شناسایی برخی از اسپم ها با روش سنتی و پس از آن استفاده از هیستوگرام و ویژگیهای فایل.
الگوریتم بسیار سریع است،زیرا متن را استخراج نمی کند.
25
یک روش ساده(ادامه)
هر 5 ویژگی یک سهم را دارند.
هزینه ی محاسباتی این 5 ویژگی کم است.
26
27
یک روش ساده(ادامه)
28
روش سوم
قابلیت روش آنتی اسپم واحد بیش از حد محدود است.
ترکیب روش های کنونی
استفاده از یک روش سلسله مراتبی
قرار دادن پیچیده ترین راه حل در قسمت آخر OCR
29
روش سوم(ادامه)
30
روش سوم(ادامه)
31
روش سوم(ادامه)
ویژگی ها
احتیاج به هر لایه در صورتی که لایه قبلی قادر به تشخیص نباشد.
کاهش حجم محاسباتی
32
روش سوم(ادامه)
روش بیزین:
مرحله آموزش:احتمال اسپم بودن هر لغت
مرحله تست:محاسبه احتمال اسپم بودن ایمیل و مقایسه آن با مقدار threshold
33
روش سوم(ادامه)
:Text Localization Layer
Edge extraction
Corner detection
edge classification
text region refmement
34
روش سوم(ادامه)
531 ایمیل
202 دارای متن و تصویر
329 فقط متن
آموزش بیزین و از بقیه برای ارزیابی کارایی سیستم
استفاده از سه دیتاست عمومی
35
روش سوم(ادامه)
36
روش سوم(ادامه)
37
روش سوم(ادامه)
38
نتیجه گیری
اسپم تصویر یکی از پیچیده ترین روش ها است.
پیچیدگی محاسباتی بالا
هزینه محاسبه بالا
تنوع زیاد
39
منابع
[1] P.He, X.Wen, W.Zheng. A Simple Method for Filtering Image Spam. In!. Conf. on Computer and Information Science,China 2009.
[2]A.Attar,R.Moradi Rad,R.Ebrahimi Atani. A survey of image spamming and filtering techniques. Artif Intell Rev (2013) 40:71–105.
[3]X.Mang Li,U.Mo Kim. A Hierarchical Framework for Content-based School of Information and Communication Engineering.Image Spam Filtering,China 2012.
[4]M. Soranamageswari, Dr. C. Meena. Statistical Feature Extraction for Classification of Image Spam Using Artificial
Neural Networks ,Int. Conference on Machine Learning and Computing
Systems, India, 2010.
40
متشکرم از توجه شما
41