تارا فایل

پروژه اولیت بندی پست الکترونیکی به وسیله بررسی شبکه اجتماعی


عنوان:
اولیت بندی پست الکترونیکی به وسیله بررسی شبکه اجتماعی

خلاصه
مفهوم: اعتماد و قابلیت اطمینان مسائل مهمی در ارتباط آنلاین هستند . به علت گسترش سریع شبکه های اجتماعی آنلاین ارتباط آنلاین به وسیله فعل و انفعالات اجتماعی قویتر شده و به یک مدل ارتباطی تبدیل میشود.هنوز هم ارتباط پست الکترونیکی راجب به پیام های ناخواسته بحث میکند.
مقصود : در این پایان نامه هدف بررسی کردن چگونگی اولویت گذاری پست الکترونیکی بین گیرنده ها و فرستنده ها به وسیله استفاده از اطلاعات شبکه اجتماعیs است.
روش ها: یک الگوریتمی برای محاسبه اعتماد معرفی شده است که به وسیله اندازه گیری اثر متقابل کاربران و شباهت شبکه های اجتماعی آنلاین کار میکند و این اعتماد به وسیله الگوریتم دیگری برای اولویت بندی صندوق ورودی پست الکترونیکی استفاده میشود.
نتایج : یک ارزیابی از روش انتخاب شده به وسیله یک مورد قابل مطالعه انجام شده است و خطای پیشبینی این روش با خطای پیشبینی بازخورد تصادفی مقایسه شده بود.خطای این روش به طور قابل ملاحظه ای کمتر از بازخورد تصادفی است
استنتاج ها : این پایان نامه یک بررسی را به وجود می آورد روی اینکه چگونه از اطلاعات اجتماعی برای اولویت بندی پست الکترونیکی استفاده کنیم . با توجه به این بررسی روشی برای قابل اطمینان بودن ارتباط پست الکترونیکی به وسیله استخراج کردن اطلاعات از شبکه اجتماعیs مطرح شده است. این اطلاعات برای محاسبه رتبه اعتماد بین دو دوست شبکه اجتماعی استفاده میشود.در این پایان نامه پیشنهاد میشود که اولویت بندی به وسیله روش انتخاب شده قابل دستیابی است.

1-1- مقدمه
اعتماد و اطمینان مسائل مهمی در ارتباط آنلاین هستند . همانطور که وب از روی شبکه های اجتماعی برای شبیه سازی یک جامعه مجازی تقلید میکند ارتباط آنلاین به وسیله یکپارچگی اثر متقابل اجتماعی به مدل ارتباطی توانمندتری تبدیل میشود.با این حال سیستم های ارتباطی کاربر به کاربر در برابر پیام های ناخواسته آسیب پذیر هستند . این امکان پذیر است که این آسیب پذیری را به وسیله بهبود مدیریت پیام های دریافتی حل کرد. شبکه اجتماعیها از قبیل Facebook, My Space , Orkut و LinkedIn توجه میلیون ها کاربر را به خود جلب کرده اند. در نتیجه محققان شروع به تشخیص بالقوه استفاده از اطلاعات اجتماعی آنلاین برای نظارت بر کمبود اعتماد در ارتباط پست الکترونیکی کرده اند .در این پایان نامه واژه اعتماد در ارتباط پست الکترونیکی به اعتبار پیام های وارد شونده با توجه به نقطه نظر گیرنده اشاره میکند. برخلاف وب سنتی OCN ها روی ارتباط بین اشخاص و علایق معمولشان تمرکز میکنند. با پیوستن به شبکه های اجتماعی مردم میتوانند دیگران را ملاقات کنند و رابطه شان را به وسیله انواع گوناگون ارتباطات ( به عنوان دوست و طرفدار و یا لیست تماس) شروع کنند. یک مزیت شبکه های اجتماعی این است که کاربران میتوانند از آنها برای ارتباط برقرار کردن با نه تنها دوستان بلکه دوستان دوستانشان استفاده کنند. اینگونه ادعا شده است که یک شخص انتزاعی در دنیا به شخص انتزاعی دیگری به وسیله زنجیره کوتاهی از آشنایی های اجتماعی متصل شده است[1]. با توجه به این ادعا و اینکه شبکه اجتماعی ها از شبکه های اجتماعی دنیای واقعی پیروی میکنند این به طور نظری امکان دارد برای یک کاربر شبکه اجتماعی که بتواند به هر کاربر دیگری در شبکه از میان میانگینی از شش دوست میانجی متصل شود [2]. عده زیادی از مردم روزانه به شبکه اجتماعی ها برای بروز رسانی پروفایل خود و یا به اشتراک گذاری اطلاعات و یا برای ارتباط متقابل با یکدیگر وصل میشوند.بنابرین کاربران امکانات بسیار زیادی برای کشف ارتباطات دوست جدید همانند ارتباطات تجاری دارند.اخیرا شبکه اجتماعی ها مقدار زیادی از اطلاعات را راجب علایق کاربران و رابطه متقابلشان شامل میشوند اما این اطلاعات به حد کامل برای بهبود بخشیدن ارتباط کاربر به کاربر به کار گرفته نشده اند.
در ارتباط پست الکترونیکی روزانه ما مجبوریم با تعداد زیادی از پیام ها از افراد مختلف روبرو شویم . در یک دنیای درحال رشد سریع ما وقت خیلی کمی داریم برای اینکه تصمیم بگیریم کدام یک را اول بخوانیم . ما ممکن است بعضی از فرستنده ها را بشناسیم و به آنها به طور متفاوتی اعتماد داشته باشیم .در نتیجه ما تصمیم میگیریم که تعدادی از پیام ها را زودتر بخوانیم به علت رابطه اجتماعی . این پایان نامه اعتماد را از شبکه اجتماعیها به یک مدلی برای اولویت گذاری پست های الکترونیکی تبدیل میکند.این فعالیت برای بهبود بخشیدن مدیریت صندوق ورودی پست الکترونیکی میتواند استفاده میشود. در نتیجه این فعالیت میتواند اطمینان و کارامدی ارتباط پست الکترونیکی را بهبود بخشد.علاوه بر آن این فعالیت اولویت بندی پست الکترونیکی را در داخل صندوق ورودی بر پایه رتبه اعتماد بین فرستنده و گیرنده انجام میدهد.

1-2-شرح مشکل
سوال تحقیقاتی این است که چگونه به بهترین نحو از اطلاعات اجتماعی برای اولویت بندی پست الکترونیکی بین کاربران استفاده کرد .اطلاعات راجب به روابط کاربران در شبکه اجتماعی ها هنوز محدود است.برای مثال رابطه بین اعتماد و اثر متقابل کاربر همانند اعتماد و شباهت ممکن است در شبکه اجتماعی ها متفاوت از واقعیت باشد. درک این تفاوت و مفهومش یک سوال باز است . پیشنهاد میشود که کاربران مشابه به همدیگر بیشتر ازهر کاربر تصادفی اعتماد دارند . این مطلب میتواند مورد بحث قرار بگیرد که زندگی وابسته به اینترنت زندگی اجتماعی واقعی را توضیح میدهد و بنابرین این برای شبکه اجتماعی ها هم صدق میکند. این مطلب نیز وجود دارد که مردم به کسانی که با آنها روابط متقابل دارند اعتماد میکنند. مشکل فهم اعتماد بین مردم بر اساس زندگی اجتماعی آنلایشان مشکل است: واژه اعتماد به طور مبهمی مورد استفاده قرار گرفته است و پیشبینی تصمیمات کاربران به وسیله بررسی روابط متقابل آنلاینشان مشکل است. در شبکه اجتماعی های امروزی روابط به وسیله متغیر دودویی تعریف میشوند: یا دو کاربر دوست هستند یا نیستند و هیچ درجه دوستی وجود ندارد.برای اولویت بندی ایمیل ها بسته به رابطه شبکه اجتماعی وسایل مناسب برای استخراج و استفاده از اطلاعات اجتماعی باید شناسایی شوند.

1-3-اهداف و مقاصد

هدف بررسی چگونگی اولویت بندی ایمیل ها بین گیرنده ها و فرستنده ها به وسیله استفاده از اطلاعات شبکه اجتماعی است. اولین مقصود آزمایش رابطه بالقوه بین اعتماد و اطلاعات اجتماعی است . دومین مقصود محاسبه رتبه اعتماد بین گیرنده و فرستنده بر اساس روابط متقابل اجتماعی و شباهت آنها است . سومین مقصود ایجاد روشی است که بتوان از اعتماد برای اولویت بندی پیام ها در ارتباطات ایمیلی استفاده کرد که بتوان این ارتباطات را رد کرد یا یک اولویت پایین را به پیام های فرستاده شده از کاربران با سطح پایینی از اعتماد اختصاص داد . آخرین مقصود ارزیابی روش انتخاب شده در مورد جهان واقعی است.

1-4-همکاری

این پایان نامه نوعی بررسی را روی چگونگی استفاده از اطلاعات اجتماعی برای اولویت بندی ایمیل به وجود می آورد . این پایان نامه دو الگوریتم را معرفی میکند : یکی برای محاسبه رتبه اعتماد بین دو دوست شبکه اجتماعی برای اولویت بندی ایمیل .اولویت بندی ایمیل ها بستگی به محتوای پیام ها ندارد بلکه وابسته به فرستنده و اعتماد او نسبت به گیرنده است.به نظر میرسد که روش یکسان دیگری برای این کار وجود دارد که توسط بانکس و وا معرفی شد [3].ورودی هر دو روش از فیس بوک استخراج شده است اما یک تفاوت ابتدایی بین این روش ها وجود دارد . در روش بانکس وزن روابط متقابل به وسیله ارزیابی انسانی محاسبه شده است . در مقابل این پایان نامه یک روشی را مطرح میکند که در آن کاربران به وسیله نرخ بندی ایمیل هایی که از طرف دوستانشان در فیس بوک دریافت میکنند همکاری میکنند. این مزیت به این معناست که کاربران دقیقا فرستندگان را به وسیله نرخ بندی ایمیل ها بدون نیاز به مکانیزمی برای نگاشت پاسخ ها به مزیت های کاربران نرخ گذاری میکنند. همکاری نهایی یک ارزیابی از روش انتخاب شده به وسیله آنالیز تجربی است.

1-5-طرح کلی

در فصل بعدی روش های موجود برای جلوگیری از ارتباطات ایمیلی ناخواسته و کارهای مربوط به آن توصیف خواهند شد. در بخش 3 پایه نظری و شاخصه های اعتماد و مدل های حسابی اعتماد و آنالیز نظری طرح ریزی خواهند شد. بخش 4 دربردارنده روش شناسی تحقیقاتی و الگوریتم ها و فرمول های اتخاذ شده و مورد مطالعه است. بخش 5 نتایج را به نمایش میگذارد و بخش 6 بحثی را راجب مدل انتخاب شده نشان میدهد.بخش 7 بر تهدیدهای اعتبار نظارت دارد و آخرین بخش نتیجه گیری و اشاره گرهایی را برای کار آینده نشان میدهد.

1-6-پیش زمینه

در طول 40 سال اخیر روش هایی که در آن مردم با هم ارتباط برقرار میکنند چندین بار تغییر کرده است. در سال 1971 اولین ایمیل در طول یک شبکه ارسال شد. اولین سرویس پیام کوتاه در سال 1992 فرستاده شده بود و اولین شبکه اجتماعی اصلی در سال 1997 شروع به کار کرد . ایمیل و شبکه اجتماعی ها دو فرم اخیر ارتباط معاصر را نشان میدهند . ده سال پیش مردم به صورت آنلاین با هم ارتباط داشتند عمدتا به وسیله استفاده از ایمیل ها اما امروزه ایمیل ها فقط یک نوع ارتباط دیجیتال را نشان میدهند .همانطور که وب تعاملی تر میشود پیام های ناخواسته به یک مشکل سراسری تبدیل میشوند.پیام های ناخواسته از مرز ایمیل ها هم گذشته و حتی کاربران شبکه اجتماعی ها هم به وسیله درخواست ها و پیام های دوستان ناخواسته هدف قرار گرفته شده اند .این بحران منجر به مطالعاتی وسیع برای راه حل های بالقوه شده است که از تکنیک های کارامد فیلترینگ اسپم گرفته تا شبکه های اجتماعی برای مبارزه با پیام های ناخواسته را شامل میشود.
به طور سنتی تکنیک های تشخیص اسپم از قبیل سیستم های فیلترینگ وابسته به متن استفاده میشدند تا گیرنده ها را از کار خسته کننده تشخیص ایمیل های معتبر از اسپم ها در صندوق ورودی مصون نگه دارند.چنین تکنیک هایی در فیلترینگ تعداد زیادی از پیام های اسپم موفق بوده اند اما آنها بسیاری از پیام های معتبر را هم مسدود میکنند . تکنیک های قبول ایمیل ازجمله لیست سفید برای بهبود فیلترینگ اسپم مورد تحقیق قرار گرفته اند. اگرچه لیست های سفید در مسدود کردن پیام های ناخواسته موثر هستند و میتوانند در جلوگیری از مسدود کردن پیام های معتبر مفید باشند اما آنها بدون خطا نیستند. اولین مشکل این است که لیست های سفید محدود کننده هستند وقتی که ارتباط بین مردمی باشد که همدیگر را میشناسند . دومین مشکل آن است که کاربران مسئول ایجاد و ثبات لیست های سفید هستند. و در پایان اینکه لیست های سفید عمدتا ایمیل های معتبر را به عنوان پیام های اولویت پایین دسته بندی میکنند.بنابرین در حضور اسپم این کار هنوز دشوار است که بتوان پیام های معتبر را پیدا کرد . با افزایش محبوبیت شبکه اجتماعی ها بعضی روش ها به استفاده از شبکه های اجتماعی برای فیلتر کردن پیام ها تغییر کرده اند.همانند جامعه واقعی اعتماد درون شبکه اجتماعی ها وجود دارد.بنابرین این امکان دارد که از اعتماد بین کاربران در شبکه اجتماعیها استفاده کرد تا بتوان با بلاتکلیفی ها و پیچیدگی های روابط متقابل اجتماعی روبرو شد. این عقیده به وسیله گلدبک و هندلر [4] تحقیق شده است.
درجامعه ما مردم عمدتا به یکدیگر اعتماد دارند بسته به دانش ابتدایی که از هم دارند , تجربه شخصی گذشته شان ,تجربه دیگران و یا ترکیبی از این عوامل. در شبکه اجتماعی ها اطلاعات راجب اعتماد به چندین طریق میتواند برای کاربر فراهم شود اما معمولا هدف این است که به کاربر توصیه کرد که در چه حدی به کاربران دیگر اعتماد کرد. در سیستمی که توسط عبدالرحمان و هایلس فراهم شده است افراد میتوانند راجب مورد اعتماد بودن دیگران تصمیم بگیرند و وابسته به شخص ثالثی نیست. در مدلی که توسط یو و سینگ مطرح شده است عاملان اعتماد را به وسیله اطلاعات اعتباری که از دیگر عاملان دریافت میکنند تعیین میکنند.عقیده ای که چگونه میتوان اطلاعات اعتبار را از یک شخص و دیگران جمع آوری کرد به وسیله ساباتر و سی یرا مطرح شده است.عبدالرحمان و هایلس پیشنهاد میکنند که در یک زمینه از پیش تعریف شده کاربران اتصالات اجتماعی را با افرادی که اولویت یکسانی دارند گسترش میدهند.

1-7-اصطلاحات فنی

اهمیت اعتماد در زندگی اجتماعی به طور وسیعی به وسیله علوم اجتماعی متنوعی مدنظر قرار گرفته است مانند : روانشناسی ,جامعه شناسی , فلسفه و اقتصاد .تعریف اعتماد مشکل است چون به طور مبهمی در مفهوم های متفاوتی به کار رفته است. همانطور که اعتماد یک واقعه اجتماعی است هر مدل محاسباتی اعتماد هم نیاز دارد که بر پایه شاخصه های دنیای واقعی باشد.ابتدا نماد سازی اعتماد باید واضح سازی شود به وسیله استفاده از تعریفی از گمبتا [5]:

اعتماد یک سطح ویژه ای از احتمال است که در آن کاربری که دیگری را ارزیابی میکند عمل خاصی را انجام میدهد قبل از اینکه بتواند چنین عملی را نظارت کند و در یک مفهوم به طوریکه عمل خودش را تحت تاثیر قرار میدهد.

عبارت سطح احتمال نشان میدهد که سطح های متفاوتی از اعتماد بین کاربران وجود دارند . برای جلوگیری از تناقض از این پس یک سطح بالا از اعتماد به عنوان بهتر خطاب میشود : هر چه سطح اعتماد بالاتر باشد شخص مورداعتماد تر است.به طور ویژه در مفهوم این پایان نامه واژه اعتماد اعتبار اطلاعات در پیام از نقطه نظر گیرنده است. آنالیزگران شبکه های اجتماعی از روابط به عنوان موانع درحال ساخت دنیای اجتماعی یاد میکنند . در شبکه های اجتماعی تمرکز بر روی اتصالات بین مردم است برای ایجاد یک اندازه گیری که مکان هر شخص درون ساختار همه روابط را نشان میدهد.شبکه اجتماعی ها سرویس های وابسته به وبی هستند که به اشخاص اجازه میدهند یک پروفایل عمومی در یک سیستم کراندار ایجاد کنند که لیست کاربران دیگری را که اتصالی را به اشتراک میگذارند نشان میدهد و همچنین لیست کاربران متصل را نشان میدهد.یک گره ( یعنی یک راس یا یک عامل و یا یک آیتم) یکی از اعضای اصلی شبکه اجتماعی ها میباشد.یک گره میتواند نماینده مردم یا گروهها و یا سازمان و یا دولت و غیره باشد. یک بند (یعنی یک لبه یا یک پیوند یا یک اتصال و یا یک رابطه) یکی دیگر از اعضای شبکه اجتماعیها است. یک بند دو گره را به هم وصل میکند و این یک رابطه ای را بین کاربران در شبکه اجتماعی ها نشان میدهد.تئوری شبکه اجتماعی و بررسی انجام شده روی آن از تئوری گراف گرفته شده است.در علم کامپیوتر تئوری گراف مطالعه گراف ها و ساختار ریاضی وار استفاده شده برای مدل سازی روابط جفت به جفت بین اشیا از یک مجموعه مشخص میباشد.گراف در این مفهوم به مجموعه گره ها اشاره میکند و مجموعه ای از یال ها که جفت های گره ها را به هم وصل میکند. با استقاده از بررسی شبکه ای این ممکن است که بتوان مجموعه های پیچیده روابط را به عنوان گراف هایی از گره های متصل به هم نشان داد و اندازه و شکل و چگالی کل شبکه را محاسبه کرد.در فیس بوک که به عنوان مورد مطالعه ما در این پایان نامه استفاده میشود رابطه بین کاربران دوستی نامیده میشود . با توجه به این یک بند وجود دارد وقتی که دو کاربر با هم دوست هستند. در زندگی واقعی دوستی درجه ای از صمیمیت و اعتماد را دارد .بنابرین همه دوستان با توجه به قدرت دوستی با هم مساوی نیستند.در فیسبوک مردم یا دوست هستند و یا نیستند : هیچ سطحی از اعتماد و صمیمیت وجود ندارد . دو نوع بند وجود دارد : غیر مستقیم و مستقیم . یک بند مستقیم ( یعنی بند غیر متقارن) یک منشا واضح دارد و گره های مقصدی مشخص شده دارد و در یک گراف به عنوان خطی با یک پیکان از گره منشا به گره مقصد نشان داده شده است . یک بند غیر مستقیم (یعنی بند متقارن) بین دو گره وجود دارد بدون هیچ منشا و یا مقصدی ودر گراف به عنوان خطی بدون هیچ پیکانی بین دو گره نشان داده شده است.این بند همچنین میتواند بدون وزن و یا وزن دار باشد . یک بند بدون وزن (یعنی یک بند دودویی)فقط وجود یک رابطه را نشان میدهد.از طرف دیگر یک بند وزن دار اطلاعات بیشتری را راجب یک رابطه میدهد.که دربردارنده ارزشهای مرتبط با هر گره است که قدرت هر بند را مشخص میکند.

یک پروفایل کاربری در مفهوم شبکه اجتماعی مجموعه ای از اطلاعات راجب یک کاربر مشخص است که دربردارنده اطلاعات شخصی علایق فعالیت ها و دوستان او میشود. پروفایل های کاربری در فیس بوک دربردارنده عکس ها و ویدیوهایی است که به وسیله کاربر آپلود شده است و همچنین شامل لیست دوستان و فعالیت های اخیر آنهاست (مانند درخواست های دوستی و کامنت هایی از کاربران دیگر) . در جامعه مردم شخصیت یکدیگر را میشناسند اما در شبکه اجتماعیها کاربران یکدیگر را به وسیله پروفایل های کاربری میشناسند.پروفایل کاربری میتواند به عنوان یک هویت اجتماعی نشان داده شود که کاربر از آن در حین ارتباطات آنلاین استفاده میکند . به وسیله استفاده از هویت های اجتماعی اشخاص میتوانند تشخیص داده شوند . در فیسبوک دیوار(حصار) فضایی در برگه پروفایل کاربری هرکاربر است که اجازه میدهد دوستان بتوانند پیام هایی را به کاربر بفرستند . محتوای فرستاده شده روی دیوار به عنوان وال پست رجوع میشود. دیوار هرکاربر برای هر کاربری قابل نمایش است اما برای دیدن کل پروفایل کاربری با اجازه کاربر انجام میشود. کامنت یکی دیگر از ویژگی های فیس بوک است که کاربران را قادر میسازد درباره اندیشه شان راجب مضمون به اشتراک گذاشته شده توسط دیگران مطلبی بنویسند. کاربران فیسبوک فعالیت های مورد علاقه شان را به وسیله اضافه کردن فیلم ها و آهنگ ها و بازی ها و کتاب ها به پروفایل کاربری نشان میدهند. یک رویداد فیسبوکی راهی برای کاربران است که به دوستانشان راجب یک رویداد در شرف اتفاق خبر دهند و گردآوری های اجتماعی شان را سازماندهی کنند. رویدادها میتوانند عمومی و یا خصوصی باشند . برچسب گذاری عکسی به کاربر اجازه میدهد که دوستانش را در یک عکس برچسب زند.این معمولا زمانی استفاده میشود که دوستان با هم در یک عکس قرر داده شوند یا زمانی که کاربر میخواهد به دوستی عکسی را نشان دهد.به طور پیش فرض برچسب گذاری عکسی برای همه قابل دیدن است.با استفاده از ویژگی دوستان دوطرفه این امکان دارد تعداد دوستان معمول بین کاربر و دوست انتخاب شده قابل تشخیص باشد.

در این پایان نامه اطلاعات اجتماعی به هر مضمون قابل دسترسی از شبکه اجتماعی اشاره میکند از قبیل : داده های روابط متقابل و داده های پروفایل کاربری و غیره . بنابرین اطلاعات اجتماعی دربردارنده روابط اجتماعی است . روابط اجتماعی ممکن است تغییر کند : بعضی از آنها موقتی اند بعضی ها مجازی و بعضی از آنها خصوصی و یا ماموریت گرا هستند.اطلاعات اجتماعی همچنین دربردارنده فعالیت های ارتباطی یا روابط متقابل در گراف روابط اجتماعی و سیاست هایی از قبیل اختفاء یا گمنامی مربوط به آن فعالیت ها می باشند.

در این پایان نامه مفهوم ارتباطات ناخواسته در ارتباطات ایمیلی به هر پیام مشکوک یا ناخواسته و یا غیر مهمی گفته میشود از قبیل ایمیل های کم ارزش و یا ایمیل های توده ای ناخواسته و غیره . لیست سفید روش موثری در مسدود کردن پیام های ناخواسته است و برای طبقه بندی ایمیل های معتبر به کار میرود. پیام های فرستندگان که در لیست های سفید لیست میشوند از صندوق ورودی گیرنده قابل دسترسی می باشند.

1.1 کار مربوط

یک حجم زیادی از کارهای منتشر شده برای استفاده از شبکه های اجتماعی در فیلترکردن پیام ها در سیستم های ایمیلی وجود دارد . تعدادی از تحقیقات مربوط به این پایان نامه توسط گلد بک و هندلر انجام شده است .تفاوت بین هر روش در روشی است که اعتماد محاسبه شده است . در تراست میل که یک مشتری ایمیلی نوع اولیه است روش به گونه ای است که کاربران رتبه اعتماد را به کسانی که میشناسند میدهند . رتبه اعتماد به طور بازگشتی برای دیگران محاسبه میشود. این رتبه ها هزاران کاربر را که مجموعه نرخ گذاری خودشان را دارند به هم متصل میکند.

شکل 1. اقتباس شده از گلدبک و هندلر(2004)
رتبه های اعتماد در کنار پیام ها در صندوق ورودی نشان داده شده اند و پیام ها میتوانند مرتب شوند با توجه به این رتبه ها .مزیت واقعی این سیستم این است که با استفاده از یک شبکه اجتماعی پیام های مهم و مربوط نشان داده شده اند حتی اگر گیرنده فرستنده را نشناسد.

روش ترکیب لیست های سفید و شبکه های اجتماعی برای ایمیل قابل اطمینان (RE) پیشنهاد شده است ((Garriss et al ,2006 .RE روابط اجتماعی را بین فرستندگان ایمیل و گیرندگان آن برای قبول کردن پیام های معتبر استخراج میکند که به وسیله پخش کردن لیست سفید کاربر بین کاربران متصل دیگر صورت میپذیرد.

(شکل 2)

بویکین و رویچودباری(2005) یک شبکه اجتماعی از پیام هایی که کاربر دریافت میکند می سازند .پیام ها به عنوان اسپم یا غیر اسپم و یا ناشناخته تشخیص داده میشوند. روش سو ایمیل اعتماد را به عنوان یک جزء درونی از شبکه در نظر میگیرد و این روش از اطلاعات اجتماعی برای نرخ بندی پیام ها استفاده میکند.

(شکل 3)
ویژگی کلیدی سو ایمیل این است که به جای مستقیما وصل کردن فرستنده و گیرنده پیام ها به وسیله پیوندهای دوستی اخیر مسیریابی میشوند.اگرچه تمام آن روش ها از روابط اجتماعی برای فیلتر کردن پیام ها در سیستم های ایمیلی استفاده میکنند برنامه طوری طراحی نشده است که به طور خودکار کارکند : کاربر باید به طور صریح به کاربران دیگر و پیام ها رتبه دهد یا لیست های سفیدی را ایجاد کند . علاوه بر این RE وتکنیکی که به وسیله بویکین و رویچدبادی (2006) استفاده شدند یک شبکه اجتماعی را از پوشه ایمیلی خود کاربر به وجود می آورند و از شبکه ای که کاربران را متصل میکند استفاده نمیکنند.

علاوه بر اینها تعدادی از مطالعات بر روی چگونگی استخراج اعتماد از شبکه اجتماعی ها منتشر شده است. پیشنهاد شده است که کاربران اتصالات اجتماعی را با کسانی به وجود آورند که اولویت یکسانی دارند.بنابرین عبدالرحمان و هایلس مدلی را پیشنهاد میکنند که در آن اعتماد بر اساس توصیه ها محاسبه شده است نه بر اساس استفاده از اطلاعات تجربی مستقیم. در یک مدل پیشنهاد شده از یو و سینگ اعتماد یک کاربر بر اساس تجربه شخصی اش با آن کاربر و همچنین درجه بندی باور او از همسایگان کاربر محاسبه میشود. روابط متقابل اجتماعی از قبیل رد و بدل پیامی بین کاربران پیشنهاد شده است که یک شاخصی از قدرت پیوند فردی است.بنابرین یک مدل نظارت نشده ای به وسیله محققان برای تخمین قدرت رابطه از فعالیت روابط متقابل و شباهت کاربران در شبکه اجتماعی ها گسترش یافته است. هیچ یک از روش های مزبور برای اولویت بندی فرستندگان ایمیل ها استفاده نشده است.

2 پایه (اساس) نظری

در ارتباطات ایمیلی اغلب این مطلب خوشایند است که پیام ها را بر اساس اهمیت شان دسته بندی کرد. بعضی سرویس های ایمیلی از قبیل GMAIL به طور اتوماتیک یک برچسب مهم یا غیر مهم به پیام ها بر اساس تعداد کاراکترهایشان میدهد.برای مثال پیامی از یک فرستنده که پیام هایی را از طرف کاربر دریافت کرده است میتواند به عنوان مهم در نظر گرفته شود.علاوه بر این Gmail به کاربر اجازه میدهد که رتبه بندی را به وسیله برچسب های مهم و غیر مهم بهبود بخشد . ایمیل ها میتوانند به عنوان وسایل ارتباط اجتماعی دیده شوند . این موضوع الهام بخش عقیده استفاده از اطلاعات اجتماعی برای رتبه بندی پیام ها در صندوق ورودی است.در ارتباطات زندگی واقعی مردم با دیگران در بخشی که بر اساس رابطه اعتماد شان است همکاری میکنند. این موضوع همیشه مورد بحث بوده است که همه تراکنش ها نیازمند عنصر اعتماد هستند.این موضوع نشان میدهد که اعتماد یک مفهوم اساسی در فعالیت های اجتماعی است و در بین افراد بسته به نوع همکاری که در آن درگیر هستند متفاوت است.این منطقی است که فرض کنیم سطح هایی از اعتماد در شبکه اجتماعی ها وجود دارند چون که مردم با یکدیگر تعامل دارند و علایقشان را به وسیله پروفایل های کاربریشان به اشتراک میگذارند. در مورد اعتماد در شبکه اجتماعی ها اطلاعات در دسترس داده روابط متقابل اجتماعی و شباهت کاربری است. این اطلاعات میتوانند برای محاسبه رتبه اعتماد بین کاربران مورد استفاده قرار بگیرند. رتبه اعتماد میتواند به پیام های موجود در ارتباط ایمیلی بین دو کاربر وابسته باشد.(اگر آنها در یک شبکه اجتماعی به هم وصل باشند) و بنابرین اجازه میدهند که گیرنده بفهمد چقدر اطلاعات داخل پیام مهم و معتبر هستند. بنابرین پیام های وارد شونده میتوانند به طور اتوماتیک بر پایه رتبه اعتماد وابسته اولویت بندی شوند .

قبل از بازبینی روش های اندازه گیری کمیت قدرت دوستی و استنباط اعتماد از شبکه اجتماعی ها ابتدا باید فهمید که چگونه روابط اجتماعی در شبکه اجتماعی های اخیر تعریف و استفاده میشوند. عقیده بنیادی هم فیسبوک و هم گوگل پلاس به اشتراک گذاری اطلاعات است اما این سرویس ها از روش های متفاوتی استفاده میکنند. مفهوم گروه به وسیله فیس بوک تعریف شده است.مشابه آن حوزه ها در گوگل پلاس برای به اشتراک گذاری اطلاعات با مجموعه ای از افراد استفاده شده است.گروه های فیس بوک میتوانند به عنوان جوامع نمایانگر توصیف شوند که دربردارنده مجموعه های کاربرانی است که علایقشان را به اشتراک میگذارند و میخواهند به چند دلیل به وسیله اشتراک گذاری اطلاعات و عقاید و عکس ها و ویدیو ها و غیره همکاری کنند. کاربران میتوانند به یک گروه بپیوندند و یا کاربران دیگری را اضافه کنند و یا گروهها را ترک کنند. همه اعضای گروه برای اعضای دیگر گروه قابل دیدن هستند. به عبارت دیگر هر عضوی میتواند محتوایی را به اشتراک گذاشته و اعضای دیگر گروه میتوانند آن را مشاهده و یا به آن پاسخ دهند. حوزه ها (Circles) نوعی سخن پراکنی گلچین محتوایی را نشان میدهد. همه فعالیت ها در یک حوزه ( مثل ایجاد یا پاک کردن یک حوزه یا اضافه و پاک کردن یک کاربر و به اشتراک گذاری اطلاعات و غیره) دور کاربر میچرخند.بنابرین کاربران دیگر نمیتوانند هیچ اطلاعاتی را راجب یک حوزه کاربری ببینند.
وقتی که کاربران به گروه فیس بوکی اضافه میشوند همه محتوای به اشتراک گذاشته شده و کامنت ها و فعالیت ها به همه اعضای گروه نشان داده میشوند اگرچه قدرت های متنوع دوستی در یک گروه ممکن است متفاوت باشند.بنابرین گروههای فیسبوکی بر اساس علایق کاربران است نه سطح دوستی بین کاربران گروه .این نشان میدهد که روابط به عنوان یک مفهوم دودویی در نظر گرفته شده اند.گوگل پلاس از روش دیگری استفاده میکند : حوزه ها (محفل ها) (circle) طوری طراحی شده اند که برای جداسازی دوستان براساس روابط شان به کار میرود . برای مثال یک کاربر میتواند یک محفل ایجاد کند و دوستان نزدیکش را داخل آن قرار دهد و سپس محفل دیگری را ایجاد کند برای همکارانش . سناریو ای را در نظر بگیرید که یک ضعف بالقوه از روش محفل (حوزه) را نشان میدهد : فرض کنید که یک کاربر مثلا آلیس شغلش را تغییر میدهد .اکنون هر کسی در محفل کاری باید به محفل دیگری جابجا شود با دسترسی کمی به افکار و فعالیت های روزانه آلیس. به علت آنکه قدرت همه روابط در یک محفل مشخص یکسان است : آلیس نیاز دارد که محفل های بیشتری را ایجاد کند تا بتواند تماس هایی با قدرت دوستی یکسان را در یک محفل قرار دهد. بسته به تعداد محفل ها و تماس ها در هر محفل سرجمع سازمانی به طور مداوم افزایش می یابد . بنابرین در شبکه اجتماعی های اخیر نیاز به مشخص کردن کمیت روابط برای تقلید از جامعه جهان واقعی و جلوگیری از اختفاء بالقوه و مسائل امنیتی از قبیل دسترسی ناخواسته به اطلاعات خصوصی است.
برای استنتاج اعتماد از شباهت وداده های روابط متقابل اجتماعی این نکته حائز اهمیت است که رابطه ای را بین اعتماد و شباهت کاربر همانند اعتماد و رابطه متقابل کاربر تشخیص داد.کارهای پیشین رابطه ای را بین شباهت رفتاری و دوستی پیشنهاد میکند . در جهان واقعی مردم با یک نوع فرهنگ توسط یکدیگر تحت تاثیر قرار میگیرند و سعی میکنند فرهنگ را یکتا نگه دارند. رابطه بین اعتماد و شباهت علاقه در سیستم های آنلاین توسط سینها و سونرینگن آزمایش شده است. به نظر می آید که کاربران به توصیه های دوستانشان اعتماد میکنند (سینها و سونرینگن 2001) .علاوه بر اینها این مطلب مورد بحث قرار گرفته است که کاربران سیستمی را که یک آیتمی که آنها قبلا دوست داشته اند توصیه کند بیشتر اعتماد میکنند. این نشان می دهد که اگر یک سیستم آیتمی را توصیه کند که به اولویت های کاربر نزدیکتر باشد سیستم مورد اعتماد بیشتری واقع میشود.رابطه قوی بین اعتماد و شباهت کاربری توسط زیگلر و گلدبک نشان داده شده است. که به این مطلب اشاره میکنند که هرچه شباهت های بین دو کاربر بیشتر باشد اعتماد بیشتری هم به همان نسبت بین آنها وجود دارد.علاوه بر این این مطلب مورد بحث واقع شده است که تناوب و چگالی روابط متقابل در تشخیص بیشتر بودن روابط متقابل بین دو شخص مهم است.این منطقی است که این مطلب را در شبکه اجتماعی ها هم توقع داشته باشیم بنابرین در این پایان نامه اینگونه فرض شده است که رابطه ای بین شباهت کاربری و اعتماد همانند روابط متقابل وجود دارد . اما یک مساله ای که در رابطه با شباهت کاربری وجو دارد تصمیم گیری راجب انتخاب واحدهای اندازه گیری برای اندازه گیری شباهت در شبکه اجتماعی است.در برخی مطالعات شباهت بر اساس شباهت اولویت های کاربری اندازه گیری شده است. به دلیل آنکه فیس بوک به عنوان مورد مطالعه ما برای این پایان نامه انتخاب شده است نیاز به انتخاب واحدهای اندازه گیری مشابه که در شبکه اجتماعی در دسترس است میباشد. بنابرین شباهت به عنوان شباهت پروفایل های کاربری از قبیل علایق معمول و یا شباهت های پیش زمینه ای کاربران از قبیل اینکه کاربران اخیرا کجا زندگی میکرده اند و از کجا آمده اندو غیره تعریف میشود. علاوه بر این تعریف چگالی روابط متقابل مشابه آن چیزی است که بانکس و وا گفته اند (2009). انگیزه انتخاب فیس بوک به عنوان یک بستر نرم افزاری بعدا در بخش طراحی مطالعه موردی گفته خواهد شد.

2.1 شاخصه های اعتماد
مدل اعتماد که در این پایان نامه توصیف شده است بر پایه شاخصه های جامعه شناسی اعتماد است. به طور خاص این مدل ویژگی های ذیل از اعتماد را پشتیبانی میکند : همانطور که توسط گامبتا (1990) مشخص شده است اعتماد ذهنی است یعنی کاربران ممکن است ادراک گوناگونی از این مفهوم داشته باشند. با توجه به تعریف اعتماد که توسط گامبتا گفته شده است اعتماد وابسته به مفهوم است .یکی ممکن است به انجا کاری اعتماد کند اما به انجام کار متفاوت دیگری اعتماد نداشته باشد.اعتماد یک ارزش عددی دارد که درجه اعتماد را شکل میدهد.اما معنی و فرم ارزش اعتماد به طور متفاوتی در طرق گوناگونی مدنظر قرار گرفته است(به طور مثال بولین یا قیاسی و یا ارزش های دنباله دار و غیره).در مدل معرفی شده درجه اعتماد با محدوده بردی از بی اعتمادی تا اعتماد کامل همراه است.اعتماد یک رابطه نامتقارن و دودویی است (یعنی رابطه اعتماد دو طرفه است). اعتماد زمانی نامتقارن است که یکی به دیگری اعتماد دارد اما دیگری چنین احساسی به او ندارد. اعتماد با تردید و ریسک همراه است. تردید در این رابطه به این معناست که یک تصمیم اعتمادی بگیریم که همراه با مسیر مبهمی است که ممکن است منجر به حادثه سودمند و یا مضری شود.این بدین معنا نیست که اعتماد بر اساس شانس اتخاذ شده است بلکه بر اساس تجربه و شواهد اولیه صورت گرفته است. به علاوه اعتماد یک مفهوم پویا است. این یعنی اینکه اعتماد به طور مداوم به وسیله تجربیات و شواهد اضافی تغییر میکند. شاخصه جالب دیگر اعتماد تکثیر آن بین گره هاست.اعتماد یا به عنوان گذرا و یا ناگذر در مطالعات تحقیقی متقاوت در نظر گرفته میشود . روشی که پیشنهاد میکند که اعتماد گذارا است راجب این بحث میکند که تصمیمات اعتمادی دنیای واقعی اغلب در طبیعت به طور گذرا هستند. برای مثال یکی ممکن است به فیلمی اعتماد کند به خاطر کارگردانش و کارگردان فقط به این علت مور اعتماد قرار گرفته است که دوستش به او توصیه کرده است.این مطلب توجیه شده است که اعتماد میتواند بین مردم رد شود اگرچه به طور کامل از جهت ریاضی گذرا نیست.این یعنی اینکه اگر آلیس به باب اعتماد داشته باشد و باب به کارل اعتماد داشته باشد این همیشه اینگونه نیست که آلیس هم به کارل اعتماد داشته باشد. روش های دیگر در مورد این مطلب بحث میکنند که اعتماد لزوما گذرا نیست .برای مثال اگر آلیس به باب اعتماد داشته باشد و باب به کرل اعتماد داشته باشد این لزوما نتیجه اش این نمیشود که آلیس هم باید به کارل با هر درجه ای اعتماد داشته باشد .

2.2 دسته بندی مدل های اعتماد محسباتی

تعدادی از مدل های اعتمادی بر اساس شاخصه های ذیل مدل های اعتمادی دسته بندی شده اند:

شاخصه واحدهای اندازه گیری اعتماد محلی یا جهانی :
رتبه اعتماد یا میتواند جهانی و یا میتواند محلی محاسبه شود. در واحد اندازه گیری اعتماد جهانی یک رتبه اعتماد جهانی تنها برای هر کاربر محاسبه میشود .برخلاف آن واحد اندازه گیری اعتماد محلی رتبه های اعتماد شخصی سازی شده برای هر کاربر را بر اساس نقطه نظرهای کاربران دیگر محاسبه میکند.

شاخصه وابسته به مفهوم(متن) :
اعتماد یا میتواند به عنوان وابسته به مفهوم(متن) و یا مفهوم آزاد باشد . مدل های اعتماد وابسته به مفهوم (یعنی محتوا-آگاه یا وضعیت-آگاه یا وضعیت-مشخص) به رتبه های چند اعتمادی بسته به مفهوم وابسته اند (یعنی یکی ممکن است به کاربری اعتماد داشته باشد در یک مفهوم ولی در مفهوم دیگری اعتماد نداشته باشد) در مدل های اعتماد مفهوم آزاد یک رتبه اعتماد تنها برای وضعت های متفاوتی بدون نوجه به مفهوم محاسبه میشود.

شاخصه نوع رتبه اعتماد :
اعتماد یا به عنوان رتبه ادامه وار شناخته میشود( مثل رتبه بین 0 و1) و یا رتبه دسته بندی (برای مثال خیلی قابل اعتماد یا قابل اعتماد و یا غیر قابل اعتماد) و یا رتبه دودیی ( یعنی یا اعتماد وجود دارد و یا ندارد).

شاخصه اندازه گیری اطمینان :
مدل های اعتماد ممکن است اندازه گیری های اطمینان را برای محاسبه رتبه اعتماد به وجود آورند .منبع اطلاعات میتواند به سه بخش عمومی تقسیم شود : تجربه مستقیم و اطلاعات گواه و اطلاعات اجتماعی . تجربه مستقیم اطلاعاتی را معرفی میکند که از تعامل با کاربران دیگر به دست می آید. اطلاعات گواه دربردارنده اطلاعاتی است که از کاربران دیگر بدست می آید ( مثل توصیه ها). اطلاعات اجتماعی به آن دسته از اطلاعاتی اشاره میکند که از شبکه اجتماعی ها در دسترس است.

شاخصه اعتماد گذرا :
این شاخصه برای تشخیص اینکه مدل های اعتماد محاسباتی اعتماد را به عنوان یک محتوای گذرا یا ناگذرا و یا یک محتوای ترکیبی در نظر میگیرند استفاده میشود.

توجه کنید که دسته بندی بر اساس شاخصه های معمول مدل های بازبینی شده انجام میشود.

2.3 بررسی نظری

مقایسه انواع مختلف مدل های اعتماد محاسباتی به ما در درک شاخصه هایی که باعث بهبود مدل اعتماد برای اولویت بندی ایمیل ها میشوند کمک میکند. ادبیات اعتماد محاسباتی در بردارنده انواع مختلفی از الگوریتم هایی است که میتوانند به دو گروه عمده دسته بندی شوند : الگوریتم های محاسبات اعتماد محلی و جهانی . الگوریتم محاسبه اعتماد جهانی تنها یک رتبه اعتماد را برای هر شخص در شبکه محاسبه میکند . بر خلاف آن اعتماد در الگوریتم محاسبات اعتماد محلی بر اساس رفتار و اولویت های اشخاص نسبت به یک کاربر خاص است . تفاوت این است که در یک شبکه با الگوریتم محاسبات اعتماد محلی هر کاربر چندین رتبه اعتماد بسته به نقطه نظر کاربران دیگر دارد اما در یک شبکه با الگوریتم محاسبات اعتماد جهانی یک کاربر همیشه تنها یک رتبه اعتماد دارد. در الگوریتم محاسبات اعتماد جهانی تنها یک رتبه اعتماد به طور عمومی برای همه اعضای شبکه قابل دسترسی است . بنابرین رتبه اعتماد در برابر دستکاری آسیب پذیر است (برای مثال یک گروهی از کاربران مشکوک میتوانند رتبه اعتماد یک کاربر جعلی را افزایش دهند). این مساله مطالبه شده است که هر سیستم اعتماد جهانی به وسیله حمله کنندگان قابل بهره برداری است.علاوه بر این نظریات غیر صحیح کاربران میتواند رتبه اعتماد یک کاربر خاص در کل شبکه را افزایش و یا کاهش دهد. این مساله میتواند قدرت الگوریتم اعتماد جهانی را تحت تاثیر قرار دهد.بنابرین این خیلی مهم است که اطمینان بازخورد کاربران را در الگوریتم های اعتماد جهانی در نظر گرفت.علاوه بر این اعتماد ذهنی است و کاربران متفاوت ممکن است عقاید متفاوتی راجب به یک موضوع داشته باشند . اما عقیده الگوریتم محاسبات اعتماد جهانی یا محلی بستگی به مفهوم دارد .الگوریتم محاسبات اعتماد جهانی اجراشدنی است زمانی که نظریات کاربران خیلی شبیه به هم باشد. از طرف دیگر در یک متن یا مفهومی که در آن کاربران عقیده متفاوتی راجب به یک موضوع دارند الگوریتم محاسبات اعتماد جهانی موثر نیست .دراین پایان نامه بازخورد کاربران راجب اعتبار یک ایمیل میتواند کاملا متفاوت باشد.بنابرین مدل محاسبات اعتماد محلی استفاده شده است.
بر اساس تعریف اعتماد از گامبتا اعتماد وابسته به متن(مفهوم) است. به یکی ممکن است توصیه شود که به فیلمی اعتماد کند ولی به درست کردن ماشینی اعتماد نکند.
ارتباط اندازه گیری اعتماد با یک مفهوم مشخص در شرایط پیچیدگی هزینه بالای دارد اما میتواند در استنباط رتبه های اعتماد با معنی کمک کننده باشد.در مدل اعتماد وابسته به متن اجزای متفاوتی از اطلاعات باید استفاده شوند تا بتوان رتبه های اعتماد متفاوت مربوط به فعالیت های متفاوت را محاسبه کرد. این نشان میدهد که به اطلاعات کافی برای محاسبه اعتماد در هر مفهوم(متن) مورد نظر نیاز داریم و مکانیزمی مورد نیاز است که بتوان مفهوم(متن) صحیح را برای قسمتی از اطلاعات تشخیص داد.اما داده های روابط متقابل در شبکه اجتماعی های اخیر معمولا موقتی و پراکنده هستند. بنابرین یک مدل اعتماد مفهوم (متن) آزاد در این پایان نامه انتخاب شده است.
الگوریتم محاسباتی اعتماد میتوانند گذرا ناگذر و یا اعتماد ترکیبی باشند .اعتماد ترکیبی به حالتی اشاره میکند که اعتماد هم به عنوان محتوای گذرا و هم ناگذر در نظر گرفته میشود . محاسبه اعتماد ترکیبی مشکل است چون که الگوریتم باید تشخیص بدهد که کجا اعتماد گذرا و کجا ناگذر است. الگوریتم بر اساس اعتماد گذرا همچنین درکش مشکل است چون اعتماد در طول زنجیره ای از آگاهی ها نقصان می یابد. در نتیجه پیدا کردن روش دقیق برای تکثیر اعتماد امری سخت است .در نتیجه این پایان نامه بر روی تعریف راحتی از اعتماد تمرکز میکند که درآن فقط اعتماد غیرگذرا در نظر گرفته شده است.عموما اعتماد میتواند به عنوان یک ارزش دسته ای یا ادامه وار در نظر گرفته شود .
به دلیل آنکه مدل انتخاب شده با درجات دوستان کار میکند ارزش اعتماد به عنوان یک اندازه گیری دسته ای در نظر گرفته میشود . جدول 2 شاخصه های الگوریتم اعتماد انتخاب شده را نشان میدهد.

3 روش شناسی تحقیقاتی

این پایان نامه بررسی میکند که چگونه ایمیل ها را بین فرستندگان و گیرندگانی که در شبکه اجتماعی به هم وصل هستند اولویت بندی کرد. برای این منظور بررسی به وسیله شناخت روش های موجود در اولویت بندی ایمیل ها و محاسبات اعتماد شروع میشود. برای درک و تفاوت قائل شدن بین ویژگی های مدل های موجود یک دسته بندی انجام شده بود . دسته بندی بر پایه تعدادی از ویژگی های مهم مدل های اعتماد بود . قدم بعدی مقایسه کردن دسته های مدل اعتماد برای فهم و بررسی جنبه های مثبت ومنفی هر دسته بود. نتیجه مقایسه به عنوان مبنایی برای تشخیص شاخصه های روش مناسب در مفهوم اولویت بندی ایمیل ها استفاده میشود. یک الگوریتم جدید بر اساس بررسی نظری و شاخصه های شناسایی شده ساخته شده بود. این الگوریتم به وسیله یک استعلام تجربی برای بررسی رفتارش در جهان واقعی مورد ارزیابی قرار گرفته بود.

الگوریتم هایی برای محاسبات اعتماد و اولویت بندی ایمیلی
یک پروفایل کاربری شبکه اجتماعی میتواند پیچیده باشد. پروفایل کاربری میتواند دربردارنده انواع مختلفی از اطلاعات اجتماعی باشد از قبیل اطلاعات شخص و داده های ارتباطی و علایق و فعالیت ها . در این پایان نامه اطلاعات اجتماعی به عنوان لیستی از ارزش ها در نظر گرفته شده اند که در آن هر ارزش با یک پارامتر (مقیاس) همراه است. برای مثال مقیاس پیام ها میتواند با ارزش 5 همراه باشد. این یعنی 5 پیام بین کاربر و یک دوست مشخص رد و بدل شده است. الگوریتم انتخاب شده از اطلاعات اجتماعی برای محاسبه اعتماد بین یک کاربر مشخص و دوستان استفاده میکند.نظریه این بود که برای یک کاربر مشخص بعضی معیارها ممکن است اثر بیشتری روی اعتماد نسبت داده شده به دوستان در مقایسه با معیار های دیگر داشته باشند. بنابرین یک وزنی باید به هر معیار داده شود.
فرض میکنیم Xi ارزش معیار i برای یک دوست مشخص است و wi وزن ناشناخته آن معیار است. ارزش اعتماد t بین کاربر و دوست مشخص از معادله زیر محاسبه میشود :
(1) T=w1x1 +…+wiXi+…+wpXp + epsilon

که در این رابطه p شماره معیار و اپسیلون خطایی است که به دلیل اختلاف بین پاسخ مشاهده شده( اعتماد واقعی) و نتیجه پیشبینی شده وجود دارد (اعتماد محاسبه شده). t و w ارزش های پیوسته ای دارند اگرچه x میتواند یک ارزش گسسته یا پیوسته باشد به این معنی که x میتواند اطلاعاتی از قبیل تعداد پیام ها (پیوسته) و مکان جاری (گسسته و 1 اگر هر دو کاربر در یک شهر زندگی کنند و 0 در غیر این صورت). در نتیجه برای مورد n دوست ارزش اعتماد بین کاربر و دوست i به وسیله استفاده از معادله 2 محاسبه میشود:
(2) Ti=w1xi1+…+wpxip + epsiloni

که در آن xip اطلاعات اجتماعی بین کاربر و دوست i با توجه به معیار P است. معادله 2 میتواند به صورت معادله 3 نوشته شود :

(3) Ti=xitw + epsiloni
که در آن t بردار n*l اعتماد است و w بردار وزن های ناشناخته است و XT نشان دهنده ماتریس ترانهاده است. بنابرین xtw حاصل داخلی بین بردارهای xi و w است.معادله 3 به نظر میرسد یک مدل برگشتی خطی است که ti یا غیر وابسته و یا وابسته است. n معادله میتوانند به هم متصل شوند و در یک نشان گذاری ماتریسی نوشته شوند:
T = Xw+ epsilon (4)

که در آن اپسیلن بردار n*l از خطاهاست و X ماتریس p*n از اطلاعات اجتماعی است .معمولا تعداد دوستان بیشتر از تعداد معیار است n>p بر اساس روش کمترین مجذورها بردار ناشناخته w به صورت زیر محاسبه شده است :

(4) w = (XTX)-1XTt

در روش کمترین مجذورها راه حل کلی مجموع مجذورهای خطاهای ایجاد شده در نتایج هر معادله یکتا را حداقل میکند. خطای کلی به صورت زیر محاسبه میشود :
Epsilonoverall =epsilon12 +…+ epsiloni2+…+epsilonn2 i=1,…,n

برای نشان دادن اینکه چگونه رتبه اعتماد بر پایه اطلاعات اجتماعی در شبکه اجتماعی ها محاسبه میشود الگوریتمی انتخاب شده است

( الگوریتم 1).

الگوریتم1 . تخمین وزنی اولویت بندی
نکته : ID شناسنامه کاربر است ( ID ها میتوانند برای حفظ کردن بینامی تغییر کنند) . Xt ترانهاده ماتریکس X است.

الگوریتم 1 مجموعه ای بهینه از وزن ها را برای هر معیار با توجه به معادله 5 براورد میکند . هدف این است که به طور خودکار یک برداری از رتبه های اعتماد را تا حد ممکن نزدیک به اولویت های کاربری محاسبه کرد.در الگوریتم انتخاب شده ترجیحات کاربر ( بازخوردهای کاربری ) یک لیست مرتب از دوستان را بر پایه اعتماد مشخص میکند. برای اولویت بندی پیام ها در صندوق ورودی بر اساس وزن های برآورد شده الگوریتم 2 انتخاب شده است.

الگوریتم 2 . اولویت بندی ایمیلی

الگوریتم 2 رتبه های اعتماد را بر اساس معادله 4 محاسبه میکند و سپس دوستان را بر طبق رتبه های اعتماد محاسبه شده بایگانی میکند. در این الگوریتم هیچ محدودیتی برای تعداد دوستان یا تعداد معیارها وجود ندارد . توجه کنید که الگوریتم انتخاب شده ایمیل ها را بر اساس فرستندگان بدون توجه به محتوای ایمیل ها اولویت بندی میکند . این یعنی اینکه اگر فرستنده B مورد اعتماد تر از فرستنده A باشد آنگاه تمام ایمیل های فرستنده B رتبه بالاتری نسبت به ایمیل های فرستنده A در صندوق ورودی میگیرند . هیچ یک از الگوریتم های 1 و 2 محتوای روابط متقابل اجتماعی بین دوستان را در نظر نمیگیرند.اما الگوریتم 1 قادر به مدیریت وضعیت در حالتی که دوستان پیام های ناخواسته ای را میفرستند به وسیله تنظیم وزن معیار می باشد . برای این منظور به وسیله کاهش دادن وزن معیار مخصوص از افزایش ساختگی رتبه اعتماد جلوگیری شده است. بدیهی است که این امکان وجود دارد که بتوان روش فیلترینگ وابسته به متن را با الگوریتم های انتخاب شده برای اولویت بندی ایمیل ها بر اساس هم روابط اجتماعی و هم محتوای پیام ایمیلی فرستاده شده ترکیب کرد. اما چنین الگوریتم ترکیبی خارج از مقوله این پایان نامه است. الگوریتم 2 ممکن است نتواند به طور صحیح یک وضعیت شدید را که در آن روابط بین کاربر و یک دوست به علت عدم وجود اعتماد نسبت به دوست برقرار نمیشود پیشبینی کند.برای مثال دوستان خیلی نزدیکی که همدیگر را مکررا ملاقات میکنند ممکن است رابطه متقابل فشرده ای را در شبکه اجتماعی نداشته باشند وقتی که روابط متقابلشان چهره به چهره یا به صورت تلفنی است.چنین رابطه دوستی ممکن است یک رتبه پایینی از اعتماد را به وسیله الگوریتم بگیرد علا رغم اینکه دوستی شان رابطه قوی است. سناریو متضاد آن زمانی رخ میدهد که یکی تصمیم میگیرد آشنایی را انکار نکند و روابط متقابلی را برای مودب بودن داشته باشد در حالی که کاربر در واقع به آشنایی اعتماد ندارد. اما چنین محدودیتی انحصارا فقط برای این الگوریتم نیست . این محدودیت یک بخش ذاتی از همه الگوریتم هایی است که بر پایه زندگی اجتماعی کاربر بنا شده اند. هدف ابتدایی این نیست که روابط شدید جزئی را به رسمیت بشناسیم بلکه هدف این است که تعداد اکثریت دوستان را برای یافتن دوستانی که کمترین اعتماد به آنها نسبت داده شده است دسته بندی کرد. به این صورت روش انتخاب شده میتواند فرستندگان بالقوه ایمیل های ناخواسته را تشخیص دهد.

برای براورد درستی بردار اعتماد محاسبه شده یک الگوریتم در نظر گرفته شده است (الگوریتم 3) . الگوریتم 3 رتبه های دوستان بر پایه بازخورد کاربری را با رتبه های بر پایه اعتماد محاسبه شده مقایسه میکند. خطای کلی روش بر طبق معادله 6 محاسبه میشود.

الگوریتم 3 . محاسبات خطای پیشبینی

برای مثال فرض کنید که بردار رتبه ای واقعی برابر با [2,5,1,4,3] و بردار رتبه ای پیشبینی شده برابر با [1,5,2,3,4] باشد. بنابرین بردار خطا برابر با
[1,0,-1,1,-1] خواهد بود و خطای کلی (مجموع مجذورهای خطاها) مساوی با 4 هست.

4.2 تعریف بررسی نمونه ای و طراحی

در کنار تحلیل نظری نیاز به ارزیابی چگونگی رفتار الگوریتمی در زمینه دنیای واقعی میباشد . علاوه بر این این مساله مهم است که ببینیم آیا یک همبستگی بین روابط متقابل کاربران و اعتماد همانند شباهت کاربران در شبکه اجتماعی ها وجود دارد یا خیر.

یین (2009) یک تعریف از مطالعه نمونه ای را اینگونه تعریف میکند :

روش تحقیقاتی بررسی نمونه ای یک تحقیق تجربی است که یک پدیده معاصر(همزمان) را در عمق و مفهوم زندگی واقعی بازرسی میکند مخصوصا زمانی که کرانه های بین پدیده و مفهوم دقیقا مشخص نیست.

با توجه به یین (2009) وضعیت هایی وجود دارند که در آنها همه روش های تحقیقاتی وابسته هستند. اما در بعضی وضعیت ها اداره کردن بررسی نمونه ای مزیت متمایزی دارد . این زمانی است که یک تمرکز همزمان درون مفهوم زندگی واقعی وجود دارد . بعلاوه بررسی نمونه ای استراتژی ترجیحی است زمانی که محقق هیچ کنترلی بر روی رخداد ندارد. علاوه بر این بررسی نمونه ای روش ترجیحی است زمانی که پرسش های چرا یا چگونه پرسیده میشوند.

این پایان نامه یک پدیده زندگی واقعی را امتحان میکند که همبستگی اعتماد و روابط متقابل کاربران همانند شباهت کاربری را نشان میدهد.علاوه بر این روابط اجتماعی بین کاربران در شبکه اجتماعی تحت کنترل نیست زمانی که روابط فردی خارج از شبکه اجتماعی روابط شبکه اجتماعی را تحت تاثیر قرار میدهد.به عبارت دیگر سوال تحقیقاتی این است که چگونه از اطلاعات اجتماعی برای اولویت بندی ایمیل ها بین کاربران استفاده کرد ؟ و به طور دقیق تر اینکه چگونه الگوریتم انتخاب شده در محیط دنیای واقعی رفتار میکند ؟ بنابرین بررسی نمونه ای برای جواب در این پایان نامه انتخاب شده است .

بررسی نمونه ای بر روی فیس بوک تمرکز میکند چون اخیرا یک شبکه اجتماعی مردم پسند بوده است و بیشترین تعداد کاربران را دارد. به علاوه فیس بوک یک شبکه اجتماعی غنی در شرایط در دسترس بودن داده ها و به روز بودن در شرایط بروز رسانی های وضعیتی مکرر است. محبوبیت فیس بوک به کاربران کمک میکند تا با دوستان و خویشاوندان و آشنایان و نیز غریبه ها در تماس باشند. در نتیجه کاربران فیس بوک بسیار زیاد به هم متصل هستند. بنابرین آنها چندین رابطه متنوع با یکدیگر دارند. فیس بوک یک رابط برنامه نویسی کاربردی (API) و API گراف فراهم می آورد که هسته بستر نرم افزاری فیس بوک است. API گراف گسترش دهندگان را قادر می سازد تا بتوانند داده ها را به داخل فیس بوک خوانده و یا بنویسند با استفاده از رابط SQL-style. این زبان جستار فیس بوک نامیده میشود (FQL) .

4.3 تشریح داده ای و روش جمع آوری داده ای

داده ها از پروفایل کاربر و تعداد دوستان فیس بوک استخراج میشوند . فیس بوک انواع مختلفی از اطلاعات اجتماعی را فراهم میکند که میتوانند به 3 دسته عمومی تقسیم شوند : شدت روابط متقابل , شباهت علایق , شباهت پیش زمینه . دسته شدت روابط متقابل به تعداد روابط متقابل با دوستان اشاره میکند . دسته شباهت علایق تعداد فعالیت های مورد علاقه معمول بین کاربر و یک دوست مشخص را نشان میدهد ودسته شباهت پیش زمینه بر اطلاعات شخصی کاربر دلالت دارد.زمان انتخاب شدت یا معیار شباهت سعی میشود آن معیاری انتخاب شود که بین کاربران فیس بوک معمول ترین باشد و با اعتماد قرین باشد. توصیف معیار انتخاب شده در جدول 3 نشان داده شده است .

جدول 3. توصیف معیار انتخاب شده

استخراج مقادیر زیادی داده از معیار انتخاب شده فیس بوک کار مشکلی است .این عمدتا به دلیل ساختار شرایط سرویس ها , جدول های فیس بوک و دلایل امنیتی است. قبلا فایل فیسبوک robot.txt به هر کسی اجازه میداد که سایت را دستکاری کند اگرچه با اضافه کردن شرایط جدید سرویس دهی فیس بوک دستکاری کردن بدون اجازه از شرکت را ممنوع کرده است . به علاوه استخراج داده با استفاده از گراف API و اجرای استعلام های FQL به حوزه های دارای فهرست راهنما(شاخص دار) جدول ها محدود است . حوزه های دارای فهرست راهنما(شاخص دار) حوزه هایی هستند که به عنوان فهرست راهنما(شاخص دار) در مستند سازی فیس بوک وجود دارند . به عنوان مثال برای استخراج داده راجب کامنت ها جدول کامنت های فیسبوک باید مورد استعلام قرار بگیرد . یک بخش مورد نیازی از جدول کامنت در جدول 4 نشان داده شده است .

جدول 4 . ستون های جدول کامنت (تفسیر)

نکته . نشان ستاره(*) نشان دهنده این است که حوزه دارای فهرست راهنما(شاخص) است.

همانند SQL , استعلام های FQL به فرم
SELECT [fields] FROM [table] WHERE [conditions] هستند . برای مثال برای تشخیص اینکه آیا کاربر A کامنتی راجب یک عکس که توسط کاربر B به اشتراک گذاشته شده است داده است استعلام ذیل نیاز است :
SELECT POST_id, text, time FROM comment WHERE fromid= '12345678'

اما استعلام نمیتواند به وسیله FQL اجرا شود وقتی که fromid یک حوزه شاخص دار نیست.به علاوه به دلایل امنیتی بعضی قسمت های داده های دوست (آنهایی که فقط برای کاربر مشخصی قابل دیدن هستند) به وسیله برنامه های در حال اجرای کاربر قابل دستیابی نیستند. برای مثال به طور پیش فرض اطلاعات شهر و مکان اخیر و چیزهایی که کاربر دوست داشته و آنها را در فیس بوک اصطلاحا لایک کرده به وسیله برنامه قابل دستیابی نمیباشند مگر اینکه خود کاربر تنظیمات امنیتی را تغییر دهد و اجازه بدهد.

در ابتدا جمع آوری داده ای برای بررسی نمونه ای به وسیله استفاده از برنامه کاربردی فیس بوک انجام شده بود که برای دلایل تحقیقاتی در موسسه فناوری بلکینگ (BTH) گسترش یافته بود . در زمان نوشتن مشکل اصلی استفاده از برنامه این بود که داده های جمع آوری شده در شرایط تعداد روابط و علایق مشابه قابل اطمینان نبودند . برای مثال تعداد پست های دیواری که از یک دوست مشخص توسط برنامه برگردانده میشد با تعداد پستهای دیواری دریافت شده از این دوست در پروفایل کاربری مساوی نبود . این مشکل حتی با معین کردن یک دوره زمانی همچنان باقی بود. به طور مشابه تعداد فعالیت های معمول , علایق , و چیزهایی که لایک شده بودند که توسط برنامه برگردانده میشدند مساوی با تعداد علایق معمول در پروفایل های کاربری نبودند. این مساله روی اطمینان نتایج اثر میگذارد . بنابرین تصمیم گرفته شد که داده ها را به وسیله اسکریپت های PHP در گراف جستجوگر API به وسیله استفاده از PHP SDK استخراج کنند. جستجوگر برنامه ای است که روی بستر نرم افزاری فیسبوک ایجاد شده است که از گراف (با اجازه کاربر) برای کشف اشیا و ارتباطات در گراف استفاده میکند. PHP SDK یک مجموعه غنی از قابلیت جانب سرور ((Server-side را برای دسترسی به فراخوانی های API جانب سرور فیس بوک به وجود می آورد.اما استخراج داده به وسیله جستجوگر در شرایط تعداد شرکت کنندگان مقیاس پذیر نیست. دلیلش آن است که هر شرکت کننده نیاز دارد به وسیله یک سیستم مشخص به فیس بوک شناسانده شود که اینگونه شکل گرفته است که از PHP SDK استفاده کند.علاوه بر این هر شرکت کننده نیاز به داشتن اجازه برای دسترسی به داده های دوست است. آنگاه شرکت کننده نیاز دارد که اسکریپت ها را اجرا کند.در این پایان نامه اطمینان داده ها مهمتر از حجم داده هاست تا زمانی که هدف اصلی بررسی نمونه ای امتحان قابل اجرا بودن الگوریتم انتخاب شده برای دامنه ای از کاربران متوسط است. بنابرین بررسی نمونه ای به وسیله نگاه کردن به یک کاربر(شرکت کننده) متوسط فیسبوک با تعدادی از دوستان او صورت میگیرد . بر طبق فیس بوک هر کاربر متوسط 130 دوست دارد و او به 80 صفحه انجمنی , گروه و رخداد متصل است .برای انتخاب دوستان شرکت کننده تصمیم گرفته شده که 10 درصد از دوستان را به یک شیوه تصادفی انتخاب کرد تا نمونه را به حد نسبی کوچک نگه داریم .به علت آنکه فیس بوک به طور مکرر تغییر میکند هم در شرایط در دسترس بودن داده ها و هم در شرایط رابط کاربری تصمیم گرفته شده که یک روگرفت لحظه ای کوتاه از روابط بین شرکت کنندگان و دوستان داشته باشیم. داده ها در طول 24 ساعت استخراج میشوند ( در چهارشنبه 14 سپتامبر 2011) برای جلوگیری از اثر تغییر محیط تا حد ممکن.با فرض اینکه کاربران در طول اواخر هفته فعال تر هستند جمع آوری داده ها در یک روز هفته انجام میشود تا یک روگرفت لحظه ای واقع بینانه از فعالیت های شرکت کنندگان و دوستان به دست آید.اما تعداد فعالیت ها به خودی خود نمیتواند نتیجه را تحت تاثیر قرار دهد اگر فعالیت های شرکت کننده و دوستان با هم افزایش یابند.دلیل این است که الگوریتم انتخاب شده با رتبه های دوستان کار میکند نه تعداد خام فعالیت ها. با این وجود تغییرات در بستر نرم افزاری فیس بوک قابلیت های آن را تحت تاثیر قرار میدهد و بنابرین موجب یک کاهش ساختگی در فعالیت های شرکت کنندگان و دوستان میشود. بنابرین جمع آوری داده ای بر اساس نقشه راه گسترش دهندگان فیس بوک برنامه ریزی میشود تا از دوره های تغییرات جلوگیری شود.

داده های استخراج شده در یک جدولی که ماتریس اطلاعات اجتماعی نامیده میشود ذخیره میشوند. ستون ها نشان دهنده معیارها و سطرها دوستان شرکت کنندگان را معرفی میکنند. مثالی از ماتریس اطلاعات اجتماعی در شکل 4 نشان داده شده است.

4.4 بررسی نمونه ای

بررسی نمونه ای با گرفتن لیستی مرتب از دوستان بر پایه ترجیحات شرکت کننده شروع میشود . مثالی از لیست مرتب دوستان [b, a, d, c, e] است که در آن دوستان از پایین ترین اعتماد به بالاترین اعتماد مرتب سازی شده اند.بنابرین a مورد اعتمادتر از b است . به طور واضح در نمونه ای که a و b به یک اندازه مورد اعتمادند دو لیست [b, a, d, c, e] و [a, b, d, c, e] مساوی در نظر گرفته میشوند. اینگونه فرض شده است که کاربر همیشه یکجور بازخورد میدهد. ایجاد بردار اعتماد واقعی در نمودار1 نشان داده شده است . توجه کنید که دوستان مورد اعتماد کمتر رتبه های پایین تری میگیرند.

نمودار 1. ایجاد بردار اعتماد واقعی :

لیست مرتب دوستان بر پایه ترجیحات شرکت کننده

دادن رتبه های پایین تر به دوستان مورد اعتماد کمتر

بردار اعتماد واقعی

بنابرین بردار اعتماد واقعی (رتبه واقعی) برای لیست مرتب [b, a, d, c, e] برابر خواهد بود با [1 ,2, 3, 4, 5] . با داشتن بردار اعتماد واقعی و ماتریس اطلاعات اجتماعی روش برای براورد وزن ها (نمودار 2) ادامه می یابد . تابع هدف حداقل کردن تفاوت بین رتبه واقعی و محاسبه شده را به وسیله تنظیم وزن های معیار انجام میدهد.

نمودار 2 . روش

روش بر روی داده های شرکت کننده و 13 دوست انجام شده بود و خطای کلی بر پایه الگوریتم 3 محاسبه شده بود. دلیل محاسبه خطای کلی قادر بودن در تخمین روش است. علاوه بر این 100 بردار بازخورد تصادفی به وسیله اجرای تابع نمونه R ( یعنی 100 تکرار ) به صورت زیر است :
Sample (x=100, size=13, replace=FALSE)
تابع نمونه نمونه ای از اندازه 13 را از 100 عنصر x بدون جایگذاری میگیرد . سپس برای 100 بردار بازخورد تصادفی این روش (نمودار 2) به کار رفته بود و 100 خطای کلی محاسبه شده بود . به علاوه سناریو بدترین حالت در نظر گرفته شده بود که در آن ارزش های بردار رتبه های قابل پیشبینی به ترتیب معکوس در مقایسه با رتبه های واقعی در شرایط شاخص های بردار چیده شده بودند. در نتیجه خطای کلی بیشینه شده بود. توجه کنید که نرخ خطای بیشینه به تعداد دوستان در ماتریس X بستگی دارد . فرض کنید n تعداد دوستان باشد آنگاه اگر n یک عدد فردی باشد آنگاه تفاوت بیشینه بین رتبه محاسبه شده و واقعی 1/2(n2-1) خواهد بود و اگر عدد زوجی باشد اختلاف بیشینه 1/2n2 خواهد بود.

5 نتایج ذ fdajv hc ده اند.ان از پایین ترین اعتماد به بالاترین اعتماد ننده شروع میشود . مثالی از لیست مرتب دوستان

ماتریس X که به عنوان نمونه استفاده شده است در جدول 5 نشان داده شده است.

بردار بازخورد کاربری ثابت برابر بوده است با
u= [3, 1, 9, 8, 13, 7, 2, 12, 6, 4, 11, 10, 5]. برای مثال این بردار نشان میدهد که پنجمین دوست بالاترین رتبه را دریافت کرده است و دومین دوست پایین ترین رتبه را دریافت کرده است . بردار بازخورد همچنین به عنوان بردار اعتماد واقعی استفاده میشود.(T= [3, 1, 9, 8, 13, 7, 2, 12, 6, 4, 11, 10, 5]). درنتیجه بردار وزنی w به صورت [-0.570, -6.321, 1.246, -16.488, 2.705, 0.522,
4.436, -2.533, 0.276]محاسبه میشود . توجه کنید که برای هدف قابلیت خوانایی ارزش ها به سه رقم اعشاری کوتاه شده اند اما در محاسبات واقعی ارزش های خام استفاده شدند. بردار اعتماد محاسبه شده t' به صورت زیر بدست آمده است :
[2.425, 3.750, 8.502, 7.147, 12.627, 4.996, 2.232, 11.722, 7.227, 3.922, 10.767, 11.151, 5.000]
این بردار نشان میدهد که برای مثال پنجمین دوست بالاترین رتبه را دریافت کرده است و هفتمین دوست کمترین رتبه را دریافت کرده است . بنابرین بردار رتبه های پیشبینی شده برابر خواهد بود با [2, 3, 9, 7, 13, 5, 1, 12, 8, 4, 10, 11, 6] . مقایسه رتبه های محاسبه شده و سناریو بهترین نمونه در گراف 1 نشان داده شده است که در آن نقطه های قرمز بیانگر رتبه های پیشبینی و خط آبی سناریو بهترین نمونه را نشان میدهد و خطوط عمودی سبز نشان دهنده خطاهاست . توجه کنید که سناریو بهترین نمونه زمانی است که رتبه های محاسبه شده برابر با رتبه های واقعی شوند.

گراف 1. مقایسه رتبه های پیشبینی شده با سناریو بهترین نمونه .
همانطور که در گراف 1 مشاهده میشود خطای رتبه های قابل پیشبینی برای دوست یک تا 13 برابر است با[1, 2, 0, 1, 0, 2, 1, 0, 2, 0, 1, 1, 1]. در نتیجه خطای کلی بازخورد واقعی ( مجموع مجذور های خطاها ) برابر با 18 خواهد بود . میانگین 100 خطای کلی برابر با 117 و خطای کلی برای سناریو بدترین نمونه برابر با 728 است.سرانجام خطاها بر اساس خطای کلی سناریو بدترین نمونه نرمال سازی میشوند ( گراف 2)

گراف 2 .ارزش نرمال شده خطاهای کلی

4 بحث
همانطور که در گراف 2 نشان داده شد خطای این روش به طور قابل ملاحظه ای کمتر از بازخورد تصادفی است . فرضیه این بود که روابط متقابل کاربری و اعتماد به همان اندازه شباهت کاربری با هم همبستگی ندارند . اگر فرضیه درست باشد خطای بدست آمده با استفاده از بازخورد واقعی نباید کمتر از خطای میانگین آزمون ها باشد. در این پایان نامه پیشنهاد شده است که اولویت بندی صندوق ورودی با استفاده از روش انتخاب شده قابل دستیابی است .به علاوه اعتماد به طور بحث برانگیزی با رابطه متقابل و شباهت همبستگی دارد . نتیجه بررسی نمونه ای با بررسی های قبلی موافقت میکند که در آنها همبستگی اعتماد و روابط متقابل به همان اندازه شباهت در زندگی واقعی وجود داشت. به علاوه نتیجه مزیت های پیشنهاد شده اطلاعات اجتماعی را برای جلب اعتماد در اولویت بندی ایمیلی پشتیبانی میکند . بررسی نمونه ای میتواند وسیع تر شود تا بتواند اطلاعات اجتماعی گسترده تری را از پروفایل کاربری در برگیرد و این میتواند به وسیله اضافه کردن ابعادی به بردار روابط متقابل کاربری صورت بگیرد. اهمیتی ندارد که چه تعداد معیار یا چه نوع معیار هایی بردار طراحی شده ممکن است داشته باشد محاسبات رتبه اعتماد به یک طریق انجام خواهد شد.

اگرچه این پایان نامه بر روی استفاده از اعتماد برای اطمینان بخش تر کردن ایمیل ها تمرکز دارد اما دامنه های بسیار دیگری نیز وجود دارند که این روش در آنها میتواند استفاده شود. برای مثال در سیستم های توصیه ای آنلاین . عموما سیستم های توصیه ای میتوانند به وسیله استفاده از رتبه اعتماد بهبود یابند .
7 تهدیدهای اعتبار

7.1 ساختن اعتبار

ساختن اعتبار به معنای انتخاب مناسب ترین سنجش برای مفهوم مورد بررسی است . انتخاب مجموعه ای متفاوت از معیارها برای اندازه گیری روابط متقابل و شباهت بین کاربران یا استفاده از محتوای روابط متقابل به جای شمارش تعداد آنها میتواند روی نتایج تاثیر گذار باشند. این تاثیر غیر قابل جلوگیری است زمانی که اطلاعات راجب چگونگی عمل کاربران در شبکه اجتماعی ها و درک کاربران راجب فعالیت ها محدود میباشد.بنابرین این مساله که آیا یک مجموعه مشخص از معیارها به خوبی با اعتماد نسبت به دوستان مرتبط هست یا خیر میتواند بحث شود. چیزی که مهم است این است که قابلیت اجرای مجموعه معیارها را امتحان کنیم نه اینکه به دنبال شناسایی بهترین مجموعه معیارها برویم . اما در بررسی نمونه ای تلاش بر روی اعتماد به معیارهایی شده است که در شرایط روابط اجتماعی با معنی هستند.

7.2 آزمایش اطمینان

هدف آزمایش اطمینان در بررسی نمونه ای مطمئن شدن از این مساله است که اگر محقق دیگری روالی یکسانی را طی کند و رفتار بررسی نمونه ای یکسانی را نشان دهد آنگاه یافته های یکسانی به دست خواهند آمد.بنابرین راه کلی نزدیک شدن به مشکل اطمینان سندیت دادن به روال تا حد ممکن است.

8 نتیجه گیری ها و کار آینده

این پایان نامه اولویت سازی ایمیلی را از طریق شبکه های اجتماعی به وسیله استفاده از اطلاعات اجتماعی حل کرده است . این کار با تمرکز بر روی روابط متقابل و شباهت بین دوستان در شبکه اجتماعی انجام شده است.یک تحلیل نظری برای شناسایی شاخصه مدل اعتماد مناسب صورت گرفته است . الگوریتم 1 برای تخمین وزن های معیارهای مختلف اطلاعات اجتماعی پیشنهاد شده است . برای داشتن پیشبینی های اعتمادی بر پایه ترجیحات کاربری الگوریتم وزن های بر پایه بازخورد کاربری را تنظیم میکند.علاوه بر این الگوریتم 2 برای محاسبه رتبه اعتماد و اولویت بندی صندوق ورودی ایمیل ها استفاده میشود. و در نهایت الگوریتم 3 برای تخمین خطای رتبه های اعتمادی محاسبه شده (پیشبینی شده) استفاده میشود . برای نشان دادن قابلیت اجرای روش یک بررسی نمونه ای از روش استفاده شده در فیس بوک صورت گرفته بود. بررسی نشان میداد که روش انتخاب شده قابل استفاده است و برای کاربران وسیله ای برای اولویت بندی صندوق های ورودی ایمیلی بر پایه اطلاعات استخراج شده از فیس بوک به وجود می آورد. تحلیل نشان میدهد که روش کمترین مجذورها(مربع ها) یک روش مناسب برای تخمین وزن هایی است که در محاسبه رتبه های اعتماد استفاده میشوند و بنابرین برای اولویت بندی صندوق ورودی ایمیل ها هم مناسب است.

در کل بهبود ادامه دار روش انتخاب شده مهم است چون میتواند به عنوان سرویسی توسط کاربران در مبنای روزانه استفاده شود. علاوه بر سیستم های ایمیلی , روش انتخاب شده میتواند برای گسترش اثرمفید سرویس های کارامد متفاوت دیگری از قبیل موتورهای جستجو , سیستم های توصیه ای(پیشنهادی) و جمع آورندگان اخبار به وسیله رتبه بندی نتایج مربوط در اول استفده شود.روش انتخاب شده همچنین میتواند برای روشن ساختن معنی فعالیت های کاربران در شبکه اجتماعیها و همبستگی اعتماد و روابط متقابل کاربری همانند شباهت در شبکه اجتماعی استفاده شود.به طور ویژه امید ما اجرای یک آزمایش کامل با مجموعه داده های بزرگتر و بازخوردهای بیشتر برای مشاهده چگونگی کارکرد روش است.

41


تعداد صفحات : 39 | فرمت فایل : WORD

بلافاصله بعد از پرداخت لینک دانلود فعال می شود