استفاده از مجموعه داده های بزرگ در رفتار مصرف کننده آنلاین: تجزیه و تحلیل کتاب شناختی و محاسباتی مبتنی بر متن کاوی تحقیقات قبلی
میکا وانهالا *a
چین لو*b
یااککو پلتونن*b
ساندا سندقویستا*a,c
کالروو یورولین*b
جیرکی نومنما*b
دانشگاه LUT ، دانشکده تجارت و مدیریت LUT فنلاند :a
دانشگاه تامپره ، دانشکده فناوری اطلاعات و علوم ارتباطات ، فنلاند :b
دانشکده تجارت ، دانشگاه آلتو ، فنلاند :c
کلمات کلیدی:
تحلیل کتاب سنجی
رفتار مشتری
انلاین
مجموعه دادگان بزرگ
تحلیل متنی
چکیده
این مقاله سیر تحول تحقیقات علمی راجع به استفاده از مجموعه داده های بزرگ در رفتار مصرف کنندگان آنلاین بین سالهای 2000 و 2018 گزارش می کند. بنابراین ، اطلاعاتی در مورد تحول این زمینه از نظر شناسایی نشریات و نویسندگان اصلی و همچنین چگونگی تکامل مطالب خاص در طی زمان را در اختیار شما قرار می دهد. علاوه بر این ، با استفاده از مدل سازی مطلب و تکنیک های تجزیه و تحلیل متن ، برخی از مطالب تحقیقاتی از تحقیقات مقالات منتشر شده موجود در مجموعه داده مشخص شده است و راهنمایی برای کسانی که می خواهند در این زمینه همکاری کنند ارائه می دهد. علاوه بر ان ، این مقاله با استفاده از مدل سازی مباحث ساختاری به منظور دستیابی به نتایج مفصل تر ، به روش مربوط به بررسی نشریات و تجزیه و تحلیل کتاب سنجی با مدل سازی مطالب انجام شده کمک می کند تا مباحث نهفته را از مطالب جمع آوری شده استخراج کند.
مقدمه:
در دو دهه گذشته ، زندگی روزمره ما به دلیل پیشرفت در فناوری اطلاعات و همچنین اینترنت و دیجیتالی شدن ، متحول شده و کانون تجارت را به سمت محیط های دیجیتالی آنلاین سوق داده است. این تغییر همچنین نحوه رفتار مصرف کنندگان، از جمله محیط فروشگاه و خرید محصولات و خدمات را تغییر داده است .(دارلی ، بلانکسون و لوئتژ ، 2010 ؛ کیم و لنون ، 2008). در محیط آنلاین ، تصمیمات مصرف کنندگان برای خرید برخی از محصولات و خدمات تحت تاثیر متغیرهایی فراتر از محصول یا خدمات واقعی قرار می گیرد ، مانند طراحی وب سایت یا دهان به دهان الکترونیکی (شامل بررسی ها و توصیه های آنلاین) و سالوی ، 2014). بنابراین ، رفتار آنلاین مصرف کننده یکی از زمینه های اصلی تحقیق در علم بازاریابی بوده است و مطالب بسیاری از مطالعات است. به عنوان مثال ، دانشمندان سیستم اطلاعات و بازاریابی ویژگی های سایت زیست محیطی(Manganai، Siomkos، Rigopoulou، & Vrechopoulous، 2011؛ Richard & Habibi، 2016) ، ویژگی های جستجوی جهانی (Hausman & Skiepe، 2009) ، گزینه های زبان (Hausman & Skiepe ، 2009) ، طراحی سایت (Ha ، Kwon و Lennon ، 2007 ؛ Mummalaneni ، 2005) ، امنیت سایت (Hausman & Skiepe ، 2009) و فرهنگ Richard & Habibi، 2016).
در سال های اخیر ، روند افزایشی وجود داشته که بر اهمیت تجزیه و تحلیل داده ها و همچنین استفاده از مجموعه داده های بزرگتر تاکید می کند. تجزیه و تحلیل داده ها چیز جدیدی نیست. در واقع ، انواع مختلف داده ها به مدت طولانی در یک شکل یا شکل دیگر جمع آوری شده اند. با این حال ، پیشرفت های فناوری (به عنوان مثال در ذخیره سازی و انتقال اطلاعات) ، جمع آوری مداوم و داده ها را امکان پذیر کرده است. توانایی ذخیره این داده ها نیز، به دلیل فناوری های ذخیره سازی محلی بزرگتر و افزایش راه حل های فضای ذخیره سازی ابر تقریباً نامحدود است. بنابراین ، تمرین جمع آوری داده ها در مقیاس بزرگ ،آسان و معمول شده است. با این حال ، چالش تجزیه و تحلیل این است که فراتر از جمع آوری و ذخیره سازی داده ها و ساختار آنها به گونه ای باشد که اطلاعات موجود در آن قابل دسترسی و استفاده باشد. این جایی است که داده های بزرگ یا تجزیه و تحلیل داده های بزرگ یعنی مطلب داغ دهه گذشته ، جای خود را می گیرد. داده های بزرگ اصطلاحی است که هم به جمع آوری و هم به تجزیه و تحلیل مجموعه داده های بزرگ اشاره دارد. یعنی روشی برای ایجاد ارتباطات درون مجموعه داده ها به گونه ای که اطلاعات موجود در آن قابل استفاده شود (به عنوان مثال مراجعه کنید به Erevelles، Fukawa & Swayne، 2016؛ Press، 2013؛ Ruh، 2012).
با این حال ، با وجود تحقیقات فوق در مورد رفتار مصرف کننده آنلاین و مجموعه داده های بزرگ ، طبق مقاله انتقادی توسط دارلی و همکاران (2010) ، تحقیقات با استفاده از داده های نظرسنجی تحت سلطه قرار گرفته است. بیش از 70٪ (37 از 52 مورد) از مطالعات انجام شده در بررسی آنها بر اساس داده های نظرسنجی بود ، از جمله برخی آزمایشات (31٪ ؛ 16/52). بنابراین ، انگیزه این مقاله نه تنها کشف چگونگی انتشار نشریات تحقیقاتی در مورد رفتار مصرف کننده آنلاین داده های بزرگ است ، بلکه همچنین چگونگی ایجاد انواع دیگر مجموعه های داده بزرگ در طی یک و نیم دهه گذشته است. این مقاله با استفاده از ترکیبی از تجزیه و تحلیل کتاب سنجی و مدل سازی مبحث ، پاسخ به سوالات تحقیق زیر را ارائه می دهد:
چگونه تحقیق در مورد رفتار مصرف کننده آنلاین در طول زمان تحول یافته است؟
مناطق غالب تحقیق کدامند؟
کدام نویسندگان و مقالات بیشترین تاثیر را دارند؟
کدام رسانه ها تاثیرگذار هستند؟
چه نوع مطالبی مطالعه شده است؟
راه های تحقیق آینده در مورد رفتار مصرف کننده آنلاین چیست
این مطالعه تحقیقات رفتار مصرف کننده آنلاین را به روشهای مختلف پیش می برد. ابتدا ، با استفاده از تحلیل استنادی کتاب سنجی، این مطالعه با شناسایی انتشارات و نویسندگان اصلی و همچنین چگونگی تکامل مطالب خاص در طول زمان ، به این زمینه کمک می کند. دوم ، علاوه بر تحلیل سنتی کتاب سنجی ، که بیشتر اطلاعات توصیفی را درباره نشریات ارائه می دهد ، ما همچنین از تکنیک های پیشرفته تری برای مدل سازی مطالب و تجزیه و تحلیل متن استفاده می کنیم. با استفاده از این رویکرد جامع تر ، می توان در نشریات بیشتر تحقیق کرد و دید که چه نوع مطلبی را می توان به روش داده محور شناسایی کرد ، بدون این که مثلاً تحلیل را به یک مجموعه از پیش تعیین شده مطالب محدود کنیم. این امر هم بینش جدید مبتنی بر داده و هم توجیه (یا کمبود آن) را برای فرضیه های مربوط به مطالب تحقیقاتی رایج فراهم می کند. بنابراین ، می توان اطلاعات عمیق تری در مورد نشریات موجود به دست آورد.
مجموعه داده های بزرگ و رفتار مصرف کننده آنلاین
گفته شده است که رفتار مصرف کننده در محیط آنلاین با رفتار مصرف کننده در محیط سنتی تفاوت ندارد و الگوهای رفتار عمومی مصرف کننده نیز در فضای آنلاین قابل اجرا است (لی و چن ، 2010). به عنوان مثال ، کوفاریس (2002) اظهار داشت که محیط های سنتی و آنلاین به وضوح از ویژگی های مشترک برخوردارند ، اما در محیط آنلاین ، مصرف کنندگان به دلیل نقش دو برابری که هم به عنوان مصرف کننده و هم به عنوان کاربر سیستم اطلاعات دارند ، نیازها و نگرانی های منحصر به فرد دیگری دارند (لی و چن ، 2010). مونتگومری ، لی ، سرینیواسان و لیختی (2004) ادعا کردند که در مقایسه با مصرف کنندگان سنتی ، مصرف کننده آنلاین راحتی گرا اند و ابتکاری بیشتری دارد و به دنبال تنوع بیشتری است. در نتیجه ، رفتار آنلاین مشتری می تواند به عنوان نمودی از تصمیم گیری و رفتار مصرف کننده در محیط آنلاین و همچنین عواملی که در این رفتار تاثیر می گذارد یعنی ، به عنوان مثال ، مشتری ها برای یافتن اطلاعات ، مرور وب سایت ها ، ارزیابی محصولات یا مقایسه اطلاعات تعریف شود.
در سال های اخیر ، یک مصرف کننده متوسط نه تنها در داده های سنتی (یعنی ساختاری و معاملاتی) بلکه همچنین از نظر داده های رفتاری معاصر ، بدون ساختار و سازنده به مولد ثابت تبدیل شده است. میزان این داده های تولید شده ، سرعت تولید آن و غنای متنوع آن بر نحوه درمان و تفسیر آن تاثیر می گذارد. به عنوان یک نتیجه طبیعی ، داده های بزرگ به عنوان مطلبی در ادبیات تحقیق مرتبط ظاهر شده اند ، اگرچه عدم استفاده منسجم از این اصطلاح وجود دارد (به عنوان مثال مراجعه کنید Gandomi & Haider، 2015) به معنای دقیق ، داده های بزرگ به معنای مجموعه داده هایی است که برای اقدامات آماری متعارف بسیار بزرگ و پیچیده شده اند ، بنابراین به روشهای پیشرفته و منحصر به فردی برای ذخیره سازی داده ها ، مدیریت ، تجزیه و تحلیل و تجسم آنها نیاز دارند (Chen، Chiang، & Storey، 2012). یا ، همانطور که Erevelles و همکاران (2016) گفته اند (همچنین نگاه کنید به De Mauro، Greco، Grimaldi، & Ritala، 2018؛ Sivarajah، Kamal، Irani، & Weerakkody، 2017) ، مجموعه داده ها به دلیل بی سابقه ای بزرگتر و پیچیده تر شده اند. حجم ، سرعت و تنوع داده های اولیه موجود از مصرف کنندگان منفرد. طبق گفته های Manyika و همکاران (2011 ؛ همچنین به Erevelles و همکاران ، 2016 مراجعه کنید) ، روش اساسی تحلیل داده های کلان با رشته های موجود ، عمدتا آمار و علوم کامپیوتر مرتبط است. داده های بزرگ را می توان به عنوان دارایی داده با حجم بالا ، شهر با سر و صدای زیاد و تنوع بالا تعریف کرد (که معمولاً به آن سه V گفته می شود) ، که روشهای پردازش ابتکاری را می طلبد تا بتوان از اطلاعات حاصل شده برای بدست آوردن بینش های بیشتر برای تصمیم گیری استفاده کرد. -making (Erevelles et al.، 2016؛ Hofacker، Malthouse، & Sultan، 2016؛ Lycett، 2013).
رفتار مصرف کننده مقدار زیادی از انواع خاصی از داده ها را تولید می کند. یکی از اینها داده های جریان کلیک است که به عنوان ثبت الکترونیکی استفاده از اینترنت تعریف شده از ورودی سرور یک وب سایت یا سرویس های شخص ثالث تعریف شده است. این اطلاعات معمولاً حاوی داده های مربوط به کلیک و پیمایش ماوس به صورت جداگانه بر روی سایر عناصر صفحات وب است که بازدید کننده هنگام بازدید از وب سایت خاصی انجام می دهد. این نوع داده ها اطلاعاتی در مورد توالی صفحات مشاهده شده توسط کاربران هنگام پیمایش در یک وب سایت فراهم می کند (Bucklin & Sismeiro 2009؛ Moe، 2003؛ Montgomery et al.، 2004؛ Senecal، Kalczynski، and Nantel، 2005). نوع دیگر ،داده های متنی است که شامل انواع متن های زبان طبیعی مانند صفحات وب ، ایمیل ها و پست های رسانه های اجتماعی است (به عنوان مثال Zhai ، 2017).
یک استفاده خاص از داده های آنلاین مصرف کننده ، تجزیه و تحلیل مسیر است که مبتنی بر داده های مربوط به مسیر پیمایشی است که کاربر از طریق وب سایت طی می کند و همچنین بینش مبتنی بر تجزیه و تحلیل آن داده ها است. به عبارت دیگر ، تجزیه و تحلیل داده های مسیر، اطلاعاتی در مورد توالی وقایع منجر به تصمیم برای خرید را تولید می کند. این اطلاعات به طور معمول حاوی داده هایی در مورد اهداف ، دانش و علایق کاربر است که می تواند برای پیش بینی رفتار مصرف کننده استفاده شود (باکلین و سیسمیرو ، 2009 ؛ مونتگومری و همکاران ، 2004). در همین حال ، تجزیه و تحلیل مشتری به عنوان فرایند کلی تعریف می شود که از طریق آن داده های مربوط به رفتار مشتری برای کمک به تصمیم گیری های تجاری استفاده می شود. تجزیه و تحلیل در محل اتصال داده ها و رفتار مصرف کننده است. داده ها بینشهایی راجع به رفتار مشتری ارائه می دهند ، به عنوان مثال ، و بازاریابان این بینش ها را به مزیت بازار تبدیل می کنند (به عنوان مثال ، به Corrigan ، Craciun و Powell ، 2014 ؛ Erevelles و همکاران ، 2016 مراجعه کنید).
روش شناسی
3.1 جمع آوری داده ها
جستجوی اولیه برای مقالات بالقوه در فوریه 2019 انجام شد. ما داده ها را از پایگاه داده دانشگاهی( ISI Web of Science )همچنین تحت عنوان وب دانش و مجموعه هسته آن جمع آوری کردیم. طبق گفته های Fetscherin and Heinrich (2015 ؛ همچنین به Fetscherin & Usunier مراجعه کنید ، 2012) ، ISI Web of Knowledge زمانی پایگاه داده مناسب است که هدف بررسی نشریات بین رشته ای باشد و بسیاری از مطالعات قابل توجه کتاب سنجی از این پایگاه داده استفاده کرده اند.
ما به دنبال انتشاراتی بودیم که اتاریخ تاسیسش ز ژانویه 2000 تا دسامبر 2018 باشد. سال 2000 به عنوان سال برش انتخاب شد ، زیرا می توان آن را اولین سالی دانست که در نشریات از مجموعه داده های بزرگ استفاده می شود. دسامبر 2018 جدیدترین تاریخی است که داده های استنادی کامل از ISI Web of Science برای ما در دسترس است.
برای جمع آوری اطلاعات جامع ، ما به دنبال مقالات ژورنالی بودیم که بر اساس ظاهر عبارات جستجو در قسمت مطلب در Web of Science به زبان انگلیسی نوشته شده اند. قسمت مطلب شامل عنوان ، چکیده و کلمات کلیدی مقالات است. همچنین شامل به اصطلاح محتوای "کلمه کلیدی به علاوه" ، کلمات کلیدی مرتبط دیگر اما نادیده گرفته شده است که توسط نویسندگان یا ناشران ذکر نشده است اما براساس تخصص ویراستاران وب علم است. ما از طبقه بندی سه وجهی خود برای عبارات جستجو استفاده کردیم. سطح اول "سطح داده" نامگذاری شد و نشان داد که کدام نوع داده در مقاله ها استفاده شده است. عبارات جستجوی این سطح "داده های کلان" ، "جریان کلیک" ، "داده های متنی" ، "تجزیه و تحلیل مسیر" و "تجزیه و تحلیل مشتری" بود. سطح دوم با عنوان "سطح فردی" نشان داده شد ، که نشان دهنده نقش فرد است. عبارات جستجوی "مشتری" و "مصرف کننده" برای این سطح استفاده شده است. سرانجام ، سطح سوم بیانگر زمینه ای است که مصرف کننده یا مشتری در آن فعالیت می کند. برای این سطح ، عبارات "خریداری" ، "خرید" ، "بحث آنلاین" ، "جستجوی اطلاعات" ، "سفر مشتری" ، "آنلاین" و "تلفن همراه" را در جستجوی خود قرار دادیم. جستجو به گونه ای انجام شد که معیارهای جستجو در هر سطح گزینه های مکمل دیگری باشد (یعنی کافی بود که یکی از اصطلاحات جستجو در سطح وجود داشته باشد). برای این ، ما از عملگر متغیر بولین"OR" استفاده کردیم. بین سطح ، معیارهای جستجو باید به طور همزمان برآورده شوند (یعنی حداقل یک عبارت جستجو باید از هر یک از سطوح وجود داشته باشد). برای این کار از عملگر متغیر بولین 'AND استفاده شد. مجموعه کل معیارهای جستجو که ما در Web of Science استفاده کردیم در جدول 1 ارائه شده است.
جدول شماره یک
سطح عبارت جست و جو
داده مطلب: داده بزرگ یا جریان کلیک یا داده متنی یا تحلیل مسیر
فردی مطلب: مشتری یا مصرف کننده
مربوطه مطلب: خرید یا خریداری یا گفت و گوی انلاین یا جست و جوی اطلاعات یا سفر مشتری یا انلاین یا موبایل
در نتیجه جستجو ، 498 مقاله پیدا کردیم. براساس بازرسی دستی از این مقالات ، ما سه مقاله را حذف کردیم زیرا آنها در واقع مربوط به مجموعه داده های بزرگ نبودند. سرانجام ، 495 مقاله در تجزیه و تحلیل کتاب سنجی وارد شدند. ما مقالات را در هشت گروه مختلف از جمله "تجارت و اقتصاد" ، "علوم کامپیوتر و علوم اطلاعات" ، "مهندسی" ، "بهداشت" ، "مهمان نوازی" ، "علوم محیطی" ، "ارتباطات" و "سایر" طبقه بندی کردیم انواع مجلاتی که به آنها تعلق داشتند ، جایی که گروه "دیگر" شامل نشریاتی از مجلات مرتبط با شیمی ، ریاضیات و آموزش بود. جدول 2 تعداد انتشارات از زمینه های مختلف را نشان می دهد.
جدول شماره دو
*تعداد نشر
دسته بندی تعداد نشر
اقتصاد و تجارت 195
علوم رایانه و علوم اطلاعات 133
مهندسی 33
سلامتی 26
مهمان نوازی 26
علوم محیطی 16
ارتباط 14
و غیره 35
تحلیل کتابسنجیک
تجزیه و تحلیل داده های کتابسنجی برای ارائه تجزیه و تحلیل کمی از ادبیات دانشگاهی انجام شد. تحلیل کتاب سنجی ، تحلیل آماری نشریات مکتوب و تحلیل استنادی است و بر اساس ساخت نمودار استنادی ، شبکه یا نمایش نمودار ارجاعات بین اسناد است. بسیاری از زمینه های تحقیقاتی از روش های کتاب سنجی برای بررسی تاثیر رشته خود ، مجموعه ای از محققان یا مقاله خاص استفاده می کنند (به عنوان مثال Fetscherin & Heinrich، 2015؛ Hajikhani، 2017؛ Nicolaisen، 2010)
برای این مطالعه ، تجزیه و تحلیل داده های کتاب سنجی با استفاده از ابزار شبکه تجزیه و تحلیل شبکه برای مطالعات نشریاتNAILS) ) نجام شد (Knutas ، Hajikhani ، Salminen و Porras ، 2015). ابزار NAILS چندین متغیر اساسی از هر نشریه را تجزیه و تحلیل می کند ، از جمله نویسندگان ، کلمات کلیدی ، انجمن انتشارات ، نوع مقاله و مقالات ذکر شده. پس از بارگیری داده ها از Web of Science ، این ابزار سوابق تکراری را حذف کرده و تجزیه و تحلیل داده های اکتشافی را انجام می دهد ، که مقالات و نویسندگان پر استناد ، بیشترین کلمات کلیدی و مجلات دارای بیشترین انتشار را مشخص می کند. این سیستم همچنین داده های شبکه استنادی را از انتشارات استخراج می کند. علاوه بر گزارش تجزیه و تحلیل اکتشافی ، این ابزار همچنین داده هایی را در مورد شبکه های همکاری با نویسندگان و نویسندگان فراهم می کند ، که می تواند تجسم یابد. از این نوع مجموعه داده ها در مورد اتصالات استنادی می توان برای محاسبه تاثیر نسبی انتشارات در شبکه استفاده کرد (Knutas et al.، 2015)
در ابزار NAILS ، معیارهای مختلفی به عنوان مثال( PageRank و In-Degree) بر اساس داده های استناد محاسبه شد. PageRank (برین و پیج ، 1998) تعداد و کیفیت پیوندهای مقاله را برای بدست آوردن اهمیت تقریبی آن محاسبه می کند ، در حالی که(مقدار ورودی) In-Degree تعداد استنادات ارجاع شده به مقاله جداگانه را بر اساس سوابق داده های استنادی ارائه می دهد. با استفاده از این معیارها ، گزارشی تهیه شد که تجزیه و تحلیل چکیده و کلمات کلیدی و همچنین پربارترین نویسندگان و مجلات را ارائه می داد.
متن کاوی و مدل سازی موضوع
کاوش متن با مدل سازی موضوع به منظور کشف مطالبی است که در مجموعه ای از اسناد برای کشف ساختارهای معنایی پنهان در بطن متن وجود دارد. در این کار ، متن کاوی و مدل سازی موضوع با استفاده از مدل موضوع ساختاری انجام شد (STM ؛ رابرتز ، 2014). اگرچه متداول ترین روش مدل سازی موضوع ، تخصیص پنهان دیریشله (LDA ؛ بلی ، 2012) است و اجرای آن حتی در ابزار NAILS نیز تعبیه شده است (حاجی خانی ، 2017 ؛ بر اساس یک برنامه تجسم LDA توسط سیورت و شرلی ، 2014) ، ما تصمیم گرفتیم از روش STM پیشرفته تر و پیچیده تری استفاده کنیم. به طور خلاصه ، این به این دلیل است که STM هر دو یک مدل احتمالی از نظر کمی مناسبتر برای مجموعه سند است و به این دلیل که برخلاف LDA ، مستقیماً قادر به تعامل متغیرهای متغیر مانند زمان با موضوعات است. علاوه بر این ، اجرای خاص NAILSهای LDA محدودیت های بیشتری دارد. ما در ادامه جزئیات STM و آموزش آن را ارائه می دهیم و سپس در بخش 3.3.2 جزئیات بیشتر برتری STM نسبت به LDA را شرح می دهیم.
برای غنی سازی منبع متن ، ان را از عنوان سند ، کلمات کلیدی و چکیده ترکیب کردیم. توجه داشته باشید که این فرایند به مدل موضوع اجازه می دهد تا اصطلاحات را در صورتی که در بیش از یک مکان ذکر شده تاکید کند (مثلاً در چکیده و در کلمات کلیدی). همانطور که گفته شد ، ما از روش تجزیه و تحلیل متن پیشرفته تری (STM) استفاده کردیم که به ما امکان می داد با کاوش در روابط بین موضوعات نهفته و متغیرهایی که به آنها علاقه مند بودیم ، بینش بیشتری کسب کنیم. به عنوان مثال مدل STM به طور گسترده ای در رشته های مختلف مورد استفاده قرار گرفته است ، به عنوان بخشی از ارزیابی تاثیرات سانسور در چین با تجزیه و تحلیل پست های وبلاگ (رابرتز ، 2014) و به عنوان بخشی از تجزیه و تحلیل پرسشنامه های باز برای کاوش در افکار عمومی در مورد تغییرات آب و هوا (Tvinnereim & Fløttum ، 2015)
STM مانند LDA ، اسناد را ناشی از آمیزه ای از موضوعات زمینه ای با شیوع مختلف ، و محتوای موضوع را به نوبه خود ، به عنوان مخلوطی از اصطلاحات کلمه یا بزرگ با شیوع مختلف ، مدل می کند. موضوعات مختلف اساساً نمایانگر گروههای مختلفی از واژه ها یا اصطلاحات بزرگ مکرر است که مرتباً اتفاق می افتند. هر کلمه با موضوعات مختلف با شیوع (احتمالات) مختلف مرتبط است. این مباحث را می توان با رایج ترین (محتمل ترین) کلمات آنها خلاصه کرد. با بیان توضیحات بالا به روش ریاضی ، ابتدا یک پارامتر شیوع موضوع θd برای هر کلمه حاوی احتمال k = 1 ،… ، K موضوعات مختلف ایجاد می کند. سپس ، برای هر موضوع k ، مدل پارامتر محتوای موضوع βk را بر روی واژگان v = 1 ،… ، V تولید می کند. کلمه nام در سند d ، wn با ایجاد یک برچسب موضوع zn از یک توزیع چند جمله ای با پارامتر θd و سپس رسم یک کلمه از کلمه مربوطه از توزیع چند جمله ای دیگر با پارامتر βzn تولید می شود. با این حال ، بر خلاف مدل پایه LDA ، مدل STM فرض می کند که شیوع و محتوای موضوع می تواند به برخی از متغیرهای متغیر در سطح سند بستگی داشته باشد. یعنی ، در STM ، θd در یک روش شبیه به رگرسیون تولید می شود که از توزیع لوجیستیک نرمال گرفته شده است:
که در آن xd متغیرهای سطح سند هستند ، Γ ماتریس ضرایب و Σ یک ابر پارامتر است. علاوه بر این ، محتوای موضوع β دارای ساختار کششی است و متشکل از
که در آن iمجموعه ای از ضرایب موضوع (t) ، متغیرهای متغیر (c) و تعامل (i) است. در این تحقیق ، ما دو متغیر ، زمان استناد و گروه هر مقاله (به بخش 3.1 و جدول 2 مراجعه کنید) در مدل خود قرار دادیم. زمان استناد با توجه به سال انتشار تنظیم شد تا تاثیر ناشی از تراکم استنادها در طول زمان کاهش یابد.
ما بیشتر مشخص کردیم که زمان استناد و دسته بندی به شیوع موضوع مرتبط بوده و این گروه به تنهایی متغیر وابسته به محتوا است.
متن ورودی پس از حذف کلمات ممنوع شده (علاوه بر لیست ارائه شده توسط بسته نرم افزاری ، برخی اصطلاحات دیگر به صورت دستی اضافه شدند ، مانند "این" ، "این" ، "و غیره" و "نیمه") ، کلمات مربوط به قالب در چکیده (هدف ، روش طراحی ، و غیره) ، متن حق چاپ و علائم نگارشی ساده شد . ما متوجه شدیم که برخی از کلمات کلیدی حاوی اطلاعات مهم، عبارت های بیگ رم هستند ، مانند "داده های بزرگ" ، "تجزیه و تحلیل مسیر" ، "داده های جریان کلیک" ، "تجارت الکترونیکی" و "رسانه های اجتماعی". ما این اصطلاحات را پس از مجاز سازی بهم پیوند دادیم. اصطلاحات بزرگ منتخب بر اساس لیست کلمات کلیدی از مجموعه داده های NAILS انتخاب شدند. علاوه بر این ، ما همچنین برخی اصطلاحات بیگ رم را با فرکانس های بالا در متن انتخاب کردیم.
ما از احتمال وقفه برای انتخاب تعداد عناوین استفاده کردیم که طبق آن 50٪ از مطالب سند جمع آوری شده به طور تصادفی برای ساخت مدل STM انتخاب می شوند و مدلهای ساخته شده براساس احتمال آنها در 50٪ محتوای دیگر سند ارزیابی می شوند که برای ساخت مدل استفاده نشده است. همین روند با شماره مباحث از 2 تا 20 انجام شد. در هر تنظیم ، 50 مدل STM ساخته شد و میانگین مقادیر احتمالی محاسبه شد. میانگین احتمال وقفه مدل های STM وقتی عدد موضوع برابر با 14 باشد به مقدار مطلوب رسیده است. بنابراین ، تعداد مباحث به 14 تنظیم شد.
ما ابتدا 100 مدل با مقداردهی اولیه متفاوت ساختیم و سپس مدلی با بالاترین مقدار انسجام معنایی را انتخاب کردیم. انسجام معنایی میانگین، سنجش عملکرد خوبی از کیفیت مدل موضوع بود، و این موضوع که آیا کلمات برتر هر موضوع تمایل دارند که در کنار هم در میان اسناد وجود داشته باشند یا خیر را سنجید.
برای تعیین کمیت تاثیر مباحث یافت شده در استنادها ، تجزیه و تحلیل نسبتهای استناد نسبی را انجام دادیم ، به شرح زیر. با توجه به جمعیت اسنادی که شامل چندین موضوع می شود ، تحلیل فرض می کند که استنادها بر اساس محتوای موضوعی بوجود می آیند و اعتبار (مسئولیت) استناد های هر سند را به عناوین متناسب با پراکندگی آنها در سند اختصاص می دهند. بر این اساس ، cd ، k = θd ، k × cd مسئولیت موضوع k در یک سند d با نسبت موضوع θd ، k و استناد countcd است. میانگین تعداد استنادها که از یک موضوع خاص ناشی می شود ، متوسط استنادهای اختصاص یافته آن نسبت به جمعیت اسناد است ، = = ACk c D d D d k 1 1،. در مقابل ، میانگین پراکندگی مبحث بر جمعیت سند = k D d = D d k 1 1 است. سرانجام ، نسبت استنادی نسبی RCk یک موضوع به طور متوسط تعداد استنادات آن در مجموعه اسناد تقسیم بر میانگین پراکندگی آن در مجموعه است ، RCk = ACk / θk. نسبت استنادی نسبی نشان می دهد که آیا برخی از عناوین به احتمال زیاد استناد می کنند: اگر همه مباحث به تناسب مقدار موجود در مجموعه اسناد را جمع کنند ، نسبت استناد نسبی برای همه مباحث یکسان است ، در حالی که اگر نسبت استناد نسبی برای برخی از عناوین بالاتر باشد، این بدان معنی است که موضوع با توجه به پراکندگی آن بیش از حد انتظار استناد داشته است. ما هر سه شماره θk ، ACk و RCk را برای هر مبحث گزارش خواهیم کرد.
3.3.2. مقایسه مدل سازی موضوع STM در مقابل LDA
ما به دو دلیل مدل STM را برای رایج تر بودن نسبت به LDA انتخاب کردیم: تناسب کمی بهتر STM با مجموعه اسناد و توانایی STM در مدل سازی متغیرها. هر دو را در زیر توصیف می کنیم. همچنین به طور خلاصه محدودیتهای اضافی را در اجرای خاص NAILS LDA توصیف خواهیم کرد.
3.3.2.1. توانایی کمی در مدل سازی مجموعه اسناد. همانطور که در زیر بخش قبلی توضیح داده شد ، احتمال وقفه ، سنجش چگونگی تناسب یک مدل احتمالی با مجموعه اسناد است و ما می توانیم از آن برای مقایسه مدل موضوع STM با مدل LDA استفاده کنیم. مدل های موضوعی LDA می توانند به همان گونه که مدل های STM احتمال وقفه را بازده بدهند ،. بنابراین ، ما میانگین مقادیر احتمالی هر دو مدل STM و LDA را برای تعداد مختلف موضوعات محاسبه کرده ایم. مدل های STM از مدل های LDA بهتر عمل کرده اند. بهترین مقدار احتمالی از مدل های LDA 6.93 − بود ، در حالی که بهترین مقدار از مدل های STM 6.691 بود.
علاوه بر مقدار معیار کمی بهتر ، در عمل ، نتایج STM از نظر معنایی بیشتر توصیفی به نظر می رسد. کلمات برتر عناوین با موضوعات همپوشانی دارند (یعنی مباحث مشخصه های مشخصاً جداگانه ای ندارند) ؛ علاوه بر این ، کلمات برتر هر مبحث در مقایسه با مطالب عنوان شده توسط STM از لحاظ معنایی نسبتاً جامع بودند.
3.3.2.2. امکان مدل سازی روابط بین متن و متغیرها. LDA فقط بر روی محتوای متن تمرکز دارد ، بنابراین نمی تواند بینشی را در رابطه بین متن و سایر متغیرها مانند استنادها و دسته ارائه دهد. اگرچه انجام یک تجزیه و تحلیل امکان پذیر است ، ما تصمیم گرفتیم داده های جمع آوری شده (هر دو محتوای متن و متغیرهای سطح سند) را به صورت یکپارچه تجزیه و تحلیل کنیم ، که STM مستقیماً قادر به انجام آن است.
3.3.2.3. محدودیت های اضافی در مورد نرم افزار NAILS. فراتر از دو مزیت کلی STM نسبت به LDA که در بالا مورد بحث قرار گرفت ، اجرای ویژه نرم افزار NAILS LDA محدودیت های دیگری دارد که می توان با استفاده از یک برنامه نرم افزاری دیگر LDA از آنها جلوگیری کرد ، که به طور خلاصه در اینجا ذکر شده است: 1) NAILS فقط از متن چکیده برای مدل سازی موضوع استفاده می کند و سایر مطالب آموزنده مجموعه داده ها ، مانند ستون های کلمه کلیدی را نادیده می گیرد. 2) NAILS از "stemming" (برش پسوندها و پیشوندهای کلمات) استفاده می کند ، در حالی که ما "lemmatization" را ترجیح می دهیم ، که مورفولوژی را در نظر می گیرد و می تواند اشکال واحدی را برای موارد پیچیده تر مانند افعال نامنظم پیدا کند (به عنوان مثال "drive" ، "drove") "و" رانده شده متفاوت از "درایو" ، "رانده شده" و "رانده می شود" ، اما lematatisation وجه اصلی "درایو" مشترک آنها را پیدا می کند) ما تاکید می کنیم که دلایل ما برای انتخاب STM عملکرد کمی بهتر و توانایی مدل سازی متغیرها است ، که بدون توجه به اجرای خاص LDA برگزار می شود. معایب اضافی NAILS فقط برای کامل بودن ذکر شده است.
مزایای فوق STM نسبت به LDA دلیل انتخاب STM به عنوان روش مدل سازی موضوع برای تجزیه و تحلیل نهایی است. نتایج تجزیه و تحلیل بعدی را ارائه می دهیم.
4. یافته های تحلیل کتاب سنجی
وقوع کلمات
فراوانی کلمات lematatised (درون کلمات کلیدی و چکیده) در 495 مقاله منتشر شده بین 2000 و 2018 در شکل 1 برای اصطلاحات بالا و به صورت گرافیکی کلی و ناهموار به عنوان ابر کلمه در شکل 2 نشان داده شده است. فرکانس ها نشان می دهد که تمرکز ، به عنوان مثال ، بین زمینه مطالعات (آنلاین) و موضوع عمل (مشتری ، مشتری) متفاوت است. از نظر زمینه ، به نظر می رسد بیشترین محیط مورد مطالعه محیط آنلاین است ، از جمله رفتار و همچنین جستجوی اطلاعات مربوط به محصولات.
شکل 3 همچنین پراکندگی وقوع کلمات کلیدی مربوط به روش تجزیه و تحلیل یا نوع داده های بحث شده یا استفاده شده در مقالات را نشان می دهد. باز هم ، لیست کلمات کلیدی و همچنین خلاصه مقالات مورد بررسی دقیق قرار گرفت. بر این اساس ، تعداد مقالات از جمله جریان کلیک ، تجزیه و تحلیل مسیر و استخراج متن از 2000 تا 2018 به میزان متوسطی افزایش یافته است. با این حال ، قابل توجه است ، تعداد مقالات حاوی ارجاع به داده های بزرگ یا بحث درباره آنها رشد سریع بین سال های 2013 و 2018 را تجربه کرده است. در سال 2013 ، فقط یک مقاله از این دست وجود داشت. در سال 2014 ، 9 مقاله وجود داشت. در سال 2015 ، 20 مقاله وجود داشت. و در سال 2018 ، بیش از 60 مقاله مربوط به داده های بزرگ وجود دارد. به نظر می رسد یکی دیگر از حوزه های تحقیقاتی در حال رشد مربوط به شبکه های اجتماعی است. از سال 2013 ، رشد قابل توجهی در تعداد مقاله ها وجود دارد و در سال 2018 بیش از 20 مقاله مربوط به رسانه های اجتماعی وجود دارد.
وقتی فقط به کلمات کلیدی نگاه می کردیم ، محبوبیت داده های بزرگ به طور مشابه مشهود بود. همانطور که شکل 4 نشان می دهد ، داده های بزرگ به عنوان یک کلمه کلیدی در 113 مقاله ذکر شده است. در مقابل ، موارد سنتی مورد علاقه در این زمینه تحقیقاتی ، مانند تجارت الکترونیکی (26) ، داده های جریان کلیک (16 مقاله) و بررسی آنلاین (13) ، در مقالات موجود در مطالعه ما بسیار کمتر مورد توجه قرار گرفتند.
علاوه بر وقوع مطلق کلمات کلیدی ، ما اهمیت آنها را نیز بررسی کردیم. برای این کار ، ما از تعداد استنادها برای مقالات حاوی کلمات کلیدی خاص استفاده کردیم. همانطور که در شکل 5 مشاهده می شود ، "داده های بزرگ" با 951 نقل قول پر استناد ترین کلمه کلیدی بود. 'تجارت الکترونیکی' (763 استناد) ، 'اینترنت' (607) و 'داده های جریان کلیک(544) نیز به طور گسترده کلمات کلیدی ذکر شده بودند. کلمات کلیدی دیگری که بیش از 200 استناد داشتند شامل "بازاریابی اینترنتی" (310) ، "بازاریابی" (302) ، "رسانه اجتماعی" (287) ، "رفتار مصرف کننده" (276) و "محیط با واسطه" (248).
رشد تعداد نشریات
شکل 6 رشد انتشارات را از نظر تعداد مقالات در طول زمان نشان می دهد. تعداد مقالات منتشر شده در هر سال از یک به 15 مقاله در سال های 2000 تا 2010 متغیر بود. پس از آن ، رشد قابل توجهی بود و تعداد مقالات در هر سال رشد می کرد ، از 10 مقاله منتشر شده در سال 2011 به 128 مقاله در سال 2018.
همچنین ، با نگاهی به حجم نسبی نشریات (به عنوان مثال بخش انتشاراتی که در مطالعه ما درباره همه نشریات داخل Web of Science موجود است) مشخص می شود که چگونه اهمیت مباحث موجود در مطالعه ما پدیدار شده است. همانطور که شکل 7 نشان می دهد ، کسری از کلیه نشریات موجود در این مطالعه از سال 2010 رشد ملایمی داشته و از سال 2013 به بعد به صورت عمودی رشد کرده است.
نویسندگان معتبر
شکل 8 لیستی از بیشترین تعداد نویسندگان را ارائه می دهد. از بین تمام نویسندگان 495 مقاله ، شش مقاله مطرح شده C. A. Lin ، R. Larose ، M. S. Eastin (همه با 298 نقل قول) ، S. J. Newell ، B. A. Lafferty و R. E. Goldsmith (همه با 285 استناد). علاوه بر این شش نویسنده ، چهار نفر بیش از 200 نقل قول داشتند: W. W. Moe ، P. S. Fader ، A. L. Montgomery و S. Bellman.
ما علاوه بر تمرکز صرف بر تعداد مطلق استنادها ، مهمترین مقالات را نیز مورد بازرسی قرار دادیم. آنها با استفاده از سه معیار مهم مشخص شدند: اول ، درجه در شبکه استنادی. دوم ، تعداد استنادات ارائه شده توسط Web of Science (فقط برای مقالات موجود در مجموعه داده ها) ؛ و در آخر ، امتیاز PageRank در شبکه استنادی. ده مقاله برتر با بالاترین امتیاز با استفاده از این اقدامات به طور جداگانه مشخص شدند. سپس نتایج ترکیب شده و نسخه های تکراری حذف شدند. نتایج ارائه شده در جدول 3 بر اساس درجه وارده درجه بندی شده اند و پیوندها ابتدا بر اساس تعداد استنادها و سپس بر اساس نمره PageRank شکسته می شوند.
بر اساس این تجزیه و تحلیل ، سه مقاله مهم در مجموعه داده های ما به شرح زیر بود: Montgomery و همکاران (2004) ، در مورد مدل سازی مرور آنلاین و تجزیه و تحلیل مسیر با استفاده از داده های جریان کلیک. باکلین و همکاران (2002) ، در مورد پیشرفت تحقیق و فرصت های آینده برای مدل سازی انتخاب مصرف کننده در اینترنت با استفاده از داده های جریان کلیک بحث می کند. و جانسون ، مو ، فادر ، بلمن و لوسه (2004) ، رفتار جستجوی آنلاین را بررسی می کنند
بازارهای مهم فروش نشریه
همانطور که شکل 9 نشان می دهد ، مهمترین مجلات از نظر تعداد مقاله ، مجلات پیشرو در بازاریابی هستند که توسط Science Science (14 مقاله) هدایت می شوند و پس از آن Journal of Marketing (10) است. علاوه بر این ، مجلات تکنولوژی گرا در این زمینه رسانه های بالقوه ای از جمله: تحقیقات و کاربردهای تجارت الکترونیک (10 مقاله) ، دسترسی IEEE (8) و سیستم های خبره با برنامه های کاربردی (10) هستند.
نقش حیاتی مجلات بازاریابی زمانی بیشتر نمایان می شود که تمرکز بر میزان استناد به مجلات مختلف باشد (به شکل 10 مراجعه کنید). مجله بازاریابی با 613 استناد با بیشترین استناد ترین مجله و پس از آن مجله بازاریابی (469 استناد) و مجله تحقیقات بازاریابی (320) است. موارد بعدی که بیشترین میزان استناد را ذکر کرده اند حدود 300 بار ذکر شده است: روانشناسی رسانه (298 نقل قول) ، مجله تبلیغات (291) ، علوم مدیریت (265) و مجله تحقیقات بازرگانی (260).
مدل سازی موضوع
در مرحله بعد ، ما محتوای متن را برای کشف انواع موضوعات ممکن در مجموعه داده هامان ، از جمله عناوین ، کلمات کلیدی و خلاصه مقالات . تجزیه و تحلیل کردیم ، در اینجا ، ما با استفاده از یک روش تجزیه و تحلیل متن پیشرفته تر به نام مدل سازی موضوع ساختاری ، به دنبال روش شرح داده شده در بخش 3.3 ، تجزیه و تحلیل متن را انجام می دهیم.
سرانجام 14 مبحث با معنی را استخراج و بر اساس کلمات برتر هر مبحث به آنها برچسب زدیم ، و برچسب های مشخص شده و کلمات برتر مربوطه به طور خلاصه در ادامه شرح داده شده است. عنوان تجربه و رضایت خرید شامل کلمات برجسته ای از جمله "مصرف کننده" ، "مطالعه" ، "قصد" ، "رضایت" ، "تجربه" و "خرید" است. جدول 3 مهمترین مقالات. عنوان الگوی رفتار آنلاین شامل کلمات برتر "آنلاین" ، "استفاده" ، "زمان" و "الگوی" است. عنوان حریم خصوصی در انجمن دیجیتال از کلماتی مانند "اطلاعات" ، "اجتماعی" ، "داده ها" و "حریم خصوصی" تشکیل شده است. عنوان جستجوی اطلاعات شامل کلمات برجسته ای مانند "مصرف کننده" ، "اطلاعات" ، "آنلاین" و "جستجو" است. عنوان Challenges in Retail Market حاوی کلماتی مانند "بازار" ، "کلان داده" ، "تحقیق" ، "خرده فروشی" و "چالش" است. عنوان کیفیت تجربه مشتری بیشتر بر کلمات مربوط به "مشتری" ، "خدمات" و "کیفیت" تاکید دارد. عنوان آنلاین به عنوان کانال فروش شامل کلمات برتر مانند "آنلاین" ، "مطالعه" ، "رابطه" و "فروش" است. عنوان تجزیه و تحلیل شبکه های اجتماعی شامل "داده" ، "تجزیه و تحلیل" ، "تلفن همراه" ، "کاربر" و "شبکه" است. عنوان مارک ها و بررسی های آنلاین از کلمات برتر "محصول" ، "استفاده" ، "بررسی" و "مارک" تشکیل شده است. مبحث رفتار خرید شامل کلمات برتر مانند "خرید" ، "رفتار" و "مدل" است. عنوان تجزیه و تحلیل داده و صنایع غذایی شامل کلمات برتر "داده" ، "تجزیه و تحلیل" ، "سیستم" ، "داده بزرگ" ، "تجارت" ، "اعتبار" ، "فرایند" ، "جدید" و "غذا" است. عنوان عملکرد تبلیغات شامل کلمات برجسته ای مانند "مدل" ، "اثر" ، "استفاده" و "تبلیغ" است. موضوع نگرش ادراک شده نسبت به شرکت ها با اصطلاحات برتر "مدل" ، "نگرش" و "درک" بیان می شود. عنوان عصر دیجیتال و خدمات شامل اصطلاحات "فناوری" ، "خدمات" ، "اعتماد" و "دانش" است. لیست کلمات برتر برای هر موضوع و شکل ابر کلمه مربوطه را می توان در جدول 4 و شکل 11 یافت.
جدول 3
رتبه بندی صفحه
مجلات تعداد داده وارده
ذکر
عنوان
نویسنده
سال
0.0000810
0.0000626
0.0000621
0.0000574
0.0000538
0.0000544
0.0000508
0.0000514
0.0000495
0.0000498
علم بازاریابی 48 192
نامه های بازاریابی 23 55
علم مدیریت 22 206
علم بازاریاب 20 167
مجله تحقیقات عملیاتی اروپا 13 89
مجله بازاریابی تعاملی 13 76
مجله تحقیقات بازرگانی 10 71
مجله تحقیقات بازاریابی 10 62
مجله تحقیقات بازاریابی 10 47
مجله بازاریابی 9 201
مدلسازی مرور آنلاین و تجزیه و تحلیل مسیر با استفاده از داده های جریان کلیک
انتخاب و اینترنت: از جریان کلیک تا جریان تحقیق
درباره عمق و پویایی رفتار جستجوی آنلاین
مدل سازی جریان کلیک: پیامدهای مربوط به تلاش های تبلیغاتی تحت وب
پیش بینی رفتار خرید آنلاین
برای بصیرت اینترنتی اینجا کلیک کنید: پیشرفت در تجزیه و تحلیل داده های د بازاریابی درجریان کلیک
فرآیند تصمیم گیری مصرف کنندگان و رفتار خرید آنلاین آنها: یک تحلیل جریان کلیک
نسبت دادن تبدیل ها در یک محیط بازاریابی آنلاین چند کاناله: یک مدل تجربی و یک آزمایش میدانی
یک مدل انتخابی دو مرحله ای تجربی با قوانین تصمیم گیری متفاوت که برای داده های جریان کلیک اینترنتی اعمال می شود
جستجوی تجربه در وب: بررسی تجربی رفتار مصرف کننده برای جستجو و تجربه
کالاها
Montgomery
Bucklin .
Johnson
Chatterjee
Van den Poel and Buckinx..
Bucklin Senecal
Li and Kannan.
Moe.
Huang
2004
2002
2004
2003
2005
2009
2005
2014
2006
2009
از بین 14 عنوان مشخص شده ، موضوع حریم خصوصی در جامعه دیجیتال بیشترین تعداد کل استناد را دریافت کرده است (21.58). موضوع تجربه و رضایت خرید بیشترین تعداد استناد را به خود اختصاص داده است (93/2). عنوان موضوع تحلیل شبکه های اجتماعی در مقایسه با سایر مباحث کمترین استنادات نسبی (2.06) را دریافت کرده است. یک توضیح ممکن برای این می تواند این باشد که این موضوع مربوط به علایق پژوهشی است که اخیراً ظهور کرده اند و ممکن است تعداد اندکی از استنادها را شامل شود با توجه به ماهیت تجمع استنادها ، اگرچه ما نقل قول ها را در طی زمان طولانی تنظیم کردیم.
در شکل 12 رشد هر مبحث در هر سال نشان داده شده است ، جایی که خط نقطه قرمز مقدار میانگین متحرک پنج ساله است. بر اساس طرح ، اگرچه رشد ثابت سال به سال متفاوت است اما برخی نشانه ها وجود دارد که مباحث حریم خصوصی در جامعه دیجیتال ، کیفیت تجربه مشتری و عصر دیجیتال و خدمات به طور مشابه ممکن است روند افزایشی داشته باشد. مباحث دیگر با گذشت زمان ناپایدار یا پایدار هستند و هیچ روند واضحی مشاهده نمی شود. توجه داشته باشید که فقط یک مقاله در سال 2000 وجود دارد. بنابراین ، کاهش یا افزایش شدید رشد مبحث در آن سال فقط می تواند به دلیل کمبود داده باشد. ما همچنین یک آزمون غیر پارامتری Spearson بین رشد موضوع و زمان در سه موضوع فوق را انجام دادیم. رتبه مقادیر ضریب همبستگی به ترتیب 0.58 ، 0.53 و 0.75 با مقادیر p مربوطه 0.01 ، 0.02 و 0.0003 است. نکته دیگری که قابل توجه است این است که موضوع تجزیه و تحلیل شبکه های اجتماعی ممکن است در سال 2006 با تغییر روند رشد مبحث تا سال 2006 و بعد از آن ، تغییراتی داشته باشد. رتبه مقدار ضریب همبستگی بین زمان و رشد موضوع از سال 2000 تا 2006 85/0 − (p-value: 0.02) و 0.84 (p-value: 0.0006) از 2006 تا 2018 است.
ما بیشتر با تعیین یک مدل رگرسیون خطی که در آن خروجی نسبت نه موضوع مشخص شده بود در حالی که ورودی از نوع انتشار بود ، رشد موضوع را در دسته های مختلف بررسی کردیم. مقایسه رشد موضوعات در گروه های مختلف در شکل 13 نشان داده شده است. همانطور که در شکل نشان داده شده است ، موضوع حریم خصوصی در جامعه دیجیتال در گروه "ارتباطات" رشد بیشتری دارد. کارهای Fiore-Gartland and Neff (2015) بر روی "ظرفیت داده" ، که مربوط به مفهوم این موضوع است ، متمرکز است.
در همین حال ، موضوع تجربه خرید و رضایت مکرر در نشریات تحت هر دو گروه "مهمان نوازی" و "ارتباطات" مورد بحث قرار گرفت. مطالعات در دو دسته فوق نقاط مشترکی راجع به این موضوع داشته اند. به عنوان مثال ، کارهای یوان ، موریسون ، کای و لینتون (2008) از گروه "مهمان نوازی" (که در وب علم به عنوان مهمان نوازی ، اوقات فراغت ، ورزش و جهانگردی دسته بندی شده است) در مورد نگرش مشتری و خرید شراب بحث کردند. کار Bobkowski (2015) ، که به گروه "ارتباطات" تعلق داشت ، در مورد چگونگی تاثیر شخصیت شخصیت های اخبار بر رفتارهای اشتراک اخبارشان بحث کرد.
برای موضوع آنلاین به عنوان یک کانال فروش ، تفاوت آشکار کمی بین رشد در دسته های مختلف وجود دارد. یک دلیلش این می تواند باشد که این یک موضوع کلی است ، بنابراین در دسته های مختلف به همان اندازه مورد توجه قرار گرفت. این مبحث همچنین شامل تعداد معینی از اصطلاحات متداول در این زمینه ، مانند "مطالعه" ، "فروش" ، "کشف" و "نشریات" است.
رشد برجسته موضوع عصر دیجیتال و خدمات در دسته های "بهداشت" و "علوم محیطی" نیز قابل ذکر است. این رشد علاقه دانشگاهی به خدمات دیجیتال را نشان می دهد. رامکومار و همکاران (2017) پتانسیل استفاده از داده های سلامت موبایل را برای جراحان ارتوپدی بررسی کردند، در حالی که کار Beal و Flynn (2015) نمونه ای از تحقیقات در مورد "اندازه گیری هوشمند" در آب ، مسئله مهم در علوم محیطی است.
جدول شماره 4
مباحث استخراج شده از STM
کلمات برجسته
موضوع
(رشد (٪) / متوسط
نقل قول / استناد نسبی)
مصرف کننده ، مطالعه ، قصد ، رضایت ،
تجربه ، خرید ، بررسی ، استفاده ، مثبت ،
فهمیدن
آنلاین ، استفاده ، زمان ، الگوی ، پایه ، پیشنهاد ،
انتخاب ، خوب ، چارچوب ، در سراسر
اطلاعات ، اجتماعی ، داده ها ، حریم خصوصی ، دیجیتال ،
طراحی ، محتوا ، اینترنت ، رسانه های اجتماعی ،
تغییر دادن
مصرف کننده ، اطلاعات ، آنلاین ، جستجو ،
قیمت ، کاربر ، رفتار ، اینترنت ، استفاده ، وب سایت
بازار ، کلان داده ها ، تحقیقات ، خرده فروشی ، چالش ،
فروشگاه ، نویسنده ، مدیریت ، منبع ، پتانسیل
مشتری ، خدمات ، کیفیت ، محصول ، معدن ،
رویکرد ، خرید ، استراتژی ، الگوریتم ، وفاداری
آنلاین ، مطالعه ، رابطه ، فروش ، رفتار ،
کانال ، یافتن ، تقاضا ، نقش ، ادبیات
داده ، تجزیه و تحلیل ، تلفن همراه ، کاربر ، شبکه ،
روش ، مشتری ، مقاله ، احساسات ، متن
محصول ، استفاده ، بررسی ، مارک ، تاثیر ، پیش بینی ،
نمایش ، تحقیق ، نتیجه ، متغیر
خرید ، رفتار ، مدل ، مشتری ،
وب سایت ، تصمیم ، بازدید ، تجارت الکترونیکی ، بازار ،
فراهم کردن
داده ، تجزیه و تحلیل ، سیستم ، کلان داده ، تجارت ،
ارزش ، فرآیند ، جدید ، غذا ، رویکرد
مدل ، اثر ، استفاده ، تبلیغات ، عملکرد ،
نتیجه ، شرکت ، افزایش ، خرید ، وب
مدل ، نگرش ، درک ، شرکت ،
صنعت ، آزمون ، تلفن همراه ، به سمت ، خرده فروش ، اجتماعی
رسانه ها
فناوری ، خدمات ، اعتماد ، دانش ،
بهداشت ، مطالعه ، مقاله ، جمع آوری ، برنامه ، عامل
تجربه خرید و رضایت
(6.86 / 20.12 / 2.93)
الگوی رفتار آنلاین
(7.68 / 17.89 / 2.33)
حریم خصوصی در جامعه دیجیتال
(7.91 / 21.58 / 2.73)،
تغییر دادن
جستجوی اطلاعات
(7.91 / 20.40 / 2.58)
چالش های موجود در بازارهای خرده فروشی
(8.19 / 21.32 / 2.60)
کیفیت تجربه مشتری
(7.72 / 16.50 / 2.14)
بصورت آنلاین به عنوان کانال فروش
(6.50 / 16.30 / 2.51)
تحلیل شبکه های اجتماعی
(6.91 / 14.23 / 2.06)
مارک ها و بررسی های آنلاین
(7.19 / 18.79 / 2.61)
رفتار خرید
(6.80 / 15.03 / 2.21)
تجزیه و تحلیل داده ها و صنعت غذا
(7.16 / 16.94 / 2.37)
عملکرد تبلیغات
(6.61 / 18.80 / 2.84)
نگرش نسبت به
شرکت ها
(6.16 / 14.89 / 2.42)
عصر دیجیتال و خدمات
(6.42 / 15.08 / 2.35)
مدل STM همچنین به ما امکان مقایسه کلمات دو دسته مختلف را با توجه به موضوع مشابه داد ، از این نظر کلمات یا اصطلاحات بزرگ در استفاده از موضوع در گروه های مختلف رایج بودند. ما به طور عمده مقوله های "تجارت و اقتصاد" و "علوم کامپیوتر و علوم اطلاعات" را مقایسه کردیم ، زیرا آنها بیشترین تعداد انتشار را داشتند (به ترتیب 141 و 63 ، به جدول 2 مراجعه کنید) ، به اعتبار مقایسه می افزودند.
تفاوت عبارت برای موضوع تجربه خرید و رضایت در شکل 14 نشان داده شده است. در نشریات گروه "تجارت و اقتصاد" اصطلاحات بیشتری درباره مصرف کنندگان ذکر شده است ، مانند "مصرف کننده" ، "تجربه" و "نگرش". در مقابل ، به نظر می رسد اصطلاحاتی که در دسته "علوم کامپیوتر و علوم اطلاعات" ذکر شده اند ، در مورد روند کلی و منابع داده مانند "مثبت" ، "منفی" ، " (خدمات شبکه های اجتماعی"sns" و "اخبار" تمرکز دارند.
همچنین بین عناوین "تجارت و اقتصاد" و "علوم کامپیوتر و علوم اطلاعات" با توجه به موضوع حریم خصوصی در جامعه دیجیتال (در شکل 15 نشان داده شده است) تفاوت وجود داشت. محققان در "علوم کامپیوتر و علوم اطلاعاتی" تمایل دارند که بیشتر بر بحث های فنی تاکید کنند ، بنابراین از عباراتی مانند "ارتباط" ، "داده" و "دیجیتال" به طور مکرر استفاده می کنند. در همین حال ، اصطلاحات مربوط به تعامل انسان و کامپیوتر ، مانند "اطلاعات" ، "تعامل" و "اجتماعی" ، در نشریات گروه "تجارت و اقتصاد" یافت شد.
گفت و گو:
در این مطالعه ، ما تحول تحقیقات علمی را با توجه به استفاده از مجموعه داده های بزرگ در مورد رفتار مصرف کننده آنلاین بین 2000 و 2018 از نظر انتشارات موجود در پایگاه داده ISI Web of Science گزارش می دهیم. نتایج بر اساس 495 مقاله ، نمای کلی از اطلاعات موجود مورد تحقیق در باره ی رفتار مصرف کننده آنلاین را با استفاده یا بحث در مورد مجموعه داده های بزرگ ارائه می دهد. این مطالعه با شناسایی انتشارات و نویسندگان اصلی و بررسی چگونگی تکامل موضوعات خاص در طول زمان ، اطلاعاتی در مورد تحول در این زمینه فراهم می کند. با استفاده از مدل سازی موضوع و تکنیک های تجزیه و تحلیل متن ، ما همچنین مقالات تحقیق خاصی را از مقالات موجود در داده های خود شناسایی کردیم. این تجزیه و تحلیل راهنمای کسانی است که می خواهند با ارائه اطلاعاتی به عنوان مثال در مورد کدام مجلات باید مورد رایزنی قرار گیرند ، کدام نویسندگان برجسته تر هستند و چه موضوعاتی در زمینه های مختلف مرتبط هستند.
با استفاده از این مقاله ، ما همچنین به روش مربوط به بررسی نشریات و تجزیه و تحلیل کتاب سنجی کمک می کنیم. قابل توجه است ، ما از یک روش پیشرفته تر فراتر از تجزیه و تحلیل کتابشناختی سنتی – یا حتی فراتر از مدل سازی اولیه LDA استفاده می کنیم. ما مدل سازی موضوع را برای استخراج مباحث نهفته از شریات جمع آوری شده انجام دادیم. استفاده از STM ، یک ابزار تجزیه و تحلیل متن پیشرفته تر در مطالعات مروری ادبیات را نشان دادیم ، که نشان می دهد این چارچوب خودکار محققان را قادر می سازد تا بینش جالب تری نسبت به سایر ابزارهای استخراج متن خارج از ردیف مانند LDA داشته باشند.
نتایج ما نشان می دهد که چشم انداز تحقیق در مورد رفتار مصرف کننده آنلاین با استفاده از مجموعه داده های بزرگ در دوره زمانی انتخاب شده (2000 تا 2018) تکامل یافته است ، بدین ترتیب این موضوع در سالهای اخیر برجسته تر و مهمتر شده است. تعداد مقالات منتشر شده در سال از سال 2011 به بعد به سرعت افزایش یافته است ، و سهم مقالات از تمام نشریات در وب علم از سال 2013 سر به فلک کشیده است. شاید قابل توجه ترین تغییر مربوط به وقوع اصطلاح "داده های بزرگ" در مقالات این امر به ویژه از سال 2013 به بعد آشکار است و به نظر می رسد یک حوزه تحقیقاتی بسیار غالب است. علاوه بر این ، تعداد ارجاعات مربوط به "داده های بزرگ" غالب است ، حتی اگر محققان اخیراً تمرکز خود را روی داده های بزرگ آغاز کرده اند. علاوه بر این ، مقالاتی که به طور کلی بر روی اینترنت تمرکز دارند (اینترنت ، تجارت الکترونیکی) و داده های جریان کلیک و همچنین بازاریابی اینترنتی و رفتار مصرف کننده از جمله بیشترین مقاله ها هستند. با این حال ، محبوبیت داده های بزرگ به قدری مشهود است که احتمال می دهیم تعداد ارجاعات برای چنین نشریاتی به طور قابل توجهی افزایش یابد.
وقتی به رسانه های انتشارات نگاه می کنیم ، به نظر می رسد که مجلات برجسته بازاریابی ، مجلاتی هستند که دانشگاهیان آگاه باید آنها را هدف قرار دهند تا بتوانند هرچه بیشتر در جامعه تحقیقاتی تاثیر بگذارند. نتایج ما نشان می دهد که ژورنال هایی مانند Marketing Science و Journal of Marketing و Journal of Marketing Research بیشتر مقالات را منتشر کرده اند ، و همچنین آنها از جمله ژورنال هایی هستند که بیشترین استناد را دارند. با این حال ، مجلات مدیریت عمومی و تجارت (به عنوان مثال Management Science و Journal of Business Research) و همچنین ژورنال هایی با گرایش فناوری (به عنوان مثال IEEE Access و Expert Systems with Applications) سایر نشریات بالقوه محققان در این زمینه هستند.
از نظر مدل سازی موضوعی ، با استفاده از روش جدید STM فوق پیشرفته ، ما موفق به شناسایی موضوعات خاصی شدیم که می توان مقالات موجود در مجموعه داده ها را طبقه بندی کرد. با استفاده از این نوع مدل سازی ، می توان با مطالعه مباحث نهفته ، محتوای مشترک پنهان را در مقالات نشان داد. همچنین می توان استناد به موضوعات مختلف یا وقوع موضوعات را در زمینه های مختلف تحقیق مقایسه کرد. در نتیجه ، ما دریافتیم که مقالات مربوط به حریم خصوصی در انجمن دیجیتال بیشترین تعداد استناد را دریافت کرده اند ، و پس از آن مقالاتی تحت عنوان چالش های بازارهای خرده فروشی و تجربه خرید و رضایت از آنها ارائه شده است. بنابراین ، به نظر می رسد که این ها تاثیرگذارترین مباحث در این زمینه هستند. کمی تعجب آور است که مقاله های تحت عنوان تحلیل شبکه های اجتماعی استنادات کمتری دریافت کرده اند. باز هم ، با این حال ، ما معتقدیم که به دلیل محبوبیت مقالات مرتبط با تجزیه و تحلیل داده ها و رسانه های اجتماعی ، همراه با ماهیت انباشت استنادها ، این موضوع می تواند تعداد قابل توجهی از استنادها را در آینده دریافت کند (در واقع ، از سال 2006 ، روند رشد مطلب در حال افزایش است). یک یافته جالب در رابطه با مطلب تجربه خرید و رضایت این بود که در حوزه "تجارت و اقتصاد" ، به نظر می رسید مقالات بر روی دیدگاه مصرف کننده (مشتری ، تجربه و غیره) تمرکز دارند ، در حالی که مقالات در زمینه "علوم و اطلاعات کامپیوتر" علوم بیشتر با جنبه فنی پدیده مرتبط بودند (به عنوان مثال سودمند ، مثبت ، منفی).
جالب است که به نظر می رسد افزایش تحقیقات مربوط به داده های بزرگ ، ماهیتی کاملاً کلی داشته و به شدت بر روی هر موضوع خاصی متمرکز نشده است. این نتیجه گیری را می توان بر اساس تجزیه و تحلیل ما از شیوع موضوع در طول زمان انجام داد ، که نشان داد حتی اگر موارد در حال افزایش هستند روند افزایش برخی از موضوعات ("حریم خصوصی در انجمن دیجیتال" ، "کیفیت تجربه مشتری" و "عصر دیجیتال و خدمات") با اندازه تعداد مقالات مرتبط با داده های بزرگ ، که بین سال های 2013 و 2018 رشد چشمگیری داشته اند ، قابل توجه نیست .
رهنمودهایی برای تحقیقات آینده در مورد رفتار مصرف کننده آنلاین
همانطور که در بالا گفته شد و همانطور که توسط نتایج این مقاله تایید شده است ، مجموعه های داده بزرگتر ، به ویژه به صورت داده های بزرگ ، معمولاً بیشتر استفاده می شوند و مشکلی در رابطه با دریافت داده ها وجود ندارد. با این حال ، داده های کلان به خودی خود بی ارزش هستند و ارزش بالقوه حاصل از آنها تنها زمانی بدست می آید که از قدرت استفاده برای تصمیم گیری استفاده کنند (Gandomi & Haider، 2015). در میان سایر مسائل مربوط به داده های بزرگ ، موسسه علوم بازاریابی (2016) اولویت های تحقیقاتی خاصی را برای سال های 2016-2018 ذکر کرده است ، از جمله ادغام نظریه های رفتاری و بازاریابی با داده های بزرگ و همچنین استفاده از منابع مختلف و انواع اطلاعات برای کسب بینش درتصمیم گیری بنابراین ، محتمل ترین مشکل هم برای محققان و هم برای پزشکان نحوه استفاده بهینه از داده های بزرگ است و مسعله این است که چگونه می توان آنچه را که در آنجا وجود دارد را درک کرد (Van Auken، 2015). همانطور که گاندومی و حیدر (2015) استدلال کردند ، اگرچه هنوز ابتکارات عمده ای در تکنیک های تحلیلی برای داده های بزرگ رخ نداده است ، ظهور چنین تجزیه و تحلیل های جدید (به عنوان مثال تجزیه و تحلیل های زمان واقعی) احتمالاً در آینده نزدیک وجود دارد. تمرکز در تحقیقات و همچنین در تجزیه و تحلیل در شرکت ها نیز باید از آنچه مصرف کنندگان انجام می دهند به دلیل انجام کاری ، یعنی درک رفتار آنها تغییر یابد. برای انجام این کار به طور مثر ، چندین منبع داده باید ترکیب شوند (به Shlomo & Goldstein ، 2015 مراجعه کنید) ، و از محققان خواسته می شود که تعیین کنند که آیا فقط به داده های جمع آوری شده آنلاین متکی هستند یا از نوعی داده های زمینه ای آفلاین باید به عنوان داده های مکمل استفاده شود (ماهرت و شارکوو ، 2013 ؛ همچنین به مورتی ، 2008 و اورگاد ، 2009 مراجعه کنید). استفاده از چندین منبع داده همچنین می تواند بر مشکلات نتیجه گیری بر اساس داده های کلان در سطح کل غلبه کند. به عنوان مثال ، روابط آماری در سطح کل را نمی توان به طور مستقیم در سطح فردی اعمال کرد ، زیرا خطر مغالطه زیست محیطی وجود دارد (به عنوان مثال مراجعه کنید به Brewer & Venaik ، 2014) ، یعنی خطای تصور اینکه مشاهدات در داده های کل نیز در سطح فردی رخ دهد (ماهرت و شارکوو ، 2013).
محدودیت ها و فرصت های تحقیق
محدودیت اصلی در این مقاله این است که داده ها فقط از پایگاه داده ISI Web of Science جمع آوری شده اند. برای تحقیقات بیشتر ، دانشمندان ممکن است بخواهند با استفاده از پایگاه داده های دیگر ، مانند Scopus ، تجزیه و تحلیل کتاب سنجی را نیز در نظر بگیرند ، که همچنین شامل مجلات غیر نمایه ای است که در ISI Web of Science در دسترس نیستند. مقالاتی بیشتر نیز می تواند در Google Scholar یافت شود ، که شامل نه تنها استناد در ژورنال ها بلکه استناد در سایر مقالات علمی موجود در اینترنت است. مرتبط با این مقاله، تحقیقات آینده همچنین می تواند نتایج به دست آمده از پایگاه های دیگر را با نتایج این مطالعه مقایسه کند
مراجع
Beal ، C. D. ، و Flynn ، J. (2015). به سمت عصر آب دیجیتال: بررسی و مطالعات موردی از
برنامه های اندازه گیری هوشمند ابزار آب استرالیا. خط مشی خدمات ، 32 ، 29-37.
Blei، D. M. (2012). مدل های موضوعی احتمالی. ارتباطات ACM ، 55 (4) ، 77
(doi: 1145 / 2133806.2133826).
Bobkowski، P. S. (2015). اشتراک اخبار: اثرات مطلوب اطلاعاتی و نظرات
رهبری در به اشتراک گذاری اخبار آنلاین. فصلنامه روزنامه نگاری و ارتباط جمعی ،
92 (2) ، 320-345.
Brewer، P.، & Venaik، S. (2014). مغالطه اکولوژیکی در تحقیقات فرهنگ ملی.
مطالعات سازمان ، 35 (7) ، 1063-1086.
Brin، S.، & Page، L. (1998). آناتومی یک موتور جستجوی فرامتنی در مقیاس بزرگ.
هفتمین کنفرانس بین المللی وب جهانی (WWW 1998) ، 14 تا 18 آوریل 1998 ،
بریزبن ، استرالیا.
Bucklin، R. E.، Lattin، J. M.، Ansari، A.، Gupta، S.، Bell، D.، Coupey، … Steckel، J. (2002).
انتخاب و اینترنت: از جریان کلیک تا جریان تحقیق. نامه های بازاریابی ،
13 (3) ، 245-258.
باکلین ، آر. ای. ، و سیسمیرو ، سی. (2009). برای بصیرت اینترنتی اینجا را کلیک کنید: پیشرفت در کلیک-
تجزیه و تحلیل داده جریان در بازاریابی. مجله بازاریابی تعاملی ، 23 ، 35-48.
Cantallops، A. S.، & Salvi، F. (2014). رفتار جدید مصرف کننده: مروری بر تحقیقات در مورد
eWOM و هتل ها. مجله بین المللی مدیریت مهمان نوازی ، 36 ، 41-51.
Chatterjee، P.، Hoffman، D. L.، & Novak، T. P. (2003). مدل سازی جریان کلیک:
پیامدها در تلاش های تبلیغاتی تحت وب. علوم بازاریابی ، 22 (4) ، 520-541.
Chen، H.، Chiang، R.، & Storey، V. C. (2012). هوش تجاری و تجزیه و تحلیل: از بزرگ
داده ها به تاثیر بزرگ. فصلنامه MIS ، 36 (4) ، 1165-1188.
Corrigan، H. B.، Craciun، G.، & Powell، A. M. (2014). چگونه هدف این همه آگاهی دارد
در مورد مشتریانش؟ استفاده از تجزیه و تحلیل مشتری برای تصمیم گیری در مورد بازاریابی.
بررسی آموزش بازاریابی ، 24 (2) ، 159-166.
Darley، W. K.، Blankson، C.، & Luethge، D. J. (2010). به سمت یک چارچوب یکپارچه برای
روند مصرف آنلاین مشتری و روند تصمیم گیری: یک بررسی. روانشناسی و
بازاریابی ، 27 (2) ، 94-116.
De Mauro، A.، Greco، M.، Grimaldi، M.، & Ritala، P. (2018). منابع انسانی برای داده های بزرگ
حرفه ها: طبقه بندی منظمی از نقش های شغلی و مجموعه مهارت های مورد نیاز. اطلاعات
پردازش و مدیریت ، 54 (5) ، 807-817.
Erevelles، S.، Fukawa، N.، & Swayne، L. (2016). تجزیه و تحلیل مصرف کننده داده های بزرگ و
تحول بازاریابی. مجله تحقیقات بازرگانی ، 69 ، 897-904.
Fetscherin، M.، & Heinrich، D. (2015). تحقیقات ارتباط با برند مصرف کننده: کتابسنجی
متاآنالیز استناد متریک. مجله تحقیقات بازرگانی ، 68 ، 380-390.
Fetscherin، M.، & Usunier، J. C. (2012). مارک تجاری شرکتی: یک سواد بین رشته ای
بررسی فنی مجله بازاریابی اروپا ، 46 (5) ، 6-44.
Fiore-Gartland، B.، & Neff، G. (2015). ارتباطات ، میانجیگری و انتظارات از
data: ظرفیتهای داده در جوامع بهداشت و سلامت. مجله بین المللی
ارتباطات ، 9 ، 19.
Gandomi، A.، & Haider، M. (2015). فراتر از هیاهوی تبلیغاتی: مفاهیم کلان داده ، روش ها و
تجزیه و تحلیل. مجله بین المللی مدیریت اطلاعات ، 35 ، 137-144.
Ha، Y.، Kwon، W. S.، & Lennon، S. J. (2007). تجارت بصری آنلاین (VMD) از ap-
وب سایت های parel. مجله مدیریت بازاریابی مد ، 11 (4) ، 477-493.
حاجی خانی ، ا. (2017). ظهور و انتشار مفهوم اکوسیستم در نوآوری
مطالعات: یک مطالعه مرور ادبیات سیستماتیک. مجموعه مقالات پنجاهمین دوره بین المللی هاوایی
کنفرانس علمی علوم سیستمی.
Hausman، A. V.، & Skiepe، J. S. (2009). تاثیر ویژگی های رابط وب بر مصرف کننده
اهداف خرید آنلاین. مجله تحقیقات بازرگانی ، 62 (1) ، 5-13.
Hofacker، C. F.، Malthouse، E. C.، & Sultan، F. (2016). داده های بزرگ و رفتار مصرف کننده:
فرصت های قریب الوقوع. مجله بازاریابی مصرف کننده ، 33 (2) ، 89-97.
Huang، P.، Lurie، N. H.، & Mitra، S. (2009). جستجوی تجربه در وب: An
بررسی تجربی رفتار مصرف کننده برای جستجوی کالا و تجربه آن.
مجله بازاریابی ، 73 ، 55-69.
جانسون ، E. J. ، Moe ، W. W. ، Fader ، P. S. ، Bellman ، S. ، & Lohse ، G. L. (2004). روی عمق
و پویایی رفتار جستجوی آنلاین. علوم مدیریت ، 50 (3) ، 299-308.
Kim، M.، & Lennon، S. (2008). تاثیرات اطلاعات بصری و کلامی بر نگرش ها
و قصد خرید در خرید اینترنتی. روانشناسی و بازاریابی ، 25 ، 146-178.
Knutas، A.، Hajikhani، A.، Salminen، J.، & Porras، J. (2015). کتاب سنجی مبتنی بر ابر
خدمات تجزیه و تحلیل برای مطالعات نقشه برداری سیستماتیک. CompSysTech 2015.
کوفاریس ، م. (2002). استفاده از مدل پذیرش فناوری و نظریه جریان به صورت آنلاین
رفتار مصرف کننده. تحقیقات سیستم های اطلاعاتی ، 13 (2) ، 205-223.
Lee، S.، & Chen، L. (2010). تاثیر جریان بر رفتار مصرف کننده آنلاین. مجله
سیستم های اطلاعات رایانه ای ، 50 (4) ، 1-10.
Li، H.، & Kannan، P. K. (2014). انتساب تبدیل در یک مارکت آنلاین چند کاناله
keting Environment: یک مدل تجربی و یک آزمایش میدانی. مجله بازاریابی
تحقیق ، 51 (1) ، 40-56.
Lycett، M. (2013) "Datafication": معنادار کردن داده های (بزرگ) در دنیای پیچیده.
مجله اروپایی سیستم های اطلاعاتی ، 22 (4) ، 381-386.
Mahrt، M.، & Scharkow، M. (2013). ارزش داده های کلان در تحقیقات رسانه های دیجیتال.
مجله صدا و سیما و رسانه های الکترونیکی ، 57 (1) ، 20-33.
Manganari، E. E.، Siomkos، G. J.، Rigopoulou، I. D.، & Vrechopoulous، A. P. (2011). مجازی
تاثیرات چیدمان فروشگاه بر رفتار مصرف کننده: استفاده از روانشناسی محیطی
رویکرد در صنعت سفر آنلاین. تحقیقات اینترنتی ، 21 (3) ، 326-346.
Manyika ، J. ، Chui ، M. ، Brown ، B. ، Bughin ، J. ، Dobbs ، R. ، Roxburgh ، C. ، & Byers ، A. H.
(2011). داده های بزرگ: مرز بعدی برای نوآوری ، رقابت و بهره وری.
موسسه جهانی مک کینزی بازیابی شده از http://www.mckinsey.com/insights/
فناوری_ تجارت / داده های_ بزرگ_مرز بعدی برای نوآوری.
موسسه علوم بازاریابی (2016). اولویت های تحقیق 2016-2018. کمبریج ، کارشناسی ارشد:
[16:22, 18/05/2021] عطیه عبدالحی: موسسه علوم بازاریابی.
Moe، W. W. (2003). خرید ، جستجو یا مرور: تفاوت بین آنلاین
خریداران با استفاده از جریان کلیک ناوبری در فروشگاه. مجله روانشناسی مصرف کننده ،
13 (1/2) ، 29-39.
Moe، W. W. (2006). یک مدل انتخابی دو مرحله ای تجربی با قوانین تصمیم گیری متفاوت
روی داده های جریان کلیک اینترنت اعمال می شود. مجله تحقیقات بازاریابی ، 43 (4) ، 680-692.
Montgomery، A. L.، Li، S.، Srinivasan، K.، & Liechty، J. C. (2004). مدل سازی بصورت آنلاین
مرور و تجزیه و تحلیل مسیر با استفاده از داده های جریان کلیک. 23 (4) ، 579-595.
Mummalaneni، V. (2005). بررسی تجربی خصوصیات وب سایت ،
sumer حالت های عاطفی و رفتارهای خرید آنلاین. مجله تحقیقات بازرگانی ،
58 (4) ، 526-532.
مورتی ، دی. (2008). مردم نگاری دیجیتال. بررسی استفاده از فن آوری های جدید برای
تحقیقات اجتماعی جامعه شناسی ، 42 (5) ، 837-855.
Nicolaisen ، J. (2010). کتابسنجی و تحلیل استنادی: از فهرست استنادی علوم
به اندازه گیری سایبری مجله انجمن علوم و فناوری اطلاعات آمریکا ،
61 (1) ، 205-207.
Orgad، S. (2009). چگونه محققان می توانند مسائل مربوط به جمع آوری و
تفسیر داده های آنلاین و آفلاین؟ در A. N. Markham و N. K. Baym (ویراستاران). اینترنت
استعلام مکالمات در مورد روش (صفحات 33-53). لس آنجلس ، کالیفرنیا: سیج.
مطبوعات ، P. (2013). تاریخچه بسیار کوتاهی از کلان داده ها. بازیابی شده از http://www.forbes.com/
sites / gilpress / 2013/05/09 / یک-تاریخچه-بسیار-کوتاه-بزرگ-داده /.
Ramkumar، P. N.، Muschler، G. F.، Spindler، K. P.، Harris، J. D.، McCulloch، P. C.، & Mont،
M. A. (2017). Open mHealth architecture: یک آغازگر برای ارتوپدی فردا
geon و معرفی کاربرد آن در آرتروپلاستی اندام تحتانی. مجله
آرتروپلاستی ، 32 (4) ، 1058-1062.
Richard، M.-O.، & Habibi، M. R. (2016). مدل سازی پیشرفته رفتار مصرف کننده آنلاین:
نقش تعدیل گرایانه و فرهنگ لذت جویی. مجله تحقیقات بازرگانی ، 69 ،
1103-1119.
Roberts، M. E. (2014) ترس یا اصطکاک؟ چگونه سانسور باعث گسترش سرعت انتشار اطلاعات در کشور می شود
عصر دیجیتال. نسخه خطی منتشر نشده 26.
روح ، بی. (2012) اینترنت صنعتی: حتی از داده های بزرگ نیز بزرگتر است. بازیابی شده از http: //
www.forbes.com/sites/ciocentral/2012/10/04/ صنعت-صنعت-حتی-بزرگتر-
than-big-data /.
Senecal، S.، Kalczynski، P. J.، & Nantel، J. (2005). فرآیند تصمیم گیری مصرف کنندگان
و رفتار خرید آنلاین آنها: یک تحلیل جریان کلیک. مجله تجارت
تحقیق ، 58 (11) ، 1599-1608.
Shlomo، N.، & Goldstein، H. (2015). تحریریه: داده های بزرگ در تحقیقات اجتماعی. مجله
Royal Statistics Society، 178 (4)، 787-790.
Sievert، C.، & شرلی، K. (2014). LDAvis: روشی برای تجسم و تفسیر موضوعات.
مجموعه مقالات کارگاه آموزشی یادگیری تعاملی زبان ، تجسم و رابط ها
(صص 63-70). . بازیابی شده از http://www.aclweb.org/anthology/W/W14/W14-
3110
Sivarajah، U.، Kamal، M. M.، Irani، Z.، & Weerakkody، V. (2017). تحلیل انتقادی بزرگ
چالش های داده ها و روش های تحلیلی. مجله تحقیقات بازرگانی ، 70 ، 263-286.
Tvinnereim، E.، & Fløttum، K. (2015). توضیح شیوع موضوع در پاسخ به
س questionsالات نظرسنجی در مورد تغییر اقلیم تغییرات آب و هوایی طبیعت ، 5 (8) ، 744-747.
Van Auken، S. (2015). از پانل های مصرف کننده گرفته تا داده های بزرگ: مروری بر داده های بازاریابی
توسعه. مجله تجزیه و تحلیل بازاریابی ، 3 (1) ، 38-45.
Van den Poel، D.، & Buckinx، W. (2005). پیش بینی رفتار خرید آنلاین.
مجله تحقیقات عملیاتی اروپا ، 166 (2) ، 557-575.
Yuan، J.، Morrison، A. M.، Cai، L. A.، & Linton، S. (2008). مدل گردشگر شراب
haviour: رویکرد جشنواره. مجله بین المللی تحقیقات گردشگری ، 10 (3) ،
207-219.
Zhai، C. (2017) مدل های موضوعی احتمالی برای بازیابی و تجزیه و تحلیل داده های متن. اقدامات
چهلمین کنفرانس بین المللی ACM SIGIR در مورد تحقیق و توسعه در
بازیابی شکل گیری (صص 1399-1401). .
[16:22, 18/05/2021] عطیه عبدالحی: میکا وانهالا ، کارشناسی ارشد (اقتصاد و مدیریت بازرگانی) دانشیار است
در مدیریت دانش و رهبری در دانشکده تجارت LUT و
مدیریت ، دانشگاه LUT ، فنلاند. علایق اصلی تحقیق میکا عبارتند از:
رابطه بین عملکردهای منابع انسانی ، اعتماد سازمانی و عملکرد سازمانی ،
و همچنین سرمایه فکری و مدیریت دانش در خلق ارزش. تحقیقات او
به عنوان مثال در مجله مدیریت منابع انسانی ، مجله منتشر شده است
مدیریت دانش ، مرور پرسنل و مجله روانشناسی مدیریت.
Chien Lu دانشجوی دکترا در دانشکده فناوری اطلاعات و
علوم ارتباطات ، دانشگاه تامپره ، فنلاند. علایق پژوهشی وی شامل متن است
استخراج و توسعه روش بیزی.
یااککو پلتونن استاد آمار (تجزیه و تحلیل داده ها) دانشکده اطلاعات است
علوم فناوری و ارتباطات ، دانشگاه تامپره ، فنلاند که در آن رهبری می کند
گروه آماری یادگیری ماشین و تجزیه و تحلیل داده های اکتشافی. او همچنین یک ملاقات است
دانشیار گروه علوم کامپیوتر ، دانشگاه آلتو ، فنلاند. او
عضو هیئت تحریریه شبکه های عصبی ، ویراستار همکار پردازش عصبی است
نامه ها ، عضو هیئت تحریریه Heliyon و عضو کمیته اجرایی
انجمن شبکه عصبی اروپا. وی در کمیته های تشکیلات هشت نفره خدمت کرده است
کنفرانس های بین المللی ، یک مدرسه تابستانی بین المللی ، سه رویداد آموزشی ، و
یک سمینار داگستول ، در کمیته های برنامه 44 کنفرانس بین المللی خدمت کرده است /
کارگاههای آموزشی ، و وظایف داوری را برای بسیاری از مجلات بین المللی انجام داده است
همایش ها. وی متخصص روش آماری ماشین آماری برای داده های اکتشافی است
تجزیه و تحلیل ، کاهش ابعاد غیر خطی برای تجسم داده ها و یادگیری از
چندین منبع داده
سانا سندقویست ، کارشناسی ارشد (Tech.) ، دانشیار بازاریابی در آلتو است
دانشگاه، دانشکده تجارت و استاد مدعو بازاریابی بین المللی در
دانشکده تجارت و مدیریت در دانشگاه LUT ، فنلاند. علایق تحقیقاتی او
مدیریت مدیریت بازاریابی استراتژیک جهانی ، کارآفرینی بین المللی ، و
تصمیم گیری (مدیریتی و مصرف کننده). او در مجله Journal of
آکادمی علوم بازاریابی ، مجله بازاریابی بین المللی ، مجله تجارت
تحقیق ، مدیریت بازاریابی صنعتی و مجله بازاریابی اروپا ، در میان
دیگران.
جیرکی Nummenmaa استاد علوم کامپیوتر دانشکده اطلاعات است
علوم فناوری و ارتباطات دانشگاه تامپره ، فنلاند و رئیس دانشگاه
مرکز تحقیقات اطلاعات و سیستم ها (CIS) در دانشگاه تامپره. پروفسور
Nummenmaa تحقیقاتی را در مورد الگوریتم ها ، پایگاه داده ها ، توسعه نرم افزار ، کسب و کار انجام داده است.
اطلاعات لازم ، داده کاوی ، داده های باز ، و داده های بزرگ ، و اخیراً ، در متن
لیز او تجربه اداری گسترده ای دارد و تجربه عملی نیز دارد
3،5 سال کار در شرکتهای نرم افزاری در منطقه تامپره. او بیش از 70 مورد بررسی همکار دارد
انتشارات علمی
Kalervo Järvelin (http://people.uta.fi/~likaja) استاد برجسته اطلاعات است
بازیابی در دانشکده فناوری اطلاعات و علوم ارتباطات ،
دانشگاه تامپره ، فنلاند. وی دارای دکترای مطالعات اطلاعات (1987) از دانشگاه است
همین دانشگاه وی استاد آکادمی آکادمی فنلاند ، در سالهای 2004-2009 بود. خود
تحقیق شامل جستجوی اطلاعات و بازیابی مبتنی بر وظایف ، زبانی و مفهومی است
روش های IR ، ارزیابی IR ، تجزیه و تحلیل علوم اطلاعات و مدیریت پایگاه داده.
وی بیش از 300 نشریه علمی را راهنمایی کرده و 21 مقاله دکترای خود را زیر نظر گرفته است –
ملاقات جورولین جایزه تونی کنت استریکس 2008 و جایزه تحقیقات ASIS و T را دریافت کرد
2012 به رسمیت شناختن مشارکت در زمینه های بازیابی اطلاعات / اطلاعات
علوم پایه