Mais conteúdo relacionado Semelhante a بررسی کاربردها و چالش های کلان داده در تحلیل عقاید (20) بررسی کاربردها و چالش های کلان داده در تحلیل عقاید1. عقاید تحلیل در داده کالن های چالش و کاربرد بررسی
وامرزانی عزیزی حامد**
نرم کامپیوتر مهندسی گروهافزار
تهران مهندسی و فنی دانشکدهاسالمی آزاد دانشگاه ،جنوب
ایران ،تهران
st_h_azizi@azad.ac.ir
خادمی مریم
ری گروهاضیکاربردی
دانشکدهجنوب تهران پایه علوماسالمی آزاد دانشگاه ،
ایران ،تهران
khademi@azad.ac.ir
چکیده—رسانه محبوبیت و گسترش باجوامع این ،محور کاربر های
تج ،سیاسی گوناگون اطالعات از ارزشمند منبعی به مجازی،اری
نشان اطالعاتی این .است شده تبدیل ... و اجتماعیو افکار دهنده
وسیع دید در و فرد یک احساساتبا که است کشور یک و جامعه ،تر
داده این در کاوشمی هاحوزه در ارزشی با بسیار دانش به توانهای
کالن اطالعات از حجم این تحلیل است واضح .یافت دست گوناگون
غیرساختیافروش نیازمند ،کاربران تهمتن بهینه و نوین هایو کاوی
.است طبیعی زبان پردازش
تحلیل کاربردهای معرفی از پس مقاله این درعقایدیک در کاربران
کالن مجموعهشبکه همانند دادههایسایت یا و اجتماعیبزرگ های
چالش ،مباحث آخرین ،اینترنتی فروشراه و هاحوزه این در کارهامورد
.گرفت خواهد قرار بررسی
واژهکلیدی های-متن ،اجتماعی شبکه،کاویکالندادهتحلیل ،عقاید،
طبقهبندی
1.مقدمه
ارزش گاهی و مشترک وجوه داشتن دلیل به جامعه در افرادمشترک های
شبکه و گذاشته تأثیر یکدیگر روی برآن بین در اعتماد و ارزش از ایها
خاصی موضوعات برایمی ایجاد.گردد
شبکهاجتماعی هایفروشگاه ،وبالگ و اینترنتی هایهامنبع به
ارزشمندزمینه در احساسات کاوش برای یمدیریت نظیر گوناگونی هایی
،مشتری با ارتباطجامعهکاوش ،بازاریابی ،شناسیافکارو سیاست ،عمومی
تبدیل ...شدهان.درسیده اثبات به حقیقت اینب دانش کههدستآاز مده
شبکهفیس و توییتر نظیر اجتماعی هایبوکسایت یا وفروش بزرگ های
روش دیگر به نسبت باالتری ارزش مراتب به آمازون همانند اینترنتیهای
زیرا ،دارند افراد از فیزیکی مصاحبه و نظرسنجی مانند عقیده کاوش سنتی
این درشبکه گونهخالص نظرات کاربران ًالمعمو هامی ارائه را خودو دهند
.نیست تأثیرگذار آن روی بر عاملی هیچ نوعی به
بهمی مردم اطالعاتی منبع این وسیلهصحیح تصمیمات توانندبا تری
محصول صاحبان راستا همین در و کنند اتخاذ افراد دیگر تجربیات به توجه
می نیز خدمات یا وعقاید و نظرات این تحلیل به توجه با توانندخود کیفیت
.بخشند بهبود را
2. مقاله عنوان
هفتمینکنفرانسمهندسیبرقایران الکترونیک و–9314گناباد اسالمی آزاد دانشگاه
2
آمارها آخرین طبق[9]فیس اجتماعی شبکهپیدایش زمان از بوک
سال در خود رسمی2004توانسته تاکنون44/9که را فعالی کاربر میلیارد
می خود شخصی صفحه وارد بار یک حداقل ماهیانهدنیا سراسر در را شوند
حدود دقیقه یک در کاربران این ،کند جذب000/49عنوان به را متنی بار
فیس در وضعیتمی بوکنویسند[2]،توییتر اجتماعی شبکه در اماروزانه
000به )(توییت نوشته میلیون33زبمی منتشر کاربران توسط دنیا زنده ان
شود.از بیش آمازون اینترنتی فروش بزرگ سایت در270فعال کاربر میلیون
دارد وجوددر را نظرات از عظیمی حجم کهوارد مختلف محصوالت مورد
.کنند می
خوان است واضحنظرات از بخشی حتی یا و تمامی بررسی و دن
وقت کاری کاربراندر و گیرداده از عظیم حجم این،است غیرممکن
عقیده حوزه در بنابراینابزاری بهبود و ساخت دنبال به پژوهشگران کاوی
به توجه با را کاربران نظرات و عقیده خودکار صورت به بتواند که هستند
نوشتههایآناناستخراجذی به کلی وضعیت یک و کند.بدهد نفعان
2.مفاهیموالیهتحلیل مختلف های
تعاریفزیادیب مختلف مقاالت دریانهمگ که شدهییکمعنایواحد
تحل .دارند رایلاحساساتوعقیدهکاویمعن بهیشناخت و کشف
و مثبت احساساتیامنفیبه راجع مردمیکمسألهیااست محصول[3].
چهارگانه یک نظر یک :نظر(g, s, h, t)آن در که استgهدف
که (آنچه"نظر"،)است شده بیان آن مورد درs،شده بیان حسh
و نظر صاحبtنظر بیان زماناست.
:موجودیتموجودیت یکe،شخص ،سرویس ،محصول یک
می تعریف جفت یک با که است عنوانی یا سازمان ،رخداد-
:شودe:(T,W)کهTامثال و زیرجزء و جزء مراتب سلسله یک
و آنWخص مجموعهاهم زیرجزء هر .است موجودیت آن یص
خص خودشا.داراست را خود یصآن همگی وجودضروروی ها
با تحلیل کار ،قسمت پنج این از یک هر نبود صورت در و بوده
روبه مشکل.شد خواهد رو
عقیدهم تقسیم تحلیل مختلف سطح سه در کاوییشود[4].
سند سطحآن دنبال به نظری سند یک داشتن با سطح این در :
منفی یا مثبت نظر سند این کل بدانیم که هستیم.داردعنوان به
مقاله یک داشتن با مثالنقد یامشخص سیستم ،محصول یک از
می.است بوده منفی یا مثبت کلی نظر مسأله مورد در که نماید
جمله سطح:مث های دسته به جمالتو ،منفی ،بتدسته خنثی
می بندیشوند.
ویژگی و موجودیت سطح:زبان ساختارهای به پرداختن جای به
خود سراغ مستقیما سطح این در ... و عبارت ،پارگراف ،جمله مثل
می نظرجزء (دو آن به مربوط حس و موجودیت اغلب .رویم
می هم با همراه )نظر اصلیکشف دنبال به سطح این در .آیندحس
موجودیت رویجنبه و هاها9
هستیم آنها مختلف ها)ی (ویژگیکه
.دارد بیشتر های پیچیدگی قبل حالت دو به نسب به
3.تاریخچهکاربرد و
اولین از یکیتحقیقاتسال در حوزه این در9171کاربنل توسط[0]
شبیه مدل یک از وی ،شد معرفیکه کرد طراحی را کامپیوتری شده سازی
میرا کار محافظه یا و خواه آزادی حزب از فرد یک سیاسی عقاید توانست
سیاست به توجه باو آمریکاروسیهسیاست دیگر وبین هایمدل المللی-
نما سازی.ید
احساسات تحلیل عبارت امادر[6]عقیده اصطالح ودر نیز کاوی[7]
زبان اگرچه ،شد برده نام بار اولین برایطبیعی زبان پردازش و شناسیسابقه
سال از قبل تا اما دارند تحقیقاتی طوالنی2000پژوهش میالدیبسیار های
.بود پذیرفته صورت احساسات تحلیل با رابطه در محدودی
سال در شاخه این در تحقیقات گسترش،دارد مختلفی دالیل اخیر های
ًالاوحوزه هر تقریبا آن کاربردمی شامل را ایبه شودصنعت بخش در ویژه
تحلیل را بازار ًالکام دارند نیاز مشاغل صاحبان ،بازار بودن رقابتی دلیل به
برای را زیادی هزینه هستند حاضر و باشند آگاه مشتریان نظرات از و نموده
چالشی حوزه یک ًاثانی دهند انجام اطالعات این داشتنبه ،است تحقیقاتی-
به فارسی زبان در خصوصپیچیدگی دلیلزیادی کار جای آن خاص های
دارد[8].
آخرین و معرفی احساسات تحلیل پرکاربرد حوزه چند ادامه در
.گرفت خواهد قرار بررسی مورد تحقیقات
1
Aspects
3. مقاله عنوان
هفتمینکنفرانسمهندسیبرقایران الکترونیک و–9314گناباد اسالمی آزاد دانشگاه
3
3.1.الکترونیک تجارت و بازاریابی
بیشعقیده کاربرد ترینراه زیرا است تجارت و بازار حوزه در کاویکارها
این در کاربردها .شد خواهد فروش و سوددهی افزایش به منجر ًالمعمو
حوزه:است بررسی قابل زیر دیدگاه سه از
مشتریان دیدگاه از،کاال مزایا و معایب ،محصول کیفیت بررسی :
... و محصوالت مقایسه ،دیگران تجربیات از استفاده
تولیدکنندگان دیدگاه ازاز خود محصول ضعف نقاط کشف :
از بهتر درک ،مشتریان انتظارات و نظرات نقطه ،مشتریان دیدگاه
مشت نیازشرکت سایر با رقابت و مقایسه ،خود ریاندر رقیب های
... و بازار
فروشندگان دیدگاه ازبا مناسب تبلیغات ،بازاریابی :و عالیق
سال... و خریداران به مناسب محصول پیشنهاد ،مشتریان یق
مقاله در[1]جمع پسبازبینی و نظرات متن آوریکاربرن های2
از
انجمنشبکه ،گفتگو هایفروشگاه ،اجتماعی های... و اینترنتی آنالین های
تکنیک از استفاده بااحساسات و عقاید تواستند طبیعی زبان پردازش های
موبایل گوشی مانند مختلفی محصوالت مورد در را کاربرانبهو آورده دست
ویژگی مورد در جزئیات بهدیده کاربران نقدهای که در آن مختلف های
بصری ،شدهسازی3
شکل در دهند انجام را9موبایل یک ویژگی از نمونه دو
آمده موردنظر محصول به نسبت کاربران احساسات کلی نتیجه همراه به
.است
شکل1-مورد در کاربران احساسات تحلیل نتایجموبایل گوشی یک
ویژگی تحلیل خالصه ،کلی نتیجه یک تولید با نهایت در ومختلف های
می خالصه نتیجه یک در را.کند
درفارس زبانینیزمحمدیهمکاران و[90]راهکارینقد درجهت را
یکاحساس واژگان شبکه از استفاده با کاالیکهیکیروش ازهایتحلیل
ا در ،نمودند ارائه است احساساتینسیستمپ مرحله در ابتدایشپردازش
دادهجداساز با هایکلبرچسب ،جمالت و ماتگذاریاجزایر و سخنیشه
2
User Review
3
visualization
یابیموردن اطالعات ،کلماتیازم استخراج نقدها ازیشودبا بعد مرحله در .
و استخراجیژگیهایو از دسته آن ،نقدها از کاالیژگیهاکاربران نظر از که
اهمیتبیشتریم مشخص دارندیشوندو .یژگیهایبهدستآمدهبادقت
باالییمشاو با بهیژگیهایواقعیطبقه و بوده کاالبندیاحساسیمجموعه
احساس بار براساس ،دادهیم صورت متن در موجود واژگانیپذیرد.
درعرصهن بورس بازار و سهامیزعدهایتحل ازیلگرانسرمایهبا
عق از استفادهیدهکاویبه راجع کاربرانیکق ،شرکتیمتپ را آن سهامیش
بینیمیکنندبرایسا وب در مثالیتsentdex.comدر کاربران نظرات
شبکههایاجتماعیشرکت به راجعهایتجز بزرگیهتحل ویلو شده
نمایشدادهمیتحل و شودیلگرانا از استفاده با بازارینپ اطالعاتیشبینی
دقیقتریم رایتوانند.دهند انجام
3.2.جامعه و سیاست
شاخصترینتحل کاربردیلاحس عرصه در ساساتیاستبه مربوط
سال انتخابات2092آمریکااستانتخابات در البته .2008تحقیقاتمشابه
پا سطح دریینتریت .بود شده انجامیمتبلیغاتیاطالعات از استفاده با اوباما
شبکههایاجتماعی،بهخصوصتویی،تررأ توانستیز افرادیادیرابهدست
از استفاده با ،آوردبرچسب تعدادهاییا هر در کهیالتحاوی
#TeamObama tonightم توانستند بودیزانمحبوبیتویق در رایاسبا
رقیبویآن ،دهند نشانهابااستفادهازاینم اطالعاتیتوانستندایالتهای
به هدفتبل منظوریغاتبیشترتع رایینهم و کردهچنینمتنسخنرانیوی
ا به توجه با راتنظ شهر آن قالب فکاریمکنندشکل در ،2بصری نمونهسازی
است شده داده نمایش تحلیل این از حاصل[99,92].
شکل2-میزانمحبوبیتا در اوبامایالتهایاستفاده با مختلفعقیده
در کاویتوییترانتخابات از قبل
4. مقاله عنوان
هفتمینکنفرانسمهندسیبرقایران الکترونیک و–9314گناباد اسالمی آزاد دانشگاه
4
هندی پژوهشگرانسال در2094حدود از استفاده با23میلیونتوییت
از96میلیونشبکه ،کاربرایحدود با40میلیونم که ساختند لبهیتوانست
انتخابات هر برندهیتوج با راعقا به هیدنوشتههایتو کاربرانییترهند در
پیشبینیو ،کندیژگیاصلیسیستمآنهابالدرنگبودنتحلیلآنهالذا ،بود
میتوانستندنت لحظه هر دریجهبه موجود اطالعات به راروزرسانینمای،نددر
نهایتپیشبینیآنهاازدوماهقبلازانتخاباتدقیًاقنت با برابریجهباز عد
.بود انتخابات
اماتحل با توانستند محققان ،جامعه بعد دریلکاربر توسط شده وارد متن
د ویگرشخص صفحه اطالعاتیویاجتماع شبکه دریفیس،بوکمیزان
رضایتویزندگ ازیم مجموع در ویزانرضایتیکتحل را جامعهیلکنند
[93].
4.عقیده مراحلکاوی
شکل در3مراحلقطبیت تعیین4
توسط شده وارد متنکاربرداده نشان
ا .است شدهینکل اصول مراحلیاجراییکسیستمتحلیلگریک قطبیت
متنتشر با ادامه در .استیحروش ،گام هر عمکلردهایاجرا مختلفیآن
بررس موردی.گرفت خواهد قرار
شکل3–مراحلتحلیلاحساجتماع شبکه در کاربر اساتی
4.1.پیشداده پردازشها
ا درینآماده مرحله دو در موردنظر متن ،کاربرد برحسب گامسازیمی
،گرددنگارش عالئم و لغات براساس جمله ابتدایمنقطعتقسی کنندهممیشود
برچسب سپس وگذاریدستور مشخصهیم انجام کلماتی.گردد
4
Polarity
ًالمعمواولینب جمله شکستنگارش خاص عالئم راساسیمانند
».«(،«;»،«،»،»!«،«؟»،)»:«پذ صورتیرفتهتشک کلمات به جمله سپس ویل
دهندهتقسیممیگردد.
امابرچسب درگذاریبرچسب انتساب عملهایواژگانیو کلمات به
نشانههایتشکیلم صورت متنیپذیردا واقع درینبرچسبهانقش
کلماتدرجملهرامشخصمیسازندکل حالت در .یروشهای
برچسبگذاریتقس دسته دو به کلماتیممیمجموعه اول دسته .گردد
روشهایآماریق دوم دسته واعدهروش در .هستند محورهایآمارییک
احتمال مجموعهیبرچسب ازهابراییکم انتخاب کلمهیبراساس و گردد
برچسبهایضر مجاوریبصح احتمالیحه بودنمحاسبه برچسب ر
می.گردد
ًالمعموروش درهایغیرآماریقوان از استفاده با ،محور قاعدهینرفع به
برچسب در ابهاماتگذاریهام پرداختهی،شودا مجموعهینقوانینیابه
شده داده مدل به آموزش صورتاندیابهصورتدستیمعینگردیده.است
سیستمهایمخف مدل ،محور حافظهیمارتخم روش و کوفیناحتمال
بیشینهنمونههاییروش ازهایبرچسبگذاریبرا .هستندی[ در مثال94]
برچسبزنیفارس کلماتیمخف مدل از استفاده بایمعرف مارکوفی
شده.است
مقاله در[94]پیشاز استفاده با توییتر متنی اطالعات پردازشچارچوب
هدوپ0
کاهش نگاشت و6
.است پذیرفته صورت
4.2.ویژگی انتخاب
نظراتیدر کاربران کهیکاجتماع شبکهیویادریکا فروشگاهینترنتی
به راجعیکم محصولیدهندمنف ،مثبت است ممکنیویاخنثی.باشد
اینقطبیتبهیکویژگییاجاز نبهیکمحصولیانسبت موضوع
م دادهیشودبرا .یکاربر مثالیاجتماع شبکه دریمینویسد"!دوستان
گوش امروزیموبایلجدیدخریدمکیفیتنما صفحهیشفوقالعادهایدارد
آنتن امادهین جالب آنیست."ا درینبحث موضوع مثال"موبایل"و است
ویژگییاجنبههایاینموضوع"صفنما حهیش"و"آنتندهی".است
تکنیک از یکیروش ،متن در ویژگی کشف در پرکاربرد هایاطالعات
متقابل7
استروش از یکی کههایدر ویژگی کردن پیدا آماریجمله یا سند
5
Hadoop
6
Map-Reduce
7
Mutual Information
5. مقاله عنوان
هفتمینکنفرانسمهندسیبرقایران الکترونیک و–9314گناباد اسالمی آزاد دانشگاه
0
کلمه هر برای ،استxسند هر درyبیش و شده محاسبه مقداریا ترین
اطالعات عنوان به ،مقادیر آن میانگینباالترین و شده منظور کلمه آن مقابل
آنمی انتخاب ویژگی عنوان به هاچنان گرددچهxوy،باشند مستقل هم از
ضابطه مقدار(9)می صفر راکند.
روش البتهدیگری زیاد هایهمانند متعدد مقاالت درنمایهسازیمعنایی
پنهان
8
[90]مارکوف مخفی مدل ،[96]،تخصیصدیریکلهپنهان
9
[97]،
بیشآنتروپی ترین... و.است شده معرفی
4.3.طبقهبندیکننده10
اصل پردازشیتع جهتیینقطبیتیکجملهیایکا در سندینمرحله
م صورتیپذی،رداصل هدفیاینطبقه بخشبندییکجملهیایکسند
برقطب اساسیتحل راه .است آنکل دسته دو به هایمبتنیبریادگیری
ماشینواژه ونامهتقسیممیشوددق ابزارها .یًاقعمل همانیم انجام رایدهند
طبقه کهبندیکنندههاکاربردها دریسنتیمتنکاویآن در ،دارندجایک
طبقه از پس سندبندیمیتوانستدسته بههایس همانند مختلفیاسی،
ورزشی،علمیطبقه در اما گردد اضافه ... وبندیکنندهعقایدا ًالمعموین
دستههابهسهگروه،مثبتمنفیخنث ویتبدیلمی.گردد
درطبقهبندیمبتنیپ از که واژگان بریکرههای99
و مختلفیاواژهنامه92
م استفاده خاصیشود،کل روالیا بهینبرا که است شکلیدر کلمه هر
یکاسام مانند جملهی،افعال،صفاتوقیودواژگان شبکه در ،موجود
احساسیم صورت جستجویگیردصورت در ویموجود شبکه در واژه آن که
،باشداحساس برچسبیم استخراج آنی،شودقطب با متناسب واژه هریتیکه
شبکه ازوزن ،شده استخراج واژگانیمیگی،ردبرایجمله هرایدر کاربر که
اجتماع شبکهیمینویسدوزن مجموعهاباتوجهبهقطبیتمحاسبه آن
می،گرددعدد اگریبزرگترازصفرباشدآنجملهقطبیتم مثبتیگیردو
درغیراینصورتمنف جملهیم گرفته نظر دریشود.
وجودیکواژهنامهدریکسیستمتحلیلضرور احساساتیاما است
کافینیستم ًاحتم ویبایستد کنار دریگرروشهایتکمیلبه کنندهکار
8
Latent Semantic Indexing (LSI)
9
Latent Dirichlet Allocation (LDA)
10
Classifier
11
Corpus
12
Dictionary
.شوند بردهدرشکل3روش انواع شده تالشهایرایجیطبقه در کهبندی
عقیدهنما دارد کاربرد متن دریش[ شود داده91.]
شکل4-روش انواعهایطبقهبندی
بیشتکنیک ترشکل های4پیاده تواناییابزارهای از استفاده با سازی
کالنداده93
مقیاس ابزارها این از استفاده دارند راپردازش سرعت و پذیری
داده حجم درچشم شکل به را باال هایمی افزایش گیری.دهد
در[98]فایل سیستم و هدوپ از استفاده باHDFS
94
تکنیک ،Naïve
Bayesع بهطبقه نوانبندیسینما و فیلم مورد در کاربران نظرات کنندهوب
پیاده ،آمازون سایتکتابخانه از استفاده بدون نویسندگان .است شده سازی-
پیش های(همانند هدوپ فرضMahoutماژول ،)را خود نیاز مورد های
.نمودند طراحی
مقیاس داد نشان نتایجطبقه پذیریبندیکنندهNBبدون حتیداده پایگاه
بهمی پیدا افزایش راحتی.کند
دقحدود بررسی مورد حاالت تمامی در متوسط ت82اما بوده درصد
هدوپ چارچوب از که مقاالتی دیگر همانندنموده استفادهصورت در ،اند
پیدا افزایش زیادی مقدار تا پردازش سرعت ،ورودی اطالعات حجم افزایش
.کند می
جدول در9ز مرتبههر به نسبت پردازش مانی90بازبینی متن هزار
که حالت اولین در .است شده داده نمایش کاربران2قرار آن در بازبینی هزار
داده مقدار زیرا ندارد مناسبی زمانی مرتبه سازی موازی است مشخص ،دارد
بالک هر حجم از ورودیHDFSکمبه نزدیک و حجم افزایش با است تر
بهینه مقدارHDFSچشم بهبود زمانی مرتبهمی پیدا گیریکند.
13
Big data
14
Hadoop Distributed File System
(9)
6. مقاله عنوان
هفتمینکنفرانسمهندسیبرقایران الکترونیک و–9314گناباد اسالمی آزاد دانشگاه
6
جدول9–هر )(ثانیه پردازش زمان9000کاربران بازبینی متن
ورودی متن تعداد حجم
)(هزار
220200400600800
/ ثانیه10متن هزار9/40090/4807/624/447/399/3
ورودی متن تعداد حجم
)(هزار
900092009400960098002000
/ ثانیه10متن هزار88/277/247/24/237/233/2
5.عقیده در داده کالن کاربردکاوی
عظیم حجم پردازش توانایی و داده کالن ابزارهای شدن گسترده از بعد
اطالعاتسازمان دیگرهامجبورناز بودندیکرا َربایانهویاداده انبارهای
کند استفادهواقع درپا ضعفیگاهدادههایرابطهاینگه درداریتجز ویهو
تحلیلحجمعظیمیداده ازهاینیمهساختارینما ساختار بدون ویانگشت
کردن مطرح با دانشمندان ومفهومجدیدینام بهNoSQL
90
به اقدام
جد نسل ساختیدیپا ازیگاههایدادهایم کهیتواندعظ حجمیمیاز
را اطالعاتزیر یک درساابری ختنگهدارینمودند ،کند پردازش و[91].
بیشالگوریتم ترطبقه هایمی بندیبا و موازی شکل به توانداز استفاده
پیاده داده کالن ابزارهایشود سازی[98,20].
کال ابزارهای از استفاده مزایای از مورد چند به فقط ادامه دردر داده ن
عقیده.شد خواهد اشاره کاوی
پ مراحل از یک هرها داده پردازش و پردازش یشبه تواند می
مرتبط ابزارهای روی بر موازی شکلاز استفاده همانندچارچوب
نگاشت–شود سازی پیاده کاهشمثال برای ،در[94]از استفاده با
داده در ،نمودند ثابت داده کالن ابزارهایسرعت حجیم های
در دستورات اجرایهدوپاز بیشترمدل دیگرمرسوم هایاست
شکل (در0).
شکل5-دوحالت در کلمه شمارش زمان میزانبررسی مورد
15
Not Only SQL
پیاده قصد شرکت یک اگرعقیده سیستم یک اجرایی و سازیکاوی
داشتهاز استفاده با اما کند صرف باید را زیادی هزینه باشد
می ابر بستر در داده کالن ابزارهایهز تواندحد تا را خود ینه
شرکت از بسیاری ،دهد کاهش زیادیخدمات این دارند وجود ها
نرم درقالب راافسرویس عنوان به زار96
می ارایه.دهند
داده از حجمی هر اندازه به پذیری مقیاس
داده پردازش تواناییهلحظه خروجی ایجاد و بالدرنگ صورت به ا
ًاخصوص توانایی این ، ایزمان یک به وابسته که کاربردهایی در
است کاربردی بسیار ،نتیجه یک بینی پیش مانند است خاص[29].
6.نتیجهآینده کارهای و گیری
ا درینآخر مقالهینو دستاوردهاپژوهشهادرحوزهتحلیلاحساسات
داده کالن ابزارهای از استفاده باتوجه با و گرفت قرار تحلیل و تجزیه مورد
ابزارها این از استفاده ،شد مشخص بررسی مورد مقاالت از حاصله نتایج به
داده حجم که است کاربردی و بهینه ًالکام صورتی درو باشد زیاد بسیار ها
ابزارها دیگر به نسبت نتایج کم داده حجم با محاسبات انجام حالت این در
ضعیفاست تر.
بهزمینه عنوانبیش پژوهش جای زیر عناوین مناسب تحقیقاتی هایتری
.داشت خواهد حوزه این در فعاالن توسط آینده در
کاربرد و گسترش بایترابزارها شدنیمدیریتکالندادهدن دری،ا
میتوانبسیاریروش ازهایتشخیصاحساساتعقاید وزبان در
فارسیرااز استفاده باابزارهایمانند آن خاصهدوپ چارچوب
پیادهسازی.نمود
یکیروش ازهایآماریبرایمدلسازیمدل از استفاده کلمات
n-gramم .استیتوانبرایمق بردن باالیاسپذیریاجرا وی
موازی،یکیروش ازهایآننگاشت چارچوب در را-کاهش
پیادهسازینمود[22].
میتوانتحق بایقرو بریداده ساختارهایمبتنیواژه بر،نامهزمان
جستجودرآنراکاهشدادیکیا ازینراهکارهامیتواندپیاده
سازیپا دریگاهدادههایNoSql.باشد
سیستم یک در پردازش از بعد اطالعات سازی بصری چگونگی
چ همواره داده کالنبیش پژوهش جای و بوده الشی.دارد تری
16
Software as a Service
7. مقاله عنوان
هفتمینکنفرانسمهندسیبرقایران الکترونیک و–9314گناباد اسالمی آزاد دانشگاه
7
نگاشت چارچوب در-در الگوریتم یک که زمانی کاهشمحیط
می اجرا ابریگره بین را کار دارد وظیفه نگاشت تابع شودهای
بخش به کار تقسیم .کند تقسیم کارگرو آسان همیشه مساوی های
هر ،باشد قواعد استخراج هدف اگر مثال عنوان به .نیست راحت
بیش تقسیمات تعداد چهمشکل قاعده استخراج شود ترخواهد تر
نگاشت از مناسبی تعداد تعیین بنابراین .بودگره تعداد یا هایکی ها
زمینه ازمی تحقیقاتی های.باشد تواند
منابع
[1] Statista. Facebook number of monthly active users worldwide
2015; Available from:
http://www.statista.com/statistics/264810/number-of-monthly-
active-facebook-users-worldwide/.
[2] GEOFF. Just One Minute On Facebook
JUNE 11, 2014; Available from: http//:wersm.com/just-one-minute-on-
facebook-infographic/.
[3] Adedoyin-Olowe, M.M.G., Mohamed; Stahl, Frederic, A Survey
of Data Mining Techniques for Social Media Analysis. eprint
arXiv, 2014. 1312.4617.
[4] Liu, B. and L. Zhang, A Survey of Opinion Mining and Sentiment
Analysis, in Mining Text Data, C.C. Aggarwal and C. Zhai,
Editors. 2012, Springer US. p. 415-463.
[5] Carbonell, J.G., Subjective Understanding: Computer Models of
Belief Systems, in PhD thesis. 1979.
[6] Nasukawa, T. and J. Yi, Sentiment analysis:capturing favorability
using natural language processing, in Proceedings of the 2nd
international conference on Knowledge capture. 2003, ACM:
Sanibel Island, FL, USA. p. 70-77.
[7] Dave, K., S. Lawrence, and D.M. Pennock, Mining the peanut
gallery: opinion extraction and semantic classification of product
reviews, in Proceedings of the 12th international conference on
World Wide Web. 2003, ACM: Budapest, Hungary. p. 519-528.
[8] Mohammad Ehsan Basiri* , A.R.n., Nasser Ghassem-Aghaee A
Framework for Sentiment Analysis in Persian. Open Transactions
on Information Processing, 2014. 1(3): p. 1-14.
[9] Kherwa, P., et al. An approach towards comprehensive sentimental
data analysis and opinion mining. in Advance Computing
Conference (IACC), 2014 IEEE International .4102.
[01]،محمدی مجید و نفس نیک اکبر علی سمیه؛ ،زرندی برهانی9312نقد در کاوی عقیده ،
،احساسی واژگان شبکه از استفاده با کاالکنفرا دومینسیستم و صنایع مهندسی ملی نس
،صنایع مهندسی گروه ،آباد نجف واحد اسالمی آزاد دانشگاه ،آباد نجف ،ها
http://www.civilica.com/Paper-NIESC02-NIESC02_082.html
[11] Lewis, R. US Election 2012: Twitter is big winner as Obama is re-
elected for second term. Wed, Nov 7, 2012 [ cited 2015; Available
from: https://uk.news.yahoo.com/us-election-2012--twitter-is-big-
winner-as-obama-is-re-elected-for-second-term-
07112012.html#3DCuuBb.
[12] S. Chandrasekar, E.C., and A. Ginet, Predicting the US
Presidential Election using Twitter data, in CS 229 Machine
Learning Project report. 2012: Stanford University.
[13] Collins, S., et al., Are You Satisfied with Life?: Predicting
Satisfaction with Life from Facebook, in Social Computing,
Behavioral-Cultural Modeling, and Prediction, N. Agarwal, K. Xu,
and N. Osgood, Editors. 2015, Springer International Publishing. p.
24-33.
[14] Amalarethinam, V.J.N.a.D.I.G., Parallel Implementation of Big
Data Pre-Processing Algorithms for Sentiment Analysis of Social
Networking Data. Intern. J. Fuzzy Mathematical Archive, 2015.
6(2): p. 149-159.
[15] Poshyvanyk, D., et al. Combining Probabilistic Ranking and Latent
Semantic Indexing for Feature Identification. in Program
Comprehension, 2006. ICPC 2006. 14th IEEE International
Conference on. 2006.
[16] Rustamov, S., E. Mustafayev, and M.A. Clements. Sentiment
analysis using Neuro-Fuzzy and Hidden Markov models of text. in
Southeastcon, 2013 Proceedings of IEEE. 2013.
[17] Shams, M., A. Shakery, and H. Faili. A non-parametric LDA-
based induction method for sentiment analysis. in Artificial
Intelligence and Signal Processing (AISP), 2012 16th CSI
International Symposium on. 2012.
[18] Bingwei, L., et al. Scalable sentiment classification for Big Data
analysis using Naïve Bayes Classifier. in Big Data, 2013
IEEE International Conference on. 2013.
[19] ،خادمی مریم و حامد ،وامرزانی عزیزی9313های چالش و کاربردها ،داده کالن ،
،آن مرکز ،تهران ،پایه و مهندسی علوم در نوین دستاوردهای الکترونیکی ملی همایش
،کاو زمین پژوهشهای http://www.civilica.com/Paper-AEBSCONF01-
AEBSCONF01_114.html
[20] Li, B. and K.C.C. Chan. A Fuzzy Logic Approach for Opinion
Mining on Large Scale Twitter Data. in Utility and Cloud
Computing (UCC), 2014 IEEE/ACM 7th International Conference
on. 2014.
[21] Rahnama, A.H.A., Distributed Real-Time Sentiment Analysis for
Big Data Social Streams. 2014.
[22] Allam, T.M., A.A. Sallam, and H.M. Abdullkader. Managed N-
gram language model based on Hadoop framework and a Hbase
tables. in Informatics and Systems (INFOS), 2014 9th International
Conference on. 2014.