SlideShare uma empresa Scribd logo
1 de 46
Baixar para ler offline
تحلیل احساسات شبکه اجتماعی متن کاوی نظرکاوی حامد عزیزی تهران جنوب
‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬
‫جنوب‬ ‫تهران‬ ‫واحد‬
‫مهندسی‬ ‫و‬ ‫فنی‬ ‫دانشکده‬-‫ت‬ ‫تحصیالت‬ ‫مرکز‬‫کمیلی‬
‫استاد‬‫راهنما‬:
‫خادمی‬ ‫مریم‬ ‫دکتر‬
‫دهنده‬ ‫ارائه‬:
‫عزیزی‬ ‫حامد‬
17‫شهریور‬1394
‫افزایش‬ ‫راستای‬ ‫در‬ ‫اجتماعی‬ ‫های‬ ‫شبکه‬ ‫در‬ ‫کاوی‬ ‫متن‬
‫تجاری‬ ‫هوش‬
‫دانشجویی‬ ‫شماره‬:
9141240607
‫مطالب‬ ‫فهرست‬
•‫مقدمه‬
•‫کاوی‬ ‫عقیده‬ ‫و‬ ‫کاوی‬ ‫متن‬
•‫فارسی‬ ‫زبان‬ ‫در‬ ‫کاوی‬ ‫عقیده‬
•‫تحقیق‬ ‫پیشینه‬
•‫پیشنهادی‬ ‫های‬ ‫روش‬
•‫گیری‬ ‫نتیجه‬‫آ‬ ‫پیشنهادات‬ ‫و‬‫تی‬
•‫منابع‬
•‫رساله‬ ‫از‬ ‫مستخرج‬ ‫مقاالت‬
01
1/43
‫مقدمه‬
‫اطالعات‬ ‫ی‬ ‫خالصه‬ ‫دانش‬‫است‬.
012/43
•‫تر‬ ‫قدرتمند‬ ‫دانش‬ ‫و‬ ‫است‬ ‫قدرت‬ ‫باعث‬ ‫اطالعات‬.
•‫کمبود‬ ‫مسأله‬‫است‬ ‫اطالعات‬ ‫کسب‬ ‫دانش‬ ‫نیست،کمبود‬ ‫اطالعات‬ ‫حجم‬.
•80‫و‬ ‫مستندات‬ ،‫متن‬ ‫صورت‬ ‫به‬ ‫ما‬ ‫اطالعات‬ ‫از‬ ‫درصد‬..
•‫دارند‬ ‫یافته‬ ‫ساخت‬ ‫غیر‬ ‫ماهیت‬ ‫طبیعی‬ ‫صورت‬ ‫به‬.
‫کنونی‬ ‫عصر‬ ‫در‬ ‫اطالعات‬
01
‫اطالعات‬ ‫در‬ ‫کاوش‬
•‫شود‬ ‫انجام‬ ‫ها‬ ‫داده‬ ‫روی‬ ‫پردازش‬ ‫باید‬ ‫دانش‬ ‫کسب‬ ‫برای‬.
•‫با‬،‫تکنولوژی‬ ‫عصر‬ ‫این‬ ‫در‬ ‫حال‬ ‫این‬‫که‬ ‫است‬ ‫این‬ ‫بر‬ ‫تالش‬‫حتی‬ ‫شود‬ ‫انجام‬ ‫خودکار‬ ‫بتواند‬ ‫باید‬ ‫چیزی‬ ‫هر‬‫کار‬ ‫این‬ ‫اگر‬
"‫متن‬ ‫معنی‬ ‫درک‬"‫باشد‬.
3/43
014/43
•‫رسانه‬ ‫محبوبیت‬ ‫و‬ ‫گسترش‬‫محور‬ ‫کاربر‬ ‫های‬
•‫وسیع‬ ‫دید‬ ‫در‬ ‫و‬ ‫فرد‬ ‫یک‬ ‫دهنده‬ ‫نشان‬ ‫اطالعات‬‫است‬ ‫کشور‬ ‫یک‬ ‫و‬ ‫جامعه‬ ،‫تر‬
•‫تحلیل‬ ‫طریق‬ ‫از‬ ‫آمده‬ ‫دست‬ ‫به‬ ‫دانش‬ ‫باالی‬ ‫ارزش‬‫اطالعات‬ ‫این‬
‫محور‬ ‫کاربر‬ ‫های‬ ‫رسانه‬
015/43
•‫فعال‬ ‫کاربر‬ ‫میلیارد‬
•‫در‬‫حدود‬ ‫دقیقه‬ ‫یک‬41/000‫به‬ ‫را‬ ‫متنی‬ ‫بار‬
‫وضعیت‬ ‫عنوان‬‫نویسند‬ ‫می‬.
•‫بیش‬‫از‬3‫روی‬ ‫بر‬ ‫را‬ ‫تأئید‬ ‫میلیون‬‫های‬ ‫نوشته‬
‫ثبت‬ ‫کاربران‬ ‫دیگر‬‫کنند‬ ‫می‬.
‫اجتماعی‬ ‫های‬ ‫شبکه‬ ‫در‬ ‫متن‬ ‫تولید‬ ‫آمار‬
•‫روزانه‬500‫نوشته‬ ‫میلیون‬(‫توییت‬)‫به‬33‫زبان‬
‫منتشر‬ ‫کاربران‬ ‫توسط‬ ‫دنیا‬ ‫زنده‬‫می‬‫شود‬
•‫حروف‬ ‫تعداد‬ ‫ارسال‬ ‫در‬ ‫محدودیت‬
•‫زدن‬ ‫برچسب‬ ‫امکان‬
‫منبع‬www.statista.com
‫از‬ ‫بیش‬ ‫ثانیه‬ ‫هر‬ ‫در‬1000‫مورد‬ ‫در‬ ‫نظر‬
‫می‬ ‫نوشته‬ ‫کاربران‬ ‫توسط‬ ‫تصاویر‬‫شود‬.
‫آپلود‬‫از‬ ‫بیش‬40‫روز‬ ‫در‬ ‫عکس‬ ‫میلیون‬
8500‫ثانیه‬ ‫هر‬ ‫در‬ ‫الیک‬
‫و‬ ‫کاوی‬ ‫متن‬
‫کاوی‬ ‫عقیده‬
016/43
017/43
‫کاوی‬ ‫متن‬
•‫علمی‬‫کاوی‬ ‫متن‬ ‫نام‬ ‫به‬ ‫جدید‬‫به‬‫می‬ ‫وجود‬‫آید‬.
•Knowledge Discovery in Text (KDT)
•‫کشف‬‫در‬ ‫دانش‬‫متن‬.
‫هدف‬‫نهایی‬‫است‬ ‫این‬‫است‬ ‫درک‬ ‫قابل‬ ‫بشر‬ ‫توسط‬ ‫که‬ ‫دانشی‬ ‫از‬ ‫ذره‬ ‫هر‬ ‫که‬‫وسیله‬ ‫به‬‫کامپی‬ ‫ی‬‫وتر‬‫نیز‬
‫درک‬‫شود‬.
‫کاوی‬ ‫عقیده‬
01
•‫خواندن‬‫وقت‬ ‫کاری‬ ‫کاربران‬ ‫نظرات‬ ‫از‬ ‫بخشی‬ ‫حتی‬ ‫یا‬ ‫و‬ ‫تمامی‬ ‫بررسی‬ ‫و‬‫عظیم‬ ‫حجم‬ ‫این‬ ‫در‬ ‫و‬ ‫گیر‬‫داده‬ ‫از‬
‫غیرممکن‬‫است‬.
8/43
‫عقیده‬ ‫و‬ ‫احساسات‬ ‫تحلیل‬‫را‬ ‫مردم‬ ‫منفی‬ ‫یا‬ ‫و‬ ‫مثبت‬ ‫احساسات‬ ‫شناخت‬ ‫و‬ ‫کشف‬ ‫معنی‬ ‫به‬ ‫کاوی‬‫یک‬ ‫به‬ ‫جع‬
‫است‬ ‫محصول‬ ‫یا‬ ‫مسأله‬.
‫کاوی‬ ‫عقیده‬
01
9/43
‫یک‬‫نظر‬‫یک‬‫چهارگانه‬(g, s, h, t)‫است‬
g‫هدف‬(‫آنچه‬‫که‬"‫نظر‬"‫در‬‫مورد‬‫آن‬‫بیان‬‫شده‬‫است‬)
s‫حس‬‫بیان‬‫شده‬
h‫صاحب‬‫نظر‬
t‫زمان‬‫بیان‬‫نظر‬‫است‬.
‫عینی‬ ‫جمالت‬:‫می‬ ‫بیان‬ ‫را‬ ‫اطالعاتی‬ ‫و‬ ‫حقایق‬‫کند‬.
‫ذهنی‬ ‫جمالت‬:، ‫تمایالت‬ ، ‫احساس‬ ‫حاوی‬
‫باشد‬ ‫شخصی‬ ‫تجربیات‬ ‫ویا‬ ‫دیدگاهها‬.
‫جمله‬ ‫انواع‬
0110/43
•‫کاوی‬ ‫عقیده‬‫سند‬ ‫سطح‬:
o‫اسناد‬ ‫بندی‬ ‫طبقه‬
o‫فیلم‬ ‫نقد‬‫سیاسی‬ ‫نقدهای‬ ،
‫کاوی‬ ‫عقیده‬ ‫سطوح‬
•‫جمله‬ ‫سطح‬ ‫نظرکاوی‬:
o‫جمالت‬ ‫بندی‬ ‫طبقه‬
o‫ها‬ ‫توییت‬‫نظرات‬ ،‫کوتاه‬
+++-
+
•‫ویژگی‬ ‫سطح‬ ‫نظرکاوی‬:
o‫خصوصیات‬ ‫به‬ ‫دادن‬ ‫امتیاز‬
‫مختلف‬
‫کاوی‬ ‫عقیده‬ ‫شاخص‬ ‫کاربردهای‬
0111/43
•‫سیاست‬(،‫انتخابات‬‫بینی‬ ‫پیش‬‫م‬ ،‫ها‬‫انقالب‬ ‫و‬ ‫تحوالت‬‫یزان‬
‫درباره‬ ‫مردم‬ ‫نظر‬ ‫و‬ ‫مردم‬ ‫اتحاد‬)...
•‫شناسی‬‫روان‬ ‫و‬ ‫اجتماعی‬ ‫علوم‬(‫فره‬ ‫و‬ ‫اجتماعی‬ ‫مسائل‬ ‫تحلیل‬،‫نگی‬
‫و‬ ‫مردم‬ ‫رفتار‬ ‫در‬ ‫مختلف‬ ‫اتفاقات‬ ‫تاثیر‬)...
•‫مدیریت‬(‫طر‬ ‫و‬ ‫رضایت‬ ‫میزان‬ ‫از‬ ‫آگاهی‬ ،‫گیری‬‫تصمیم‬ ‫در‬ ‫کمک‬‫ز‬
‫و‬ ‫سازمانی‬ ‫فرا‬ ‫یا‬ ‫درون‬ ‫نرم‬ ‫اطالعات‬ ‫آوری‬ ‫جمع‬ ،‫افراد‬ ‫تفکر‬)...
‫کاوی‬ ‫عقیده‬ ‫شاخص‬ ‫کاربردهای‬
0112/43
‫دیدگاه‬ ‫از‬‫مشتریان‬
‫دیدگاه‬ ‫از‬‫تولیدکنندگ‬‫ان‬
‫دیدگاه‬ ‫از‬‫فروشندگان‬
‫کاوی‬ ‫عقیده‬
‫فارسی‬ ‫زبان‬ ‫در‬
0113/43
‫مثبت‬
‫مثبت‬
‫منفی‬
‫مثبت‬
‫منفی‬
‫منفی‬
‫فارسی‬ ‫زبان‬ ‫های‬ ‫ویژگی‬
0114/43
•‫فارسی‬ ‫زبان‬ ‫خاص‬ ‫های‬ ‫ویژگی‬
•‫برخی‬‫پیچیدگی‬ ‫این‬ ‫از‬‫و‬ ‫زبان‬ ‫طبیعت‬ ‫به‬ ‫ها‬‫ایجاد‬ ‫در‬ ‫دیگر‬ ‫برخی‬‫سیستم‬‫مصنوعی‬ ‫هوش‬ ‫های‬
•‫می‬ ‫را‬ ‫متون‬ ‫در‬ ‫های‬ ‫چالش‬‫ریخت‬ ‫و‬ ،‫نحوی‬ ،‫معنایی‬ ‫سطح‬ ‫سه‬ ‫به‬ ‫توان‬‫کرد‬ ‫تقسیم‬ ‫شناختی‬.
•‫درس‬ ‫نتایج‬ ً‫ا‬‫مطمن‬ ،‫نپذیرد‬ ‫صورت‬ ‫درستی‬ ‫به‬ ‫پردازش‬ ‫پیش‬ ‫مراحل‬ ‫فارسی‬ ‫زبان‬ ‫های‬ ‫ویژگی‬ ‫به‬ ‫توجه‬ ‫با‬ ‫اگر‬‫حاصل‬ ‫تی‬
‫شد‬ ‫نخواهد‬.
‫فارسی‬ ‫زبان‬ ‫های‬ ‫ویژگی‬
0115/43
•‫د‬ ‫این‬ ‫ترکیب‬ ‫یا‬ ‫و‬ ‫عامیانه‬ ‫یا‬ ‫و‬ ‫رسمی‬ ‫شکل‬ ‫به‬ ‫نوشتن‬‫حالت‬ ‫و‬
•‫انگاره‬ ‫هم‬ ‫ابهام‬
•‫چسبیدن‬«‫پسوندها‬»
•‫نیم‬ ‫و‬ ‫فاصله‬‫است‬ ‫فارسی‬ ‫زبان‬ ‫در‬ ‫زیادی‬ ‫ابهام‬ ‫عامل‬ ،‫فاصله‬.
•‫بخشی‬ ‫چند‬ ‫کلمات‬ ‫بین‬ ‫جداکننده‬ ‫عنوان‬ ‫به‬‫به‬‫کار‬‫گرف‬‫یا‬ ‫شود‬ ‫ته‬
‫مثال‬ ‫برای‬ ،‫نشود‬"‫برداری‬ ‫فیلم‬"
‫م‬ ‫پشیمون‬ ‫نخرید‬ ، ‫نیست‬ ‫خوب‬ ‫اصال‬ ‫باطریشم‬‫یشید‬.
‫صفحه‬ ‫اشکال‬ ،‫کردم‬ ‫بررسی‬ ‫را‬ ‫مختلف‬ ‫اشکال‬
‫است‬ ‫پابرجا‬ ‫نمایش‬.
‫صف‬ ‫برداری‬ ‫فیلم‬ ‫هنگام‬ ‫سامسونگ‬ ‫های‬ ‫گوشی‬‫حه‬
‫شود‬ ‫نمی‬ ‫سیاه‬ ‫نمایششان‬.
‫بحث‬‫فاصله‬‫ها‬‫م‬ ‫توسط‬ ‫فارسی‬ ‫کلمات‬ ‫صحیح‬ ‫تشخیص‬ ‫در‬ ‫تأثیرگذار‬ ‫عاملی‬‫است‬ ‫اشین‬.
‫فارسی‬ ‫زبان‬ ‫های‬ ‫ویژگی‬
0116/43
•‫فارسی‬ ‫جمالت‬ ‫بین‬ ‫در‬ ‫انگلیسی‬ ‫کلمات‬ ‫ترکیب‬
•‫در‬‫کلمه‬ ‫مثال‬ ‫بری‬ ‫دارد‬ ‫وجود‬ ‫نوشتن‬ ‫نوع‬ ‫چندین‬ ‫کلماتی‬ ‫برای‬ ‫فارسی‬ ‫زبان‬"‫باتری‬ ،‫باطری‬"
•‫و‬ ‫عامیانه‬ ‫جمالت‬ ، ‫المثلها‬ ‫ضرب‬ ،‫ها‬ ‫کنایه‬...
•‫قراین‬ ‫به‬ ‫وابسته‬ ‫اطالعات‬
•‫فارسی‬ ‫زبان‬ ‫پردازش‬ ‫ابزارهای‬ ‫کمبود‬
‫گوشی‬ ‫این‬OTG‫نمی‬ ‫ساپورت‬‫کند‬
‫تحقیق‬ ‫پیشینه‬
0117/43
0118/43
‫پایگاه‬ ‫از‬ ‫شده‬ ‫یافت‬ ‫مقاالت‬ ‫تعداد‬Google Scholar‫واژه‬ ‫کلید‬ ‫اساس‬ ‫بر‬Opinion mining‫و‬Sentiment analysis
‫مشهد‬ ‫فردوسی‬ ‫دانشگاه‬ ‫دانشجویان‬ ‫اسالید‬ ‫از‬ ‫مستخرج‬ ‫جدول‬
‫مقاله‬ ‫زبان‬
2013
2012
2011
2010
2009
2008
2007
2006
2005
2004
2003
‫مجموع‬
‫چینی‬192391056121__76
‫عربی‬965________20
‫اسپانیایی‬67_11______15
‫آلمانی‬13_2_1_____7
‫ایتالیایی‬13_2_1_____7
‫فارسی‬2__________2
‫زبان‬ ‫از‬ ‫مستقل‬542467303228163874936101121900
01
19/43
‫درسال‬2013‫شمس‬ ،‫آبادی‬ ‫نجف‬‫روشی‬ ‫ارائه‬ ‫به‬ ،‫ناظر‬ ‫بدون‬‫جهت‬‫است‬ ‫کرده‬ ‫ارائه‬ ‫فارسی‬ ‫مستندات‬ ‫قطبیت‬ ‫تعیین‬.
‫روش‬ ‫در‬‫ارائه‬‫شده‬‫مبنای‬ ‫بر‬ ‫کلمه‬ ‫هر‬ ،‫نظر‬ ‫حاوی‬ ‫کلمات‬ ‫استخراج‬ ‫از‬ ‫بعد‬ ،‫موضوعی‬‫که‬‫از‬ ‫استفاده‬ ‫با‬ ‫دارد‬ ‫قرار‬ ‫آن‬ ‫در‬
‫الگوریتم‬ ‫دو‬PLSASA‫و‬LDASA‫وزن‬‫می‬‫گیرد‬.
‫تحقیق‬ ‫پیشینه‬
‫شده‬ ‫ارائه‬ ‫راهکار‬
0120/43
0121/43
‫استفاده‬ ‫مورد‬ ‫افزار‬ ‫نرم‬
•‫تمامی‬‫مراحل‬‫با‬‫استفاده‬‫از‬‫نرم‬‫افزار‬Rapidminer‫پیاده‬‫سازی‬‫شده‬‫است‬
•ً‫ا‬‫اخیر‬‫این‬‫نرم‬‫افزار‬‫با‬‫معرفی‬‫افزونه‬Radoop‫توانسته‬‫خود‬‫را‬‫به‬‫عنوان‬‫نرم‬‫افزار‬‫تحلیل‬‫داده‬‫های‬‫عظیم‬‫نیز‬
‫معرفی‬‫کند‬.
•‫رایگان‬‫بودن‬‫نسخه‬‫های‬‫غیر‬‫تجاری‬‫و‬‫استفاده‬‫راحت‬
0122/43
‫پیشنهادی‬ ‫کلی‬ ‫مدل‬
User Review Data
set
Data Pre-processing
Feature Selection
Classifier Evaluation
01
23/43
‫همانند‬ ‫معروف‬ ‫اجتماعی‬ ‫های‬ ‫شبکه‬ ‫از‬twitter , Facebook,Linkedin
‫ایران‬ ‫موبایل‬ ‫مرجع‬ ‫و‬ ‫کاال‬ ‫دیجی‬ ‫همانند‬ ‫ایران‬ ‫در‬ ‫اینترنتی‬ ‫فروش‬ ‫معروف‬ ‫های‬ ‫سایت‬ ‫همچنین‬ ‫و‬
‫شده‬ ‫آوری‬ ‫جمع‬ ‫های‬ ‫داده‬
‫از‬ ‫بیش‬ ‫آوری‬ ‫جمع‬1000‫موبایل‬ ‫ها‬ ‫گوشی‬ ‫به‬ ‫راجع‬ ‫نظر‬ ‫متن‬ ‫قطعه‬
0124/43
‫کاربران‬ ‫نقدهای‬ ‫های‬ ‫داده‬ ‫دسته‬
‫سالم‬‫دوستان‬‫عزیزاین‬‫رو‬ ‫گوشی‬‫گرفتم‬ ‫چنروزه‬.‫بگم‬ ‫میتونم‬ ‫فقط‬‫بخرین‬ ‫حتما‬‫ش‬‫اصال‬
‫نکنید‬ ‫شک‬. !!‫بدون‬‫شک‬‫از‬ ‫یکی‬‫ترین‬ ‫زیبا‬‫بدنش‬ ‫گوشیهاست‬‫سخت‬ ‫عالیه‬‫اف‬‫زار‬
‫قدرتمندیم‬‫داره‬‫نمایشش‬ ‫صفحه‬‫اس‬ ‫حد‬ ‫در‬ ‫ک‬‫دوربینش‬ ‫فایوه‬‫خیلی‬‫مخصو‬ ‫خوبه‬‫صا‬
‫سلفیش‬‫وقتی‬ ‫فقط‬‫میکنی‬ ‫زوم‬ ‫ک‬‫خیلی‬ ‫کیفتش‬‫نیست‬ ‫خوب‬‫بگم‬ ‫خالصه‬‫از‬ ‫ک‬
‫کارکردن‬‫لذت‬ ‫باهاش‬‫در‬ ‫و‬ ‫میبرم‬‫هیچ‬ ‫مقابل‬‫نمیاره‬ ‫کم‬ ‫گوشی‬
#‫آیفو‬ ‫شدن‬ ‫خم‬ ‫مشکل‬ ‫فقط‬ ،‫شاهکاره‬ ‫آیفون‬‫ن‬6
‫نیست‬ ‫شدن‬ ‫حل‬ ‫قابل‬ ‫نظرم‬ ‫به‬.
‫اول‬‫گوشی‬ ‫اینکه‬‫من‬‫به‬‫میکنه‬ ‫داغ‬ ‫شدت‬‫مخصوصا‬‫صفحه‬‫نمایشش‬‫طوری‬‫که‬‫دستم‬
‫میسوزه‬!!!‫؟‬
‫اینکه‬ ‫دوم‬‫باتریش‬‫خیلی‬‫تموم‬ ‫زود‬‫میشه‬.‫من‬‫شارژ‬100‫وای‬ ‫با‬‫فای‬‫روشن‬‫هیچ‬ ‫بدون‬
‫استفاده‬‫ای‬‫میز‬ ‫رو‬ ‫گذاشتم‬3‫ساعت‬‫بعد‬‫شارژش‬80‫بود‬‫االن‬‫سری‬ ‫یه‬ ‫هم‬‫بازی‬‫اچ‬‫رو‬ ‫دی‬
‫گوشیم‬‫ریخته‬‫بودم‬‫دیتاهاش‬ ‫که‬‫یهو‬‫غیب‬‫حجم‬ ‫اما‬ ‫شدن‬‫اشغال‬‫شده‬‫هست‬ ‫همچنان‬‫واسه‬
‫همین‬‫مجبورم‬‫فاکتوری‬‫ریستش‬‫کنم‬
‫شدن‬ ‫خم‬ ‫مشکل‬ ‫فقط‬ ،‫شاهکاره‬ ‫آیفون‬#‫آیف‬‫ون‬
6‫نیست‬ ‫شدن‬ ‫حل‬ ‫قابل‬ ‫نظرم‬ ‫به‬.
0125/43
‫متون‬ ‫پردازش‬ ‫پیش‬
‫گام‬‫اول‬-‫قطعه‬ ‫متن‬‫بندی‬‫می‬‫شود‬(Tokenize)
‫گام‬‫دوم‬-‫کلمات‬ ‫حذف‬‫ایست‬
#‫باتری‬ ‫شاهکاره،مخصوصا‬ ‫آیفون‬‫ش‬
،‫صفحش‬ ‫و‬OTG،‫میکنه‬ ‫ساپورت‬ ‫هم‬
‫آیفون‬ ‫شدن‬ ‫خم‬ ‫مشکل‬ ‫فقط‬6‫به‬
‫نیست‬ ‫شدن‬ ‫حل‬ ‫قابل‬ ‫نظرم‬.
#‫آیفون‬|
،‫شاهکاره‬|‫مخصوصا‬|‫باتریش‬|‫و‬|
‫صفحش‬|OTG|‫هم‬|‫ساپورت‬|‫میکنه‬
|‫فقط‬|‫مشکل‬|‫خم‬|‫شدن‬|‫آیفون‬|6|
‫به‬|‫نظرم‬|‫قابل‬|‫حل‬|‫شدن‬|‫است‬.|
‫صفحش‬ ‫باتریش‬ ‫شاهکاره‬
OTG‫ساپورت‬_‫فقط‬ ‫میکنه‬
‫خم‬ ‫مشکل‬_‫شدن‬
‫ایست‬ ‫کلمات‬ ‫حذف‬‫بندی‬ ‫قطعه‬
0126/43
‫متون‬ ‫پردازش‬ ‫پیش‬
‫گام‬‫سوم‬–‫ریشه‬‫یابی‬
‫امکانات‬
‫سخت‬_‫افزار‬
‫رم‬
‫پردازنده‬
CPU
Snap-dragon
ARM
‫یو‬ ‫پی‬ ‫سی‬
‫جانبی‬
‫حسگر‬
‫رابط‬
0127/43
‫در‬ ‫ویژگی‬ ‫انتخاب‬ ‫و‬ ‫پردازش‬ ‫پیش‬ ‫مراحل‬Rapidminer
01
28/43
‫ویژگی‬ ‫انتخاب‬
•‫فضای‬ ‫مدل‬‫هر‬ ،‫برداری‬‫می‬ ‫نشان‬ ‫را‬ ‫مشخص‬ ‫متن‬ ‫یک‬ ‫در‬ ‫خصوص‬ ‫به‬ ‫کلمه‬ ‫آن‬ ‫تکرار‬ ‫تعداد‬ ،‫بردار‬ ‫این‬ ‫عنصر‬‫دهد‬.
•‫روش‬‫های‬‫وزن‬‫دهی‬‫از‬ ‫استفاده‬ ،‫مشکل‬ ‫این‬ ‫رفع‬ ‫برای‬ ‫کلمات‬ ‫به‬‫وزن‬‫دهی‬IDF‫است‬.
•‫به‬‫وزن‬ ‫باشند‬ ‫آمده‬ ‫بازبینی‬ ‫متون‬ ‫از‬ ‫وسیعی‬ ‫محدوده‬ ‫در‬ ‫که‬ ‫کلماتی‬‫کم‬‫تری‬‫می‬ ‫اعطا‬‫کند‬.
•‫هر‬‫بازه‬ ‫در‬ ‫مقدار‬ ‫یک‬ ‫دارای‬ ‫بردار‬ ‫عناصر‬ ‫از‬ ‫یکی‬[0,1]‫قرار‬‫گیرد‬.
0129/43
‫آموزش‬ ‫و‬ ‫بندی‬ ‫طبقه‬
‫الگوریتم‬ ‫سایر‬ ‫بین‬ ‫در‬‫طبقه‬ ‫های‬‫بندی‬‫نظارت‬ ‫با‬ ‫کننده‬SVM‫تولید‬ ‫ارزیابی‬ ‫تابع‬ ‫به‬ ‫توجه‬ ‫با‬ ‫را‬ ‫نتایج‬ ‫بهترین‬‫نمود‬.
‫شکل‬4-4‫در‬ ‫مدل‬ ‫آموزش‬Rapidminer
01
30/43
‫ارزیابی‬
‫جمالت‬ ‫قطبیت‬ ‫درست‬ ‫بینی‬ ‫پیش‬ ‫ارزیابی‬ ‫های‬ ‫شاخص‬
‫دقت‬
‫فراخوانی‬
‫کل‬ ‫معیار‬
0131/43
‫نتایج‬
Methods Training Time (s) Recall%
‫فراخوانی‬
precision%
‫دقت‬
F-score
‫معیار‬‫کل‬
(SVM) 21 87.42 93.03 90.15
Naïve Bayes 20 57.58 87.81 74.18
Decision Tree 33 80.33 77.18 78.05
k-Nearest Neighbor 27 15.62 86.21 56.43
0132/43
‫نمونه‬
‫کاربر‬ ‫نقد‬ ‫متن‬ ‫شماره‬
‫من‬‫این‬‫گوشی‬‫خریدم‬،‫گوشی‬‫مشکل‬‫داشت‬‫که‬‫با‬‫بخش‬‫گارانتی‬‫شرکت‬‫شون‬‫تماس‬‫گرفتم،گفتند‬‫کاری‬‫نمیشه‬
،‫کرد‬‫واقعا‬‫از‬‫خریدم‬‫پشیمونم‬.
1
‫بهترین‬‫گوشیه‬‫که‬‫من‬،‫خریدم‬‫کیفیت‬‫صفحه‬‫و‬‫باتری‬‫ش‬‫عالیه‬‫و‬‫تو‬‫هیچ‬‫بازی‬‫لگ‬‫نداره‬،‫تا‬‫حاال‬‫ن‬‫دیدم‬‫داغ‬‫کنه‬ 2
0133/43
‫نتایج‬ ‫سازی‬ ‫بصری‬
•‫است‬ ‫گرفته‬ ‫صورت‬ ‫اخیر‬ ‫سالهای‬ ‫در‬ ً‫ا‬‫اکثر‬ ‫انگلیسی‬ ‫از‬ ‫غیر‬ ‫به‬ ‫مختلف‬ ‫زبانهای‬ ‫در‬ ‫شده‬ ‫انجام‬ ‫کارهای‬.
•‫انگلیسی‬ ‫از‬ ‫غیر‬ ‫زبانهای‬ ‫در‬ ‫کارها‬ ‫این‬ ‫تعداد‬(‫فارسی‬ ‫بخصوص‬)‫است‬ ‫ناچیز‬ ‫بسیار‬ ‫انگلیسی‬ ‫زبان‬ ‫به‬ ‫نسبت‬.
•‫داده‬ ‫کالن‬ ‫ابزارهای‬ ‫از‬ ‫استفاده‬ ‫لزوم‬
•‫پید‬ ‫دست‬ ‫بیشتری‬ ‫مطلوبیت‬ ‫به‬ ‫میتوان‬ ‫آن‬ ‫افزایش‬ ‫با‬ ‫اما‬ ‫است‬ ‫قبولی‬ ‫قابل‬ ً‫ا‬‫نسبت‬ ‫حد‬ ‫در‬ ‫کنون‬ ‫تا‬ ‫شده‬ ‫انجام‬ ‫کارهای‬ ‫دقت‬‫کرد‬ ‫ا‬.
•‫میباشد‬ ‫مناسب‬ ‫کارایی‬ ‫به‬ ‫حصول‬ ‫برای‬ ‫فارسی‬ ‫زبان‬ ‫پردازش‬ ‫مناسب‬ ‫ابزارهای‬ ‫ایجاد‬ ‫به‬ ‫نیاز‬.
‫نتیجه‬‫گیری‬‫آینده‬ ‫کارهای‬ ‫و‬
34/43
‫منابع‬‫فارسی‬
35/43
[1]‫ش‬.‫دشتیانی‬،‫ع‬.‫پیله‬،‫ور‬‫آنالیزاحساسی‬‫متون‬‫فارسی‬,‫دراولین‬‫کنفرانس‬‫بین‬‫المللی‬‫پردازش‬‫خط‬‫زبان‬‫فارسی‬‫دانشگاه‬،‫سمنان‬1391.
[2]‫ف‬.‫محمودلو‬,‫مروری‬‫بر‬‫متن‬‫کاوی‬‫و‬‫روش‬‫های‬‫آن‬,‫در‬‫همایش‬‫مشترک‬‫مهندسی‬‫کامپیوتر‬‫و‬،‫مکانیک‬،‫میاندوآب‬‫دانشگاه‬‫جامع‬‫علمی‬‫و‬‫کاربردی‬‫م‬‫رکز‬
‫میاندوآب‬.1392.
[3]‫برهانی‬،‫ع‬.‫نیک‬،‫نفس‬‫نقدکاوی‬‫با‬‫استفاده‬‫از‬‫روش‬‫های‬‫یادگیری‬‫ماشین‬,‫دومین‬‫کنفرانس‬‫ملی‬‫مهندسی‬‫صنایع‬‫و‬‫سیستمها‬.1392.
[4]‫م‬.‫محمدی‬,‫عقیده‬‫کاوی‬‫در‬‫نقد‬‫کاال‬‫با‬‫استفاده‬‫از‬‫شبکه‬‫واژگان‬‫احساسی‬,‫در‬‫دومین‬‫کنفرانس‬‫ملی‬‫مهندسی‬‫صنایع‬‫و‬‫سیستم‬‫ها‬‫دانشگاه‬‫آزاد‬‫اسالمی‬
‫واحد‬‫نجف‬‫آباد‬:‫نجف‬‫آباد‬.1392.
[5]‫م‬.‫محمدی‬,‫ع‬.‫نیک‬،‫نفس‬‫مقایسه‬‫کارایی‬‫طبقه‬‫بندهای‬‫مختلف‬‫متن‬‫برای‬‫عقیده‬‫کاوی‬‫درنقدکاال‬,‫در‬‫دوازدهمین‬‫کنفرانس‬‫ملی‬
‫سیستمهای‬،‫هوشمند‬،‫بم‬‫انجمن‬‫سیستمهای‬‫هوشمند‬،‫ایران‬‫مجتمع‬‫آموزش‬‫عالی‬،‫بم‬1392.
[6]،‫م،اصغری‬‫نظر‬‫کاوی‬‫مبتنی‬‫بر‬‫سطح‬،‫سند‬‫سمینار‬‫کارشناسی‬،‫ارشد‬‫آزمایشگاه‬‫فناوری‬‫وب‬‫دانشگاه‬‫فردوسی‬،‫مشهد‬1392
‫منابع‬‫التین‬
36/43
[7] Yan, T. and S. Baowen. Mechanism of the impact of online social network on enterprise e-business
model. in Artificial Intelligence, Management Science and Electronic Commerce (AIMSEC), 2011
2nd International Conference on. 2011.
[8] Walaa Medhat , A.H ., Hoda Korashy, sentiment analysis algorithms and application: A survey. Ain
Shams Engineering Journal, 2014. 5: p. 1093–1113.
[9] Tundjungsari, V., Business Intelligence with Social Media andData Mining to Support Customer
Satisfaction in Telecommunication Industry. nternational Journal of Computer Science and
Electronics Engineering (IJCSEE) 1 (1).
[10]Taghva, K., R. Beckley, and M. Sadeh. A stemming algorithm for the Farsi language. in Information
Technology: Coding and Computing, 2005. ITCC 2005. International Conference on. 2005.
[11] Stephen.G, M.W., Jure.L, The role of social networks in online shopping: information passing, price
of trust, and consumer choice. EC '11 Proceedings of the 12th ACM conference on Electronic
commerce Pages 157-166 .ACM 2011,2011.
[12]Statista. Facebook number of monthly active users worldwide 2015; Available from:
http://www.statista.com/statistics/264810/number-of-monthly-active-facebook-users-worldwide /.
[13]Shams, M., A. Shakery, and H. Faili. A non-parametric LDA-based induction method for sentiment
analysis. in Artificial Intelligence and Signal Processing (AISP), 2012 16th CSI International
Symposium on. 2012.
‫منابع‬‫التین‬
37/43
[17] Rustamov, S., E. Mustafayev, and M.A. Clements. Sentiment analysis using Neuro-Fuzzy and Hidden Markov
models of text. in Southeastcon, 2013 Proceedings of IEEE. 2013.
[18] Qazi, A., et al. A Framework of Review Analysis for Enhancement of Business Decision Making. in Data Mining
Workshops (ICDMW), 2013 IEEE 13th International Conference on. 2013.
[19] Q .Mei, X.L., M. Wondra, H. Su, and C. Zhai, Topic sentiment mixture, in Proceedings of the 16th international
conference on World Wide Web 2007, WWW. p. 171.
[20] Poshyvanyk, D., et al. Combining Probabilistic Ranking and Latent Semantic Indexing for Feature Identification.
in Program Comprehension, 2006. ICPC 2006. 14th IEEE International Conference on. 2006.
[21] Paul, J., Trends und Megatrends in Business Intelligence. Controlling & Management Review, 2014. 58(1): p. 69-
69.
[22] Nasukawa, T. and J. Yi, Sentiment analysis: capturing favorability using natural language processing, in
Proceedings of the 2nd international conference on Knowledge capture. 2003, ACM: Sanibel Island, FL, USA. p.
70-77.
[23] Mostafa, M.M., More than words: Social networks’ text mining for consumer brand sentiments. Expert Systems
with Applications, 2013. 40(10): p. 4241-4251.
[24] Mohammad Ehsan Basiri* , A.R.n., Nasser Ghassem-Aghaee A Framework for Sentiment Analysis in Persian.
Open Transactions on Information Processing, 2014. 1 (3): p. 1-14.
[25] Mihaela Munteana, L.G.C., Vlad Rînciog, Social Business Intelligence: A New Perspective for Decision
Makers. Procedia - Social and Behavioral Sciences 124 ( 2014 ) 562 – 567, 2013.
[26] M. Dash, H.L., Feature Selection for Classification .Intelligent Data Analysis, 1997: p. 131-156.
[27] Liu, B. and L. Zhang, A Survey of Opinion Mining and Sentiment Analysis, in Mining Text Data, C.C. Aggarwal
and C. Zhai, Editors. 2012, Springer US. p. 415-463.
‫مقاالت‬‫مستخرج‬
‫رساله‬ ‫از‬(1)
38/43
39/43
‫مقاالت‬‫مستخرج‬
‫رساله‬ ‫از‬(2)
‫مقاالت‬‫مستخرج‬
‫رساله‬ ‫از‬(3)
40/43
32/34
‫مقاالت‬‫مستخرج‬
‫رساله‬ ‫از‬(4)
41/43
‫از‬ ‫سپاس‬ ‫با‬
‫نمدی‬ ‫صالح‬ ‫دکتر‬ ‫آقای‬ ‫جناب‬ ‫گروه‬ ‫مدیر‬
‫خادمی‬ ‫مریم‬ ‫دکتر‬ ‫خانم‬ ‫گرانقدر‬ ‫استاد‬ ‫از‬
‫گرامی‬ ‫داوران‬ ‫هیئت‬
‫و‬
‫محترم‬ ‫حضار‬ ‫تمامی‬
42/43
‫سواالت‬
43/43
‫نظرات‬
354 7
14 450
+
-
‫؟‬ ‫شما‬ ‫نظر‬

Mais conteúdo relacionado

Mais procurados (6)

ارزیابی بانکهای اطلاعاتی
ارزیابی بانکهای اطلاعاتیارزیابی بانکهای اطلاعاتی
ارزیابی بانکهای اطلاعاتی
 
Research method
Research methodResearch method
Research method
 
User interface رابط کاربری
User interface رابط کاربریUser interface رابط کاربری
User interface رابط کاربری
 
نیاز اطلاعاتی
نیاز اطلاعاتینیاز اطلاعاتی
نیاز اطلاعاتی
 
داده‌های معنایی
داده‌های معناییداده‌های معنایی
داده‌های معنایی
 
Altmetrics
AltmetricsAltmetrics
Altmetrics
 

Destaque

Role of Text Mining in Search Engine
Role of Text Mining in Search EngineRole of Text Mining in Search Engine
Role of Text Mining in Search EngineJay R Modi
 
Big Data Processing in Cloud Computing Environments
Big Data Processing in Cloud Computing EnvironmentsBig Data Processing in Cloud Computing Environments
Big Data Processing in Cloud Computing EnvironmentsFarzad Nozarian
 
آشنایی با داده‌های بزرگ و تکنیک‌های برنامه‌سازی برای پردازش داده‌های بزرگ
آشنایی با داده‌های بزرگ و تکنیک‌های برنامه‌سازی برای پردازش داده‌های بزرگآشنایی با داده‌های بزرگ و تکنیک‌های برنامه‌سازی برای پردازش داده‌های بزرگ
آشنایی با داده‌های بزرگ و تکنیک‌های برنامه‌سازی برای پردازش داده‌های بزرگAmir Sedighi
 
Big Data and Machine Learning Workshop - Day 7 @ UTACM
Big Data and Machine Learning Workshop - Day 7 @ UTACM Big Data and Machine Learning Workshop - Day 7 @ UTACM
Big Data and Machine Learning Workshop - Day 7 @ UTACM Amir Sedighi
 
تحلیل با رویکرد یادگیری ژرف بر بستر کلان‌داده (2)
تحلیل با رویکرد یادگیری ژرف بر بستر کلان‌داده (2)تحلیل با رویکرد یادگیری ژرف بر بستر کلان‌داده (2)
تحلیل با رویکرد یادگیری ژرف بر بستر کلان‌داده (2)khalooei
 

Destaque (6)

Role of Text Mining in Search Engine
Role of Text Mining in Search EngineRole of Text Mining in Search Engine
Role of Text Mining in Search Engine
 
Big Data Processing in Cloud Computing Environments
Big Data Processing in Cloud Computing EnvironmentsBig Data Processing in Cloud Computing Environments
Big Data Processing in Cloud Computing Environments
 
Dark data
Dark dataDark data
Dark data
 
آشنایی با داده‌های بزرگ و تکنیک‌های برنامه‌سازی برای پردازش داده‌های بزرگ
آشنایی با داده‌های بزرگ و تکنیک‌های برنامه‌سازی برای پردازش داده‌های بزرگآشنایی با داده‌های بزرگ و تکنیک‌های برنامه‌سازی برای پردازش داده‌های بزرگ
آشنایی با داده‌های بزرگ و تکنیک‌های برنامه‌سازی برای پردازش داده‌های بزرگ
 
Big Data and Machine Learning Workshop - Day 7 @ UTACM
Big Data and Machine Learning Workshop - Day 7 @ UTACM Big Data and Machine Learning Workshop - Day 7 @ UTACM
Big Data and Machine Learning Workshop - Day 7 @ UTACM
 
تحلیل با رویکرد یادگیری ژرف بر بستر کلان‌داده (2)
تحلیل با رویکرد یادگیری ژرف بر بستر کلان‌داده (2)تحلیل با رویکرد یادگیری ژرف بر بستر کلان‌داده (2)
تحلیل با رویکرد یادگیری ژرف بر بستر کلان‌داده (2)
 

Semelhante a تحلیل احساسات شبکه اجتماعی متن کاوی نظرکاوی حامد عزیزی تهران جنوب

ده نکته غیر مفید برای سخنرانی
ده نکته غیر مفید برای سخنرانیده نکته غیر مفید برای سخنرانی
ده نکته غیر مفید برای سخنرانیFarhad Shokrpour
 
Ethnography(Unit4 P108 119)Bahman Taherkhani
Ethnography(Unit4 P108 119)Bahman TaherkhaniEthnography(Unit4 P108 119)Bahman Taherkhani
Ethnography(Unit4 P108 119)Bahman Taherkhanibahman
 
"اسلاید خلاصه کتاب "بیاموزیم چگونه گوش بدهیم تا یاد بگیریم
"اسلاید خلاصه کتاب "بیاموزیم چگونه گوش بدهیم تا یاد بگیریم"اسلاید خلاصه کتاب "بیاموزیم چگونه گوش بدهیم تا یاد بگیریم
"اسلاید خلاصه کتاب "بیاموزیم چگونه گوش بدهیم تا یاد بگیریمSchool
 
روش تحقیق ارشد (1)
روش تحقیق  ارشد (1)روش تحقیق  ارشد (1)
روش تحقیق ارشد (1)Davood Navabiasl
 
Take Better Notes_Pashto
Take Better Notes_PashtoTake Better Notes_Pashto
Take Better Notes_PashtoElham Jamalzai
 
آموزش پردازش تصویر با OpenCV - بخش هفتم
آموزش پردازش تصویر با OpenCV - بخش هفتمآموزش پردازش تصویر با OpenCV - بخش هفتم
آموزش پردازش تصویر با OpenCV - بخش هفتمfaradars
 
1 اصول طراحی رابط کاربری در اندروید
1  اصول طراحی رابط کاربری در اندروید1  اصول طراحی رابط کاربری در اندروید
1 اصول طراحی رابط کاربری در اندرویدNavid Einakchi
 
ترویج علم: تفاوت‌های تمدنی، جنسیتی، زبانی از منظر یک پژوهشگر دانش های بنیادی
ترویج علم: تفاوت‌های تمدنی، جنسیتی، زبانی از منظر یک پژوهشگر دانش های بنیادیترویج علم: تفاوت‌های تمدنی، جنسیتی، زبانی از منظر یک پژوهشگر دانش های بنیادی
ترویج علم: تفاوت‌های تمدنی، جنسیتی، زبانی از منظر یک پژوهشگر دانش های بنیادیSaros Science Popularization Team
 
\اسلایدهای_برندينگ_بانيك فایل شماره12: فاز اول- چهارپایه برندینگ- محیط شناسی...
\اسلایدهای_برندينگ_بانيك فایل شماره12: فاز اول- چهارپایه برندینگ- محیط شناسی...\اسلایدهای_برندينگ_بانيك فایل شماره12: فاز اول- چهارپایه برندینگ- محیط شناسی...
\اسلایدهای_برندينگ_بانيك فایل شماره12: فاز اول- چهارپایه برندینگ- محیط شناسی...Hoda Motlagh
 
special services for the physically and physically disabled
special services for the physically and physically disabledspecial services for the physically and physically disabled
special services for the physically and physically disabledmohammadjavadbairami
 

Semelhante a تحلیل احساسات شبکه اجتماعی متن کاوی نظرکاوی حامد عزیزی تهران جنوب (16)

Powerpoint
PowerpointPowerpoint
Powerpoint
 
Design Thinking
Design Thinking Design Thinking
Design Thinking
 
ده نکته غیر مفید برای سخنرانی
ده نکته غیر مفید برای سخنرانیده نکته غیر مفید برای سخنرانی
ده نکته غیر مفید برای سخنرانی
 
خودشناسی
خودشناسیخودشناسی
خودشناسی
 
Ethnography(Unit4 P108 119)Bahman Taherkhani
Ethnography(Unit4 P108 119)Bahman TaherkhaniEthnography(Unit4 P108 119)Bahman Taherkhani
Ethnography(Unit4 P108 119)Bahman Taherkhani
 
"اسلاید خلاصه کتاب "بیاموزیم چگونه گوش بدهیم تا یاد بگیریم
"اسلاید خلاصه کتاب "بیاموزیم چگونه گوش بدهیم تا یاد بگیریم"اسلاید خلاصه کتاب "بیاموزیم چگونه گوش بدهیم تا یاد بگیریم
"اسلاید خلاصه کتاب "بیاموزیم چگونه گوش بدهیم تا یاد بگیریم
 
Creativity خلاقیت
Creativity خلاقیتCreativity خلاقیت
Creativity خلاقیت
 
روش تحقیق ارشد (1)
روش تحقیق  ارشد (1)روش تحقیق  ارشد (1)
روش تحقیق ارشد (1)
 
Medical searching tips93
Medical searching tips93Medical searching tips93
Medical searching tips93
 
Take Better Notes_Pashto
Take Better Notes_PashtoTake Better Notes_Pashto
Take Better Notes_Pashto
 
آموزش پردازش تصویر با OpenCV - بخش هفتم
آموزش پردازش تصویر با OpenCV - بخش هفتمآموزش پردازش تصویر با OpenCV - بخش هفتم
آموزش پردازش تصویر با OpenCV - بخش هفتم
 
1 اصول طراحی رابط کاربری در اندروید
1  اصول طراحی رابط کاربری در اندروید1  اصول طراحی رابط کاربری در اندروید
1 اصول طراحی رابط کاربری در اندروید
 
ترویج علم: تفاوت‌های تمدنی، جنسیتی، زبانی از منظر یک پژوهشگر دانش های بنیادی
ترویج علم: تفاوت‌های تمدنی، جنسیتی، زبانی از منظر یک پژوهشگر دانش های بنیادیترویج علم: تفاوت‌های تمدنی، جنسیتی، زبانی از منظر یک پژوهشگر دانش های بنیادی
ترویج علم: تفاوت‌های تمدنی، جنسیتی، زبانی از منظر یک پژوهشگر دانش های بنیادی
 
\اسلایدهای_برندينگ_بانيك فایل شماره12: فاز اول- چهارپایه برندینگ- محیط شناسی...
\اسلایدهای_برندينگ_بانيك فایل شماره12: فاز اول- چهارپایه برندینگ- محیط شناسی...\اسلایدهای_برندينگ_بانيك فایل شماره12: فاز اول- چهارپایه برندینگ- محیط شناسی...
\اسلایدهای_برندينگ_بانيك فایل شماره12: فاز اول- چهارپایه برندینگ- محیط شناسی...
 
Drugfree4
Drugfree4Drugfree4
Drugfree4
 
special services for the physically and physically disabled
special services for the physically and physically disabledspecial services for the physically and physically disabled
special services for the physically and physically disabled
 

تحلیل احساسات شبکه اجتماعی متن کاوی نظرکاوی حامد عزیزی تهران جنوب

  • 2. ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬ ‫جنوب‬ ‫تهران‬ ‫واحد‬ ‫مهندسی‬ ‫و‬ ‫فنی‬ ‫دانشکده‬-‫ت‬ ‫تحصیالت‬ ‫مرکز‬‫کمیلی‬ ‫استاد‬‫راهنما‬: ‫خادمی‬ ‫مریم‬ ‫دکتر‬ ‫دهنده‬ ‫ارائه‬: ‫عزیزی‬ ‫حامد‬ 17‫شهریور‬1394 ‫افزایش‬ ‫راستای‬ ‫در‬ ‫اجتماعی‬ ‫های‬ ‫شبکه‬ ‫در‬ ‫کاوی‬ ‫متن‬ ‫تجاری‬ ‫هوش‬ ‫دانشجویی‬ ‫شماره‬: 9141240607
  • 3. ‫مطالب‬ ‫فهرست‬ •‫مقدمه‬ •‫کاوی‬ ‫عقیده‬ ‫و‬ ‫کاوی‬ ‫متن‬ •‫فارسی‬ ‫زبان‬ ‫در‬ ‫کاوی‬ ‫عقیده‬ •‫تحقیق‬ ‫پیشینه‬ •‫پیشنهادی‬ ‫های‬ ‫روش‬ •‫گیری‬ ‫نتیجه‬‫آ‬ ‫پیشنهادات‬ ‫و‬‫تی‬ •‫منابع‬ •‫رساله‬ ‫از‬ ‫مستخرج‬ ‫مقاالت‬ 01
  • 5. ‫اطالعات‬ ‫ی‬ ‫خالصه‬ ‫دانش‬‫است‬. 012/43 •‫تر‬ ‫قدرتمند‬ ‫دانش‬ ‫و‬ ‫است‬ ‫قدرت‬ ‫باعث‬ ‫اطالعات‬. •‫کمبود‬ ‫مسأله‬‫است‬ ‫اطالعات‬ ‫کسب‬ ‫دانش‬ ‫نیست،کمبود‬ ‫اطالعات‬ ‫حجم‬. •80‫و‬ ‫مستندات‬ ،‫متن‬ ‫صورت‬ ‫به‬ ‫ما‬ ‫اطالعات‬ ‫از‬ ‫درصد‬.. •‫دارند‬ ‫یافته‬ ‫ساخت‬ ‫غیر‬ ‫ماهیت‬ ‫طبیعی‬ ‫صورت‬ ‫به‬. ‫کنونی‬ ‫عصر‬ ‫در‬ ‫اطالعات‬
  • 6. 01 ‫اطالعات‬ ‫در‬ ‫کاوش‬ •‫شود‬ ‫انجام‬ ‫ها‬ ‫داده‬ ‫روی‬ ‫پردازش‬ ‫باید‬ ‫دانش‬ ‫کسب‬ ‫برای‬. •‫با‬،‫تکنولوژی‬ ‫عصر‬ ‫این‬ ‫در‬ ‫حال‬ ‫این‬‫که‬ ‫است‬ ‫این‬ ‫بر‬ ‫تالش‬‫حتی‬ ‫شود‬ ‫انجام‬ ‫خودکار‬ ‫بتواند‬ ‫باید‬ ‫چیزی‬ ‫هر‬‫کار‬ ‫این‬ ‫اگر‬ "‫متن‬ ‫معنی‬ ‫درک‬"‫باشد‬. 3/43
  • 7. 014/43 •‫رسانه‬ ‫محبوبیت‬ ‫و‬ ‫گسترش‬‫محور‬ ‫کاربر‬ ‫های‬ •‫وسیع‬ ‫دید‬ ‫در‬ ‫و‬ ‫فرد‬ ‫یک‬ ‫دهنده‬ ‫نشان‬ ‫اطالعات‬‫است‬ ‫کشور‬ ‫یک‬ ‫و‬ ‫جامعه‬ ،‫تر‬ •‫تحلیل‬ ‫طریق‬ ‫از‬ ‫آمده‬ ‫دست‬ ‫به‬ ‫دانش‬ ‫باالی‬ ‫ارزش‬‫اطالعات‬ ‫این‬ ‫محور‬ ‫کاربر‬ ‫های‬ ‫رسانه‬
  • 8. 015/43 •‫فعال‬ ‫کاربر‬ ‫میلیارد‬ •‫در‬‫حدود‬ ‫دقیقه‬ ‫یک‬41/000‫به‬ ‫را‬ ‫متنی‬ ‫بار‬ ‫وضعیت‬ ‫عنوان‬‫نویسند‬ ‫می‬. •‫بیش‬‫از‬3‫روی‬ ‫بر‬ ‫را‬ ‫تأئید‬ ‫میلیون‬‫های‬ ‫نوشته‬ ‫ثبت‬ ‫کاربران‬ ‫دیگر‬‫کنند‬ ‫می‬. ‫اجتماعی‬ ‫های‬ ‫شبکه‬ ‫در‬ ‫متن‬ ‫تولید‬ ‫آمار‬ •‫روزانه‬500‫نوشته‬ ‫میلیون‬(‫توییت‬)‫به‬33‫زبان‬ ‫منتشر‬ ‫کاربران‬ ‫توسط‬ ‫دنیا‬ ‫زنده‬‫می‬‫شود‬ •‫حروف‬ ‫تعداد‬ ‫ارسال‬ ‫در‬ ‫محدودیت‬ •‫زدن‬ ‫برچسب‬ ‫امکان‬ ‫منبع‬www.statista.com ‫از‬ ‫بیش‬ ‫ثانیه‬ ‫هر‬ ‫در‬1000‫مورد‬ ‫در‬ ‫نظر‬ ‫می‬ ‫نوشته‬ ‫کاربران‬ ‫توسط‬ ‫تصاویر‬‫شود‬. ‫آپلود‬‫از‬ ‫بیش‬40‫روز‬ ‫در‬ ‫عکس‬ ‫میلیون‬ 8500‫ثانیه‬ ‫هر‬ ‫در‬ ‫الیک‬
  • 10. 017/43 ‫کاوی‬ ‫متن‬ •‫علمی‬‫کاوی‬ ‫متن‬ ‫نام‬ ‫به‬ ‫جدید‬‫به‬‫می‬ ‫وجود‬‫آید‬. •Knowledge Discovery in Text (KDT) •‫کشف‬‫در‬ ‫دانش‬‫متن‬. ‫هدف‬‫نهایی‬‫است‬ ‫این‬‫است‬ ‫درک‬ ‫قابل‬ ‫بشر‬ ‫توسط‬ ‫که‬ ‫دانشی‬ ‫از‬ ‫ذره‬ ‫هر‬ ‫که‬‫وسیله‬ ‫به‬‫کامپی‬ ‫ی‬‫وتر‬‫نیز‬ ‫درک‬‫شود‬.
  • 11. ‫کاوی‬ ‫عقیده‬ 01 •‫خواندن‬‫وقت‬ ‫کاری‬ ‫کاربران‬ ‫نظرات‬ ‫از‬ ‫بخشی‬ ‫حتی‬ ‫یا‬ ‫و‬ ‫تمامی‬ ‫بررسی‬ ‫و‬‫عظیم‬ ‫حجم‬ ‫این‬ ‫در‬ ‫و‬ ‫گیر‬‫داده‬ ‫از‬ ‫غیرممکن‬‫است‬. 8/43 ‫عقیده‬ ‫و‬ ‫احساسات‬ ‫تحلیل‬‫را‬ ‫مردم‬ ‫منفی‬ ‫یا‬ ‫و‬ ‫مثبت‬ ‫احساسات‬ ‫شناخت‬ ‫و‬ ‫کشف‬ ‫معنی‬ ‫به‬ ‫کاوی‬‫یک‬ ‫به‬ ‫جع‬ ‫است‬ ‫محصول‬ ‫یا‬ ‫مسأله‬.
  • 12. ‫کاوی‬ ‫عقیده‬ 01 9/43 ‫یک‬‫نظر‬‫یک‬‫چهارگانه‬(g, s, h, t)‫است‬ g‫هدف‬(‫آنچه‬‫که‬"‫نظر‬"‫در‬‫مورد‬‫آن‬‫بیان‬‫شده‬‫است‬) s‫حس‬‫بیان‬‫شده‬ h‫صاحب‬‫نظر‬ t‫زمان‬‫بیان‬‫نظر‬‫است‬. ‫عینی‬ ‫جمالت‬:‫می‬ ‫بیان‬ ‫را‬ ‫اطالعاتی‬ ‫و‬ ‫حقایق‬‫کند‬. ‫ذهنی‬ ‫جمالت‬:، ‫تمایالت‬ ، ‫احساس‬ ‫حاوی‬ ‫باشد‬ ‫شخصی‬ ‫تجربیات‬ ‫ویا‬ ‫دیدگاهها‬. ‫جمله‬ ‫انواع‬
  • 13. 0110/43 •‫کاوی‬ ‫عقیده‬‫سند‬ ‫سطح‬: o‫اسناد‬ ‫بندی‬ ‫طبقه‬ o‫فیلم‬ ‫نقد‬‫سیاسی‬ ‫نقدهای‬ ، ‫کاوی‬ ‫عقیده‬ ‫سطوح‬ •‫جمله‬ ‫سطح‬ ‫نظرکاوی‬: o‫جمالت‬ ‫بندی‬ ‫طبقه‬ o‫ها‬ ‫توییت‬‫نظرات‬ ،‫کوتاه‬ +++- + •‫ویژگی‬ ‫سطح‬ ‫نظرکاوی‬: o‫خصوصیات‬ ‫به‬ ‫دادن‬ ‫امتیاز‬ ‫مختلف‬
  • 14. ‫کاوی‬ ‫عقیده‬ ‫شاخص‬ ‫کاربردهای‬ 0111/43 •‫سیاست‬(،‫انتخابات‬‫بینی‬ ‫پیش‬‫م‬ ،‫ها‬‫انقالب‬ ‫و‬ ‫تحوالت‬‫یزان‬ ‫درباره‬ ‫مردم‬ ‫نظر‬ ‫و‬ ‫مردم‬ ‫اتحاد‬)... •‫شناسی‬‫روان‬ ‫و‬ ‫اجتماعی‬ ‫علوم‬(‫فره‬ ‫و‬ ‫اجتماعی‬ ‫مسائل‬ ‫تحلیل‬،‫نگی‬ ‫و‬ ‫مردم‬ ‫رفتار‬ ‫در‬ ‫مختلف‬ ‫اتفاقات‬ ‫تاثیر‬)... •‫مدیریت‬(‫طر‬ ‫و‬ ‫رضایت‬ ‫میزان‬ ‫از‬ ‫آگاهی‬ ،‫گیری‬‫تصمیم‬ ‫در‬ ‫کمک‬‫ز‬ ‫و‬ ‫سازمانی‬ ‫فرا‬ ‫یا‬ ‫درون‬ ‫نرم‬ ‫اطالعات‬ ‫آوری‬ ‫جمع‬ ،‫افراد‬ ‫تفکر‬)...
  • 15. ‫کاوی‬ ‫عقیده‬ ‫شاخص‬ ‫کاربردهای‬ 0112/43 ‫دیدگاه‬ ‫از‬‫مشتریان‬ ‫دیدگاه‬ ‫از‬‫تولیدکنندگ‬‫ان‬ ‫دیدگاه‬ ‫از‬‫فروشندگان‬
  • 16. ‫کاوی‬ ‫عقیده‬ ‫فارسی‬ ‫زبان‬ ‫در‬ 0113/43 ‫مثبت‬ ‫مثبت‬ ‫منفی‬ ‫مثبت‬ ‫منفی‬ ‫منفی‬
  • 17. ‫فارسی‬ ‫زبان‬ ‫های‬ ‫ویژگی‬ 0114/43 •‫فارسی‬ ‫زبان‬ ‫خاص‬ ‫های‬ ‫ویژگی‬ •‫برخی‬‫پیچیدگی‬ ‫این‬ ‫از‬‫و‬ ‫زبان‬ ‫طبیعت‬ ‫به‬ ‫ها‬‫ایجاد‬ ‫در‬ ‫دیگر‬ ‫برخی‬‫سیستم‬‫مصنوعی‬ ‫هوش‬ ‫های‬ •‫می‬ ‫را‬ ‫متون‬ ‫در‬ ‫های‬ ‫چالش‬‫ریخت‬ ‫و‬ ،‫نحوی‬ ،‫معنایی‬ ‫سطح‬ ‫سه‬ ‫به‬ ‫توان‬‫کرد‬ ‫تقسیم‬ ‫شناختی‬. •‫درس‬ ‫نتایج‬ ً‫ا‬‫مطمن‬ ،‫نپذیرد‬ ‫صورت‬ ‫درستی‬ ‫به‬ ‫پردازش‬ ‫پیش‬ ‫مراحل‬ ‫فارسی‬ ‫زبان‬ ‫های‬ ‫ویژگی‬ ‫به‬ ‫توجه‬ ‫با‬ ‫اگر‬‫حاصل‬ ‫تی‬ ‫شد‬ ‫نخواهد‬.
  • 18. ‫فارسی‬ ‫زبان‬ ‫های‬ ‫ویژگی‬ 0115/43 •‫د‬ ‫این‬ ‫ترکیب‬ ‫یا‬ ‫و‬ ‫عامیانه‬ ‫یا‬ ‫و‬ ‫رسمی‬ ‫شکل‬ ‫به‬ ‫نوشتن‬‫حالت‬ ‫و‬ •‫انگاره‬ ‫هم‬ ‫ابهام‬ •‫چسبیدن‬«‫پسوندها‬» •‫نیم‬ ‫و‬ ‫فاصله‬‫است‬ ‫فارسی‬ ‫زبان‬ ‫در‬ ‫زیادی‬ ‫ابهام‬ ‫عامل‬ ،‫فاصله‬. •‫بخشی‬ ‫چند‬ ‫کلمات‬ ‫بین‬ ‫جداکننده‬ ‫عنوان‬ ‫به‬‫به‬‫کار‬‫گرف‬‫یا‬ ‫شود‬ ‫ته‬ ‫مثال‬ ‫برای‬ ،‫نشود‬"‫برداری‬ ‫فیلم‬" ‫م‬ ‫پشیمون‬ ‫نخرید‬ ، ‫نیست‬ ‫خوب‬ ‫اصال‬ ‫باطریشم‬‫یشید‬. ‫صفحه‬ ‫اشکال‬ ،‫کردم‬ ‫بررسی‬ ‫را‬ ‫مختلف‬ ‫اشکال‬ ‫است‬ ‫پابرجا‬ ‫نمایش‬. ‫صف‬ ‫برداری‬ ‫فیلم‬ ‫هنگام‬ ‫سامسونگ‬ ‫های‬ ‫گوشی‬‫حه‬ ‫شود‬ ‫نمی‬ ‫سیاه‬ ‫نمایششان‬. ‫بحث‬‫فاصله‬‫ها‬‫م‬ ‫توسط‬ ‫فارسی‬ ‫کلمات‬ ‫صحیح‬ ‫تشخیص‬ ‫در‬ ‫تأثیرگذار‬ ‫عاملی‬‫است‬ ‫اشین‬.
  • 19. ‫فارسی‬ ‫زبان‬ ‫های‬ ‫ویژگی‬ 0116/43 •‫فارسی‬ ‫جمالت‬ ‫بین‬ ‫در‬ ‫انگلیسی‬ ‫کلمات‬ ‫ترکیب‬ •‫در‬‫کلمه‬ ‫مثال‬ ‫بری‬ ‫دارد‬ ‫وجود‬ ‫نوشتن‬ ‫نوع‬ ‫چندین‬ ‫کلماتی‬ ‫برای‬ ‫فارسی‬ ‫زبان‬"‫باتری‬ ،‫باطری‬" •‫و‬ ‫عامیانه‬ ‫جمالت‬ ، ‫المثلها‬ ‫ضرب‬ ،‫ها‬ ‫کنایه‬... •‫قراین‬ ‫به‬ ‫وابسته‬ ‫اطالعات‬ •‫فارسی‬ ‫زبان‬ ‫پردازش‬ ‫ابزارهای‬ ‫کمبود‬ ‫گوشی‬ ‫این‬OTG‫نمی‬ ‫ساپورت‬‫کند‬
  • 21. 0118/43 ‫پایگاه‬ ‫از‬ ‫شده‬ ‫یافت‬ ‫مقاالت‬ ‫تعداد‬Google Scholar‫واژه‬ ‫کلید‬ ‫اساس‬ ‫بر‬Opinion mining‫و‬Sentiment analysis ‫مشهد‬ ‫فردوسی‬ ‫دانشگاه‬ ‫دانشجویان‬ ‫اسالید‬ ‫از‬ ‫مستخرج‬ ‫جدول‬ ‫مقاله‬ ‫زبان‬ 2013 2012 2011 2010 2009 2008 2007 2006 2005 2004 2003 ‫مجموع‬ ‫چینی‬192391056121__76 ‫عربی‬965________20 ‫اسپانیایی‬67_11______15 ‫آلمانی‬13_2_1_____7 ‫ایتالیایی‬13_2_1_____7 ‫فارسی‬2__________2 ‫زبان‬ ‫از‬ ‫مستقل‬542467303228163874936101121900
  • 22. 01 19/43 ‫درسال‬2013‫شمس‬ ،‫آبادی‬ ‫نجف‬‫روشی‬ ‫ارائه‬ ‫به‬ ،‫ناظر‬ ‫بدون‬‫جهت‬‫است‬ ‫کرده‬ ‫ارائه‬ ‫فارسی‬ ‫مستندات‬ ‫قطبیت‬ ‫تعیین‬. ‫روش‬ ‫در‬‫ارائه‬‫شده‬‫مبنای‬ ‫بر‬ ‫کلمه‬ ‫هر‬ ،‫نظر‬ ‫حاوی‬ ‫کلمات‬ ‫استخراج‬ ‫از‬ ‫بعد‬ ،‫موضوعی‬‫که‬‫از‬ ‫استفاده‬ ‫با‬ ‫دارد‬ ‫قرار‬ ‫آن‬ ‫در‬ ‫الگوریتم‬ ‫دو‬PLSASA‫و‬LDASA‫وزن‬‫می‬‫گیرد‬. ‫تحقیق‬ ‫پیشینه‬
  • 24. 0121/43 ‫استفاده‬ ‫مورد‬ ‫افزار‬ ‫نرم‬ •‫تمامی‬‫مراحل‬‫با‬‫استفاده‬‫از‬‫نرم‬‫افزار‬Rapidminer‫پیاده‬‫سازی‬‫شده‬‫است‬ •ً‫ا‬‫اخیر‬‫این‬‫نرم‬‫افزار‬‫با‬‫معرفی‬‫افزونه‬Radoop‫توانسته‬‫خود‬‫را‬‫به‬‫عنوان‬‫نرم‬‫افزار‬‫تحلیل‬‫داده‬‫های‬‫عظیم‬‫نیز‬ ‫معرفی‬‫کند‬. •‫رایگان‬‫بودن‬‫نسخه‬‫های‬‫غیر‬‫تجاری‬‫و‬‫استفاده‬‫راحت‬
  • 25. 0122/43 ‫پیشنهادی‬ ‫کلی‬ ‫مدل‬ User Review Data set Data Pre-processing Feature Selection Classifier Evaluation
  • 26. 01 23/43 ‫همانند‬ ‫معروف‬ ‫اجتماعی‬ ‫های‬ ‫شبکه‬ ‫از‬twitter , Facebook,Linkedin ‫ایران‬ ‫موبایل‬ ‫مرجع‬ ‫و‬ ‫کاال‬ ‫دیجی‬ ‫همانند‬ ‫ایران‬ ‫در‬ ‫اینترنتی‬ ‫فروش‬ ‫معروف‬ ‫های‬ ‫سایت‬ ‫همچنین‬ ‫و‬ ‫شده‬ ‫آوری‬ ‫جمع‬ ‫های‬ ‫داده‬ ‫از‬ ‫بیش‬ ‫آوری‬ ‫جمع‬1000‫موبایل‬ ‫ها‬ ‫گوشی‬ ‫به‬ ‫راجع‬ ‫نظر‬ ‫متن‬ ‫قطعه‬
  • 27. 0124/43 ‫کاربران‬ ‫نقدهای‬ ‫های‬ ‫داده‬ ‫دسته‬ ‫سالم‬‫دوستان‬‫عزیزاین‬‫رو‬ ‫گوشی‬‫گرفتم‬ ‫چنروزه‬.‫بگم‬ ‫میتونم‬ ‫فقط‬‫بخرین‬ ‫حتما‬‫ش‬‫اصال‬ ‫نکنید‬ ‫شک‬. !!‫بدون‬‫شک‬‫از‬ ‫یکی‬‫ترین‬ ‫زیبا‬‫بدنش‬ ‫گوشیهاست‬‫سخت‬ ‫عالیه‬‫اف‬‫زار‬ ‫قدرتمندیم‬‫داره‬‫نمایشش‬ ‫صفحه‬‫اس‬ ‫حد‬ ‫در‬ ‫ک‬‫دوربینش‬ ‫فایوه‬‫خیلی‬‫مخصو‬ ‫خوبه‬‫صا‬ ‫سلفیش‬‫وقتی‬ ‫فقط‬‫میکنی‬ ‫زوم‬ ‫ک‬‫خیلی‬ ‫کیفتش‬‫نیست‬ ‫خوب‬‫بگم‬ ‫خالصه‬‫از‬ ‫ک‬ ‫کارکردن‬‫لذت‬ ‫باهاش‬‫در‬ ‫و‬ ‫میبرم‬‫هیچ‬ ‫مقابل‬‫نمیاره‬ ‫کم‬ ‫گوشی‬ #‫آیفو‬ ‫شدن‬ ‫خم‬ ‫مشکل‬ ‫فقط‬ ،‫شاهکاره‬ ‫آیفون‬‫ن‬6 ‫نیست‬ ‫شدن‬ ‫حل‬ ‫قابل‬ ‫نظرم‬ ‫به‬. ‫اول‬‫گوشی‬ ‫اینکه‬‫من‬‫به‬‫میکنه‬ ‫داغ‬ ‫شدت‬‫مخصوصا‬‫صفحه‬‫نمایشش‬‫طوری‬‫که‬‫دستم‬ ‫میسوزه‬!!!‫؟‬ ‫اینکه‬ ‫دوم‬‫باتریش‬‫خیلی‬‫تموم‬ ‫زود‬‫میشه‬.‫من‬‫شارژ‬100‫وای‬ ‫با‬‫فای‬‫روشن‬‫هیچ‬ ‫بدون‬ ‫استفاده‬‫ای‬‫میز‬ ‫رو‬ ‫گذاشتم‬3‫ساعت‬‫بعد‬‫شارژش‬80‫بود‬‫االن‬‫سری‬ ‫یه‬ ‫هم‬‫بازی‬‫اچ‬‫رو‬ ‫دی‬ ‫گوشیم‬‫ریخته‬‫بودم‬‫دیتاهاش‬ ‫که‬‫یهو‬‫غیب‬‫حجم‬ ‫اما‬ ‫شدن‬‫اشغال‬‫شده‬‫هست‬ ‫همچنان‬‫واسه‬ ‫همین‬‫مجبورم‬‫فاکتوری‬‫ریستش‬‫کنم‬ ‫شدن‬ ‫خم‬ ‫مشکل‬ ‫فقط‬ ،‫شاهکاره‬ ‫آیفون‬#‫آیف‬‫ون‬ 6‫نیست‬ ‫شدن‬ ‫حل‬ ‫قابل‬ ‫نظرم‬ ‫به‬.
  • 28. 0125/43 ‫متون‬ ‫پردازش‬ ‫پیش‬ ‫گام‬‫اول‬-‫قطعه‬ ‫متن‬‫بندی‬‫می‬‫شود‬(Tokenize) ‫گام‬‫دوم‬-‫کلمات‬ ‫حذف‬‫ایست‬ #‫باتری‬ ‫شاهکاره،مخصوصا‬ ‫آیفون‬‫ش‬ ،‫صفحش‬ ‫و‬OTG،‫میکنه‬ ‫ساپورت‬ ‫هم‬ ‫آیفون‬ ‫شدن‬ ‫خم‬ ‫مشکل‬ ‫فقط‬6‫به‬ ‫نیست‬ ‫شدن‬ ‫حل‬ ‫قابل‬ ‫نظرم‬. #‫آیفون‬| ،‫شاهکاره‬|‫مخصوصا‬|‫باتریش‬|‫و‬| ‫صفحش‬|OTG|‫هم‬|‫ساپورت‬|‫میکنه‬ |‫فقط‬|‫مشکل‬|‫خم‬|‫شدن‬|‫آیفون‬|6| ‫به‬|‫نظرم‬|‫قابل‬|‫حل‬|‫شدن‬|‫است‬.| ‫صفحش‬ ‫باتریش‬ ‫شاهکاره‬ OTG‫ساپورت‬_‫فقط‬ ‫میکنه‬ ‫خم‬ ‫مشکل‬_‫شدن‬ ‫ایست‬ ‫کلمات‬ ‫حذف‬‫بندی‬ ‫قطعه‬
  • 30. 0127/43 ‫در‬ ‫ویژگی‬ ‫انتخاب‬ ‫و‬ ‫پردازش‬ ‫پیش‬ ‫مراحل‬Rapidminer
  • 31. 01 28/43 ‫ویژگی‬ ‫انتخاب‬ •‫فضای‬ ‫مدل‬‫هر‬ ،‫برداری‬‫می‬ ‫نشان‬ ‫را‬ ‫مشخص‬ ‫متن‬ ‫یک‬ ‫در‬ ‫خصوص‬ ‫به‬ ‫کلمه‬ ‫آن‬ ‫تکرار‬ ‫تعداد‬ ،‫بردار‬ ‫این‬ ‫عنصر‬‫دهد‬. •‫روش‬‫های‬‫وزن‬‫دهی‬‫از‬ ‫استفاده‬ ،‫مشکل‬ ‫این‬ ‫رفع‬ ‫برای‬ ‫کلمات‬ ‫به‬‫وزن‬‫دهی‬IDF‫است‬. •‫به‬‫وزن‬ ‫باشند‬ ‫آمده‬ ‫بازبینی‬ ‫متون‬ ‫از‬ ‫وسیعی‬ ‫محدوده‬ ‫در‬ ‫که‬ ‫کلماتی‬‫کم‬‫تری‬‫می‬ ‫اعطا‬‫کند‬. •‫هر‬‫بازه‬ ‫در‬ ‫مقدار‬ ‫یک‬ ‫دارای‬ ‫بردار‬ ‫عناصر‬ ‫از‬ ‫یکی‬[0,1]‫قرار‬‫گیرد‬.
  • 32. 0129/43 ‫آموزش‬ ‫و‬ ‫بندی‬ ‫طبقه‬ ‫الگوریتم‬ ‫سایر‬ ‫بین‬ ‫در‬‫طبقه‬ ‫های‬‫بندی‬‫نظارت‬ ‫با‬ ‫کننده‬SVM‫تولید‬ ‫ارزیابی‬ ‫تابع‬ ‫به‬ ‫توجه‬ ‫با‬ ‫را‬ ‫نتایج‬ ‫بهترین‬‫نمود‬. ‫شکل‬4-4‫در‬ ‫مدل‬ ‫آموزش‬Rapidminer
  • 33. 01 30/43 ‫ارزیابی‬ ‫جمالت‬ ‫قطبیت‬ ‫درست‬ ‫بینی‬ ‫پیش‬ ‫ارزیابی‬ ‫های‬ ‫شاخص‬ ‫دقت‬ ‫فراخوانی‬ ‫کل‬ ‫معیار‬
  • 34. 0131/43 ‫نتایج‬ Methods Training Time (s) Recall% ‫فراخوانی‬ precision% ‫دقت‬ F-score ‫معیار‬‫کل‬ (SVM) 21 87.42 93.03 90.15 Naïve Bayes 20 57.58 87.81 74.18 Decision Tree 33 80.33 77.18 78.05 k-Nearest Neighbor 27 15.62 86.21 56.43
  • 35. 0132/43 ‫نمونه‬ ‫کاربر‬ ‫نقد‬ ‫متن‬ ‫شماره‬ ‫من‬‫این‬‫گوشی‬‫خریدم‬،‫گوشی‬‫مشکل‬‫داشت‬‫که‬‫با‬‫بخش‬‫گارانتی‬‫شرکت‬‫شون‬‫تماس‬‫گرفتم،گفتند‬‫کاری‬‫نمیشه‬ ،‫کرد‬‫واقعا‬‫از‬‫خریدم‬‫پشیمونم‬. 1 ‫بهترین‬‫گوشیه‬‫که‬‫من‬،‫خریدم‬‫کیفیت‬‫صفحه‬‫و‬‫باتری‬‫ش‬‫عالیه‬‫و‬‫تو‬‫هیچ‬‫بازی‬‫لگ‬‫نداره‬،‫تا‬‫حاال‬‫ن‬‫دیدم‬‫داغ‬‫کنه‬ 2
  • 37. •‫است‬ ‫گرفته‬ ‫صورت‬ ‫اخیر‬ ‫سالهای‬ ‫در‬ ً‫ا‬‫اکثر‬ ‫انگلیسی‬ ‫از‬ ‫غیر‬ ‫به‬ ‫مختلف‬ ‫زبانهای‬ ‫در‬ ‫شده‬ ‫انجام‬ ‫کارهای‬. •‫انگلیسی‬ ‫از‬ ‫غیر‬ ‫زبانهای‬ ‫در‬ ‫کارها‬ ‫این‬ ‫تعداد‬(‫فارسی‬ ‫بخصوص‬)‫است‬ ‫ناچیز‬ ‫بسیار‬ ‫انگلیسی‬ ‫زبان‬ ‫به‬ ‫نسبت‬. •‫داده‬ ‫کالن‬ ‫ابزارهای‬ ‫از‬ ‫استفاده‬ ‫لزوم‬ •‫پید‬ ‫دست‬ ‫بیشتری‬ ‫مطلوبیت‬ ‫به‬ ‫میتوان‬ ‫آن‬ ‫افزایش‬ ‫با‬ ‫اما‬ ‫است‬ ‫قبولی‬ ‫قابل‬ ً‫ا‬‫نسبت‬ ‫حد‬ ‫در‬ ‫کنون‬ ‫تا‬ ‫شده‬ ‫انجام‬ ‫کارهای‬ ‫دقت‬‫کرد‬ ‫ا‬. •‫میباشد‬ ‫مناسب‬ ‫کارایی‬ ‫به‬ ‫حصول‬ ‫برای‬ ‫فارسی‬ ‫زبان‬ ‫پردازش‬ ‫مناسب‬ ‫ابزارهای‬ ‫ایجاد‬ ‫به‬ ‫نیاز‬. ‫نتیجه‬‫گیری‬‫آینده‬ ‫کارهای‬ ‫و‬ 34/43
  • 38. ‫منابع‬‫فارسی‬ 35/43 [1]‫ش‬.‫دشتیانی‬،‫ع‬.‫پیله‬،‫ور‬‫آنالیزاحساسی‬‫متون‬‫فارسی‬,‫دراولین‬‫کنفرانس‬‫بین‬‫المللی‬‫پردازش‬‫خط‬‫زبان‬‫فارسی‬‫دانشگاه‬،‫سمنان‬1391. [2]‫ف‬.‫محمودلو‬,‫مروری‬‫بر‬‫متن‬‫کاوی‬‫و‬‫روش‬‫های‬‫آن‬,‫در‬‫همایش‬‫مشترک‬‫مهندسی‬‫کامپیوتر‬‫و‬،‫مکانیک‬،‫میاندوآب‬‫دانشگاه‬‫جامع‬‫علمی‬‫و‬‫کاربردی‬‫م‬‫رکز‬ ‫میاندوآب‬.1392. [3]‫برهانی‬،‫ع‬.‫نیک‬،‫نفس‬‫نقدکاوی‬‫با‬‫استفاده‬‫از‬‫روش‬‫های‬‫یادگیری‬‫ماشین‬,‫دومین‬‫کنفرانس‬‫ملی‬‫مهندسی‬‫صنایع‬‫و‬‫سیستمها‬.1392. [4]‫م‬.‫محمدی‬,‫عقیده‬‫کاوی‬‫در‬‫نقد‬‫کاال‬‫با‬‫استفاده‬‫از‬‫شبکه‬‫واژگان‬‫احساسی‬,‫در‬‫دومین‬‫کنفرانس‬‫ملی‬‫مهندسی‬‫صنایع‬‫و‬‫سیستم‬‫ها‬‫دانشگاه‬‫آزاد‬‫اسالمی‬ ‫واحد‬‫نجف‬‫آباد‬:‫نجف‬‫آباد‬.1392. [5]‫م‬.‫محمدی‬,‫ع‬.‫نیک‬،‫نفس‬‫مقایسه‬‫کارایی‬‫طبقه‬‫بندهای‬‫مختلف‬‫متن‬‫برای‬‫عقیده‬‫کاوی‬‫درنقدکاال‬,‫در‬‫دوازدهمین‬‫کنفرانس‬‫ملی‬ ‫سیستمهای‬،‫هوشمند‬،‫بم‬‫انجمن‬‫سیستمهای‬‫هوشمند‬،‫ایران‬‫مجتمع‬‫آموزش‬‫عالی‬،‫بم‬1392. [6]،‫م،اصغری‬‫نظر‬‫کاوی‬‫مبتنی‬‫بر‬‫سطح‬،‫سند‬‫سمینار‬‫کارشناسی‬،‫ارشد‬‫آزمایشگاه‬‫فناوری‬‫وب‬‫دانشگاه‬‫فردوسی‬،‫مشهد‬1392
  • 39. ‫منابع‬‫التین‬ 36/43 [7] Yan, T. and S. Baowen. Mechanism of the impact of online social network on enterprise e-business model. in Artificial Intelligence, Management Science and Electronic Commerce (AIMSEC), 2011 2nd International Conference on. 2011. [8] Walaa Medhat , A.H ., Hoda Korashy, sentiment analysis algorithms and application: A survey. Ain Shams Engineering Journal, 2014. 5: p. 1093–1113. [9] Tundjungsari, V., Business Intelligence with Social Media andData Mining to Support Customer Satisfaction in Telecommunication Industry. nternational Journal of Computer Science and Electronics Engineering (IJCSEE) 1 (1). [10]Taghva, K., R. Beckley, and M. Sadeh. A stemming algorithm for the Farsi language. in Information Technology: Coding and Computing, 2005. ITCC 2005. International Conference on. 2005. [11] Stephen.G, M.W., Jure.L, The role of social networks in online shopping: information passing, price of trust, and consumer choice. EC '11 Proceedings of the 12th ACM conference on Electronic commerce Pages 157-166 .ACM 2011,2011. [12]Statista. Facebook number of monthly active users worldwide 2015; Available from: http://www.statista.com/statistics/264810/number-of-monthly-active-facebook-users-worldwide /. [13]Shams, M., A. Shakery, and H. Faili. A non-parametric LDA-based induction method for sentiment analysis. in Artificial Intelligence and Signal Processing (AISP), 2012 16th CSI International Symposium on. 2012.
  • 40. ‫منابع‬‫التین‬ 37/43 [17] Rustamov, S., E. Mustafayev, and M.A. Clements. Sentiment analysis using Neuro-Fuzzy and Hidden Markov models of text. in Southeastcon, 2013 Proceedings of IEEE. 2013. [18] Qazi, A., et al. A Framework of Review Analysis for Enhancement of Business Decision Making. in Data Mining Workshops (ICDMW), 2013 IEEE 13th International Conference on. 2013. [19] Q .Mei, X.L., M. Wondra, H. Su, and C. Zhai, Topic sentiment mixture, in Proceedings of the 16th international conference on World Wide Web 2007, WWW. p. 171. [20] Poshyvanyk, D., et al. Combining Probabilistic Ranking and Latent Semantic Indexing for Feature Identification. in Program Comprehension, 2006. ICPC 2006. 14th IEEE International Conference on. 2006. [21] Paul, J., Trends und Megatrends in Business Intelligence. Controlling & Management Review, 2014. 58(1): p. 69- 69. [22] Nasukawa, T. and J. Yi, Sentiment analysis: capturing favorability using natural language processing, in Proceedings of the 2nd international conference on Knowledge capture. 2003, ACM: Sanibel Island, FL, USA. p. 70-77. [23] Mostafa, M.M., More than words: Social networks’ text mining for consumer brand sentiments. Expert Systems with Applications, 2013. 40(10): p. 4241-4251. [24] Mohammad Ehsan Basiri* , A.R.n., Nasser Ghassem-Aghaee A Framework for Sentiment Analysis in Persian. Open Transactions on Information Processing, 2014. 1 (3): p. 1-14. [25] Mihaela Munteana, L.G.C., Vlad Rînciog, Social Business Intelligence: A New Perspective for Decision Makers. Procedia - Social and Behavioral Sciences 124 ( 2014 ) 562 – 567, 2013. [26] M. Dash, H.L., Feature Selection for Classification .Intelligent Data Analysis, 1997: p. 131-156. [27] Liu, B. and L. Zhang, A Survey of Opinion Mining and Sentiment Analysis, in Mining Text Data, C.C. Aggarwal and C. Zhai, Editors. 2012, Springer US. p. 415-463.
  • 45. ‫از‬ ‫سپاس‬ ‫با‬ ‫نمدی‬ ‫صالح‬ ‫دکتر‬ ‫آقای‬ ‫جناب‬ ‫گروه‬ ‫مدیر‬ ‫خادمی‬ ‫مریم‬ ‫دکتر‬ ‫خانم‬ ‫گرانقدر‬ ‫استاد‬ ‫از‬ ‫گرامی‬ ‫داوران‬ ‫هیئت‬ ‫و‬ ‫محترم‬ ‫حضار‬ ‫تمامی‬ 42/43