متن کاوی در سالهای اخیر به دلیل حجم زیادی از دادههای متنی که در شبکههای اجتماعی مختلف، وبسایتها و سایر برنامههای کاربردی اطلاعات محور ایجادشده، بیشتر مورد توجه قرار گرفته است. دادههای غیرساختیافته سادهترین شکل دادههایی هستند که میتوانند در هر سناریوی ممکن، ایجاد شوند. در نتیجه، یک نیاز مبرم به طراحی روشها و الگوریتمهایی احساس میشود که بتوانند طیف گستردهای از برنامههای کاریردی مبتنی بر متن را پردازش کنند.
کتاب« متن کاوی: طبقهبندی، خوشهبندی و کاربردها »، مروری بر روشها و الگوریتمهای مختلف و متداول در حوزه متن کاوی با تمرکز ویژه بر روشهای طبقهبندی، خوشهبندی و کاربردهای آن خواهد داشت.
در این کتا به بیان مقدمهای بر متن کاوی، مفاهیم استخراج اطلاعات از متن و کارهایی که در جامعه پردازش زبان طبیعی انجام شده، خلاصهسازی خودکار متن، خوشهبندی و طبقهبندی متن ، خوشهبندی و بررسی جامع از مساله خوشهبندی پرداخته شده است.
1-2الگوریتمها و کاربردهای متن کاوی.. 20
2-2-1 رویکرد مبتنی بر قاعده 33
2-2-2 رویکردیادگیری آماری.. 34
2-3-1 طبقهبندی مبتنی بر ویژگی.. 40
2-3-3روشهاییادگیریبا نظارت ضعیف... 47
2-4استخراج اطلاعات بدون نظارت.. 48
2-4-1 کشف رابطه و القاء الگو. 49
2-4-2 استخراج اطلاعات آزاد. 50
3-2 رویکردهای بازنمایی موضوع. 57
3-2-2 رویکردهای مبتنی بر فراوانی.. 59
3-2-4 مدلهای موضوع بیزین.. 65
3-2-5 خوشهبندی جملات و موضوعات وابسته به دامنه. 66
3-3-2 خلاصهسازی مقالات علمی.. 70
3-3-3 خلاصهسازی متمرکز بر پرسوجو. 70
3-4 بازنمایی شاخص و یادگیری ماشین.. 72
3-4-1 روشهای مبتنی بر گراف برای اهمیت جمله. 72
3-4-2یادگیری ماشین برای خلاصهسازی.. 74
3-5-1 رویکردهای حریصانه: ارتباط حاشیهای بیشینه. 76
4-2 انتخاب ویژگی برای خوشهبندی متن.. 85
4-2-1 روشهای انتخاب ویژگی.. 85
4-2-2 روشهای انتقال ویژگی مبتنی بر LSI 88
4-2-3 فاکتورگیری ماتریس نامنفی.. 90
4-3 خوشهبندی مبتنی بر فاصله. 93
4-3-1 خوشهبندی تجمعی و سلسلهمراتبی.. 94
4-3-2 تقسیمبندی مبتنی بر فاصله. 96
4-3-3 رویکرد ترکیبی: روش Scatter-Gather 98
4-4خوشهبندی مبتنی بر کلمه و عبارت.. 103
4-4-1خوشهبندی با الگوهای پرتکرار کلمه. 103
4-4-2خوشهبندی اسناد با خوشهبندی کلمات.. 106
4-4-3 خوشهبندی مشترک کلمات و اسناد. 107
4-4-4 خوشهبندی با عبارات پرتکرار 110
4-5خوشهبندی احتمالی اسناد و مدلهای موضوع. 111
4-6خوشهبندی برخط جریانهای متنی.. 114
4-7 خوشهبندی متن در شبکهها 120
4-8 خوشهبندی نیمه نظارتی.. 123
5-2انتخاب ویژگی برای طبقهبندی متن.. 132
5-2-5 روشهایانتقال ویژگی مبتنی برLSI 136
5-2-6 خوشهبنديبا نظارت برای کاهش ابعاد. 138
5-2-8تجزیه مقادیر منفرد تعمیمیافته. 140
5-2-9 تعامل انتخاب ویژگی با طبقهبندی.. 141
5-4طبقهبندی مبتنی بر قاعده 144
5-5 طبقهبندی احتمالی و بیز ساده 147
5-5-1 مدل چندمتغیره برنولی.. 148
5-5-3 مدلهای ترکیبی برای طبقهبندی متن.. 156
5-6-2 طبقهبندی مبتنی بر رگرسیون.. 161
5-6-3 طبقهبندی شبکه عصبی.. 163
5-6-4 مشاهداتی درباره طبقهبندی خطی.. 166
5-7 طبقهبندی مبتنی بر مجاورت.. 167
5-8 طبقهبندی متن وب و دادههای پیوندی.. 170
5-9 فرا الگوریتمهای طبقهبندی متن.. 176
5-9-1 طبقهبندی گروهی: یادگیری جمعی.. 176
5-9-2 طبقهبندی دادهمحور: بوستینگ و بگینگ... 177
5-9-3 طبقهبندی دقتمحور: بهینهسازی سنجش.... 179
6- متن کاوی در دادههای جریانی... 182
6-2 خوشهبندی جریانهای متنی.. 184
6-2-1 شناسایی و ردیابی موضوع در جریانهای متنی.. 192
6-3 طبقهبندی جریانهای متنی.. 197
6-4 تحلیل تکامل در جریانهای متنی.. 200
7- متن کاوی در دادههای فرازبانی... 203
7-2-1 مدلهای مولد ترجمه و SMT. 205
7-2-2 مدلهای مبتنی بر کلمه. 208
7-2-3 مدلهای مبتنی بر عبارت.. 210
7-2-4مدلهای مبتنی بر نحو. 214
7-4 مدلهای ترجمه در CLIR.. 224
7-5 جمعآوری و بهرهبرداری از متون تطبیقی.. 226
7-6 انتخاب کلمات ترجمه، عبارات و جملات موازی.. 230
7-7 کاوش روابط فرازبانی از متون تکزبانی.. 232
8- متن کاوی در دادههای چندرسانهای... 239
8-4 کاوش محتوای مشترک متنی و بصری.. 250
8-5 کاوش محتوای متقابل متنی و بصری.. 254
9- متن کاوی در رسانههای اجتماعی... 260
9-2 جنبههای مجزای متن در رسانههای اجتماعی.. 262
9-2-1 چارچوب عمومی برای تحلیل متن.. 263
9-2-4 عبارات غیرساختیافته. 267
9-3 تحلیل متن در رسانههای اجتماعی.. 268
9-3-2 پاسخگویی به سوال مشارکتی.. 271
9-3-3 برچسبگذاری اجتماعی.. 272
9-3-4 پرکردن شکاف معنایی.. 273
9-3-5 بهرهبرداری از قدرت اطلاعات اضافی.. 274
9-4-1 استخراج عبارات اولیه. 278
9-4-2 استخراج ویژگیهای معنایی.. 280
10- عقیده کاوی و تحلیل احساسات... 285
10-2-1 طبقهبندی احساسات مبتنی بر یادگیریبا نظارت.. 292
10-2-2 طبقهبندی احساسات مبتنی بر یادگیریبدون نظارت.. 295
10-3 طبقهبندی احساسات و ذهنیت جمله. 298
10-4 گسترش واژهنامه عقیده 299
10-4-1 رویکرد مبتنی بر فرهنگ لغت... 300
10-4-2 رویکرد مبتنی بر پیکرهمتنی.. 300
10-5 تحلیل احساسات مبتنی بر جنبه. 302
10-5-1 طبقهبندی جنبه احساسات.. 303
10-5-4 همزمانی گسترش فرهنگ لغت عقیده و استخراج جنبه. 310
10-7 برخی مسایل عقیده کاوی.. 315
11- متن کاوی معنایی مبتنی بر آنتولوژی... 322
11-2وب معنایی و آنتولوژی.. 323
11-3 خوشهبندی معنایی متن.. 326
دسته بندی موضوعی | موضوع فرعی |
فنی و مهندسی |
مهندسی كامپيوتر
مهندسی كامپيوتر |