in1min logo
پیتزا

بهترین پیتزای تهران

تحلیل داده
|
۲۷ شهریور ۱۴۰۰
معرفی مفاهیم اولیه

(1) مدل‌های پیش‌بینی

  • مدل‌های پیش‌بینی بر دو قسمند:
  1. مدل‌های قابل توضیح (explainable models): در این مدل‌ها می‌توانیم روند تصمیم‌گیری الگوریتم را که منجر به پیش‎‌بینی می‌شود ببینیم. تمام جزییات نیز قابل مشاهده‌اند.
  2. مدل‌های غیرقابل توضیح (unexplainable models ): این مدل‌ها به مثابه یک جعبه سیاه (black box) عمل می‌کنند. رکوردها و دیتاهای قبلی به آن‌ها داده می‌شود و پس از محاسبات و اعمال ریاضی، نتیجه حاصل می‌گردد. در این حالت ما قادر به مشاهده مسیر طی شده برای رسیدن به نتیجه نهایی نیستیم.

(2) روش SEFR

  • این روش امتیاز دهی بخشی از دیتا را می‌گیرد و موضوع را بر اساس تحلیل دیتای قبلی، پیش‌بینی می‌کند. اصطلاحا به آن الگوریتم Classification نیز می‌گویند. این الگوریتم در اصل برای پیش‌بینی دیتای مبتنی بر تکست ساخته شده اما به حوزه‌های دیگر مانند تصویر یا موارد پزشکی نیز گسترش یافته است. روش SEFR در این زمینه‌ها هم توانسته موفق عمل کند اما کماکان بیشترین دقت و بهترین عملکرد را در حوزه پیش‌بینی تکست داراست.
  • برای تست این روش می‌توانیم 90% از دیتای اسنپ فود را به الگوریتم بدهیم و از آن بخواهیم10 %باقی مانده را پیش‌بینی کند. در این حالت می‌توانیم امتیازهای داده شده را با دیتای قبلی قیاس کرده و صحت حدس الگوریتم را بسنجیم.

(3) Topic Modeling

  • مدل‌سازی موضوعی مشخص می‌کند در هر دیتا چه مفاهیمی مطرح شده. متن به الگوریتم داده می‌شود و الگوریتم به صورت بدون نظارت (unsupervised) چند مفهوم را استخراج می‌کند.

روش کار

  • از تجمیع روش SEFR و مدل‌سازی موضوعی می‌توانیم تشخیص دهیم کدام کلمات و مفاهیم در نظرات مردمی بیشترین تاثیر مثبت و بیشترین تاثیر منفی را بر تصمیم نهایی مدل گذاشته‌اند. از آن جا که روش SEFR از انواع مدل‌های explainable یا همان قابل توضیح است می‌توان روند رسیدن به نتیجه را مشاهده کرد. . به عبارتی اگر الگوریتم یک کامنت را منفی تلقی کند، می‌توانیم بفهمیم کدام مفهوم امتیاز منفی را برای این کامنت ایجاد کرده است.
  • برای مثال با مرور نظرات مردمی برای یک رستوران درمی‌یابیم که کلمه سلام در یک کامنت اعتبار چندانی ندارد و امتیاز صفر می‌گیرد. یا کلمه تاخیر باعث گرفتن بیشترین امتیاز منفی در کامنت‌ها شده است.
  • *نکته: لزوما تاثیرگذارترین کلمات پرتکرارترین‌ آن‌ها نیستند.

هدف پژوهش

  • این پژوهش به منظور رتبه‌بندی پیتزا در رستوران‌های زنجیره‌ای معروف و با استفاده از پیش‌پردازش متون، مدل‌سازی موضوعی، و امتیازدهی روش SEFR انجام شده است. مفاهیم کلیدی در مدل‌سازی دسته‌بندی با SEFR، امتیازی از 1- تا 1+ گرفتند، و مثبت‌ترین و منفی‌ترین مفاهیم تاثیرگذار روی رضایت مشتریان برای هر رستوران استخراج شدند.

نتیجه پژوهش

  • با محاسبه میانگین امتیاز کاربرها توی اسنپ فود میشه فهمید تو هر منطقه بهترین و بدترین پیتزای منطقه مال کدوم رستورانه.
  • با همین روش میشه رتبه بندی پیتزا در رستوران های زنجیره ای معروف رو به دست آورد.
    1. شیلا
    1. پرپروک
    1. پلاک
    1. باگت
    1. تله پیتزا
    1. پیتزا سیب
    1. باروژ
    1. اژدر زاپاتا
    1. پیانو
    1. پیتزا هات
    1. برگرلند
    1. آواچی
    1. عطاویچ
    1. هایدا
    1. هفت چنار

*نکته: در این رتبه‌بندی تنها معیار امتیازهای اپلیکیشن اسنپ فود است. در ادامه به بررسی نظرات مردمی و تاثیر آن در این رتبه‌بندی می‌پردازیم:

روش تحقیق

  • از بین بیش از یک میلیون کامنت مردمی ثبت شده در فاصله بهمن 94 الی فروردین 1400 تنها کامنت‌های مربوط به سفارش‌های پیتزا از رستوران‌های زنجیره‌ای دارای حداقل 5 شعبه، از سایرین تفکیک شدند. بر اساس امتیازی که هرکاربر بالای کامنت خود ثبت نموده، برای 54 هزار کلمه که در کامنت‌های مردمی استفاده شده بود، نمره مثبت و منفی تعیین کردیم. برای مثال به جز کلمات "عالی"، "خوب"و "خوشمزه" کلماتی مانند "حلالش" و "پرچم" نیز نشان‌دهنده رضایت مشتری هستند. از سویی دیگر به جز کلماتی مانند "بدمزه"، "افتضاح" و "سرد"، کلماتی هم‌چون "اونقدرام" و "آبرو" گویای نارضایتی مشتری هستند.

بر اساس این تحلیل، مفاهیم کلیدی که باعث ایجاد بیشترین رضایت یا نارضایتی در هر برند شده‌اند را یافته‌ایم:

شیلا
  • مثبت: مزه خوب، کیفیت غذا، تحویل سریع، تنوع منو، رفتار پرسنل
  • منفی: استفاده از سویا، خیس بودن، درخواست وجه از سوی پیک، کارتن غذا، مانده بودن غذا
پرپروک
  • مثبت: مزه خوب، سبک بودن، مودب بودن پرسنل، بهداشت بالا، سالم بودن مواد
  • منفی: سرد بودن، جابجایی نامناسب، له شدن غذا داخل بسته، ماسیده بودن، قیمت بالا
باگت
  • مثبت: لذیذ بودن، استفاده خوب از سیر، استفاده خوب از قارچ، سرویس خوب، تحویل سریع
  • منفی: شباهت نداشتن به عکس، افت کیفیت، کیفیت خمیر پیتزا، ماسیده بودن، کیفیت سوسیس
سیب 360
  • مثبت: مودب بودن پرسنل، استفاده از بیکن، تحویل سریع، سبک بودن، داغ رسیدن غذا
  • منفی: بی‌مزه بودن غذا، شباهت نداشتن به عکس، افت کیفیت، کیفیت خمیر، بوی غذا
باروژ
  • مثبت: استفاده مناسب از روغن، تحویل سریع، سس چیلی، رفتار پرسنل، تندی مناسب غذا
  • منفی: کیفیت گوجه، کیفیت خمیر پیتزا، کیفیت پیاز، ماسیده بودن غذا، نامرغوب بودن مواد
پیتزا هات
  • مثبت: مزه خوب، رفتار پرسنل، پرملات بودن، داغ بودن، ترد بودن
  • منفی: ماسیده بودن، نامرغوب بودن، سرد بودن، مانده بودن مواد، کیفیت خمیر پیتزا
برگرلند
  • مثبت: لذیذ بودن، متفاوت بودن غذا، استفاده خوب از سس، به‌ویژه آلفردو، کیفیت خوب زیتون
  • منفی: ماسیده بودن، خشک بودن، کیفیت خمیر پیتزا، سرد بودن، نپخته بودن
آواچی
  • مثبت: پخته بودن غذا، تحویل سریع، ترد بودن غذا، کیفیت خمیر پیتزا
  • منفی: مانده بودن، سوخته بودن، کیفیت پنیر پیتزا، کیفیت مواد اولیه، خیس بودن، چرب بودن
عطاویچ
  • مثبت: مودب بودن پرسنل، تحویل سریع، پرملات بودن، استفاده مناسب از نمک، استفاده از آویشن
  • منفی: کیفیت پنیر پیتزا، کیفیت پپرونی، سرد بودن، استفاده از مواد نامرغوب، استفاده از کدو
هایدا
  • مثبت: تحویل سریع، ترد بودن غذا، کیفیت پپرونی، استفاده از آویشن، کیفیت پنیر
  • منفی: بدمزه بودن، از دهن افتاده بودن، بیات بودن، کهنه بودن، کیفیت کالباس

به اشتراک بگذارید

همراه ما بمونید

اگه دوست دارید فهرست مقاله‌ها و ویدیو‌های جدید این‌وان‌مین رو توی ایمیلتون داشته باشید، اینجا برای ما آدرسش رو بنویسید