جزئیات آموزش
آخرین ویرایش: ۲۶ شهریور ۱۳۹۸
دسته بندی:

کانال تلگرام

بنر تلگرامی

دانلود دیتاست برای دسته بندی بیز ساده (Naive Bayes) برنولی (Bernoulli)

این دیتاست (data set) شامل ۱۱۴ سطر داده است و ۲ ویژگی (feature) دارد و سه تا label ! برای اهداف دسته بندی (classification) و مخوصاً Naive Bayes Classification مورد استفاده قرار می‌گیرد! [باز خصوصاً Bernoulli Naive Bayes Classification]!

دانلود رایگان دیتاست (Data Set)

دانلود فایل csv  (حجم: ۱ کیلوبایت!)

هرگونه کپی‌برداری از این مطالب، توسط سایت‌ها/کانال ها و غیره شرعاً حرام و قانوناً غیرمجاز می‌باشد و هیچ گونه رضایتی را در بر ندارد!

این دیتاست توسط خودمان تهیه شده است! لطفاً اگر جایی استفاده می‌کنید، منبع را هم ذکر کنید!

ویژگی‌های کلّی دیتاست (data set)!

تعداد سطرهای دیتاست:

۱۱۴ سطر! (یا به عبارتی ۱۱۴تا داده!)

تعداد ستون‌های data set:

این مجموعه داده، تعداد ۲ وِیژگی (feature) دارد! و یه دونه هم که مربوط به اینه که label هر کدومشون چیست؟!

چند کلاس یا label دارد؟!

سه تا! (شامل: A و B و C)!

آیا missing value دارد؟! خیر

معروف‌ترین کارهایی که میشه با این دیتاست انجام داد چیست؟!

  • طبقه‌بندی (classification)
  • خصوصاً Naive Bayes Classification و باز خصوصاً Bernoulli Naive Bayes Classification !

چه کسی این دیتاست رو درست کرده؟!

سجّاد رحمانی و گروه آموزشی کولاک! [این دیتاست کاملاً توسط خودمون ساخته شده، پس لطفاً کپی‌رایت آن را رعایت کنید و منبع را ذکر کنید!]

کلاً این دیتاست (data set) در مورد چیست؟!

فرض کنید ما دو تا شبکه‌مجازی داریم (مثلاً فرض کنید تلگرام و اینستاگرام)!

حالا می‌خوایم ببینیم براساس اینکه در فلان روز، پُست اینستاگرام گذاشتیم (که با عدد ۱ نشون میدیم) و یا نذاشتیم (که با عدد ۰ نشون میدیم)، سطح خریدمون چقدر خواهد بود؟!

مثلاً فرض کنید روزی که توی هر دوتا پُست گذاشتیم سطح خرید بالایی داشتیم (مثلاً سطح خرید بالا رو با A نشون میدیم!)

و روزی که فقط توی یکیشون پُست گذاشتیم، سطح خریدمون یه چیز متوسطی بوده! (که این رو هم با B نشون میدیم!)

و روزی هم که توی هیچ کدومشوون چیزی نذاشتیم، سطح خریدمون فاجعه بوده! (که این بنده‌خدا رو هم با C نشون میدیم!)

پس دوتا feature (یا ویژگی) داریم به اسم Social1 و Social2 ! (در زبان انگلیسی، Social به معنی اجتماعی است! منظورمون همون شبکه اجتماعی بوده که خلاصه‌ش کردیم!)

مقادیر این featureها صفر و یک است (قرار ندادن پست یا قرار دادن پست!)

و یک دونه label یا class یا target (یا هر اسم دیگه‌ای که دوست دارید بگید! چون بهش چیزهای متفاوتی میگن!) هم داریم به اسم Purchase_Level (سطح خرید)! که این همینطور که قبلاً گفتیم یا A است (سطح خرید خوب)، یا B (متوسط) و یا C (افتضاح!)

نمونه دیتاست (data set) !

 

Purchase_Level Social2 Social1
C ۰ ۰
A ۱ ۱
B ۱ ۰
A ۱ ۱

اون‌هایی که با یادگیری ماشین کار میکنن و برای آموزش داده می‌خوان قطعاً یکی از مشکلاتشون نداشتن داده‌های آماده این شکلی است! چون مثلاً فرض کنید یکی میخواد Bernoulli Naive Bayes رو پیاده‌سازی کنه! یکی از مشکلاتی که باهاش برخورد میکنه اینه که داده خوب و ساده پیدا نمی‌کنه! (برای یادگیری، اون اوایل نیازه تا دیتاست ساده و خوش‌فهم باشه!)

امیدوارم براتون مفید بوده باشه! اگر مفید بود، لطفاً به دوستانتون هم سایت ما رو معرفی کنید!

مطالب مشابه!

دانلود دیتاست گل زنبق (iris – آیریس)

کانال تلگرامی ما رو هم دنبال کنید (هر روز تمرین پایتون و مطالب مفیدی قرار میدیم)@Koolac_Org
+