این دیتاست (data set) شامل 114 سطر داده است و 2 ویژگی (feature) دارد و سه تا label ! برای اهداف دسته بندی (classification) و مخوصاً Naive Bayes Classification مورد استفاده قرار میگیرد! [باز خصوصاً Bernoulli Naive Bayes Classification]!
دانلود فایل csv (حجم: 1 کیلوبایت!)
هرگونه کپیبرداری از این مطالب، توسط سایتها/کانال ها و غیره شرعاً حرام و قانوناً غیرمجاز میباشد و هیچ گونه رضایتی را در بر ندارد!
این دیتاست توسط خودمان تهیه شده است! لطفاً اگر جایی استفاده میکنید، منبع را هم ذکر کنید!
تعداد سطرهای دیتاست:
114 سطر! (یا به عبارتی 114تا داده!)
تعداد ستونهای data set:
این مجموعه داده، تعداد 2 وِیژگی (feature) دارد! و یه دونه هم که مربوط به اینه که label هر کدومشون چیست؟!
چند کلاس یا label دارد؟!
سه تا! (شامل: A و B و C)!
آیا missing value دارد؟! خیر
معروفترین کارهایی که میشه با این دیتاست انجام داد چیست؟!
چه کسی این دیتاست رو درست کرده؟!
سجّاد رحمانی و گروه آموزشی کولاک! [این دیتاست کاملاً توسط خودمون ساخته شده، پس لطفاً کپیرایت آن را رعایت کنید و منبع را ذکر کنید!]
فرض کنید ما دو تا شبکهمجازی داریم (مثلاً فرض کنید تلگرام و اینستاگرام)!
حالا میخوایم ببینیم براساس اینکه در فلان روز، پُست اینستاگرام گذاشتیم (که با عدد 1 نشون میدیم) و یا نذاشتیم (که با عدد 0 نشون میدیم)، سطح خریدمون چقدر خواهد بود؟!
مثلاً فرض کنید روزی که توی هر دوتا پُست گذاشتیم سطح خرید بالایی داشتیم (مثلاً سطح خرید بالا رو با A نشون میدیم!)
و روزی که فقط توی یکیشون پُست گذاشتیم، سطح خریدمون یه چیز متوسطی بوده! (که این رو هم با B نشون میدیم!)
و روزی هم که توی هیچ کدومشوون چیزی نذاشتیم، سطح خریدمون فاجعه بوده! (که این بندهخدا رو هم با C نشون میدیم!)
پس دوتا feature (یا ویژگی) داریم به اسم Social1 و Social2 ! (در زبان انگلیسی، Social به معنی اجتماعی است! منظورمون همون شبکه اجتماعی بوده که خلاصهش کردیم!)
مقادیر این featureها صفر و یک است (قرار ندادن پست یا قرار دادن پست!)
و یک دونه label یا class یا target (یا هر اسم دیگهای که دوست دارید بگید! چون بهش چیزهای متفاوتی میگن!) هم داریم به اسم Purchase_Level (سطح خرید)! که این همینطور که قبلاً گفتیم یا A است (سطح خرید خوب)، یا B (متوسط) و یا C (افتضاح!)
Purchase_Level | Social2 | Social1 |
C | 0 | 0 |
A | 1 | 1 |
B | 1 | 0 |
A | 1 | 1 |
اونهایی که با یادگیری ماشین کار میکنن و برای آموزش داده میخوان قطعاً یکی از مشکلاتشون نداشتن دادههای آماده این شکلی است! چون مثلاً فرض کنید یکی میخواد Bernoulli Naive Bayes رو پیادهسازی کنه! یکی از مشکلاتی که باهاش برخورد میکنه اینه که داده خوب و ساده پیدا نمیکنه! (برای یادگیری، اون اوایل نیازه تا دیتاست ساده و خوشفهم باشه!)
امیدوارم براتون مفید بوده باشه! اگر مفید بود، لطفاً به دوستانتون هم سایت ما رو معرفی کنید!
تعداد دیدگاه | 0 |
تاریخ انتشار | 17/09/2019 |
تاریخ بروزرسانی | 17/09/2019 |