خواندن فایل CSV در پایتون (دستور read_csv در pandas)

در این مطلب، به طور کامل نحوه خواندن فایل csv نمونه‌ای رو در پایتون و با استفاده از دستور read_csv در pandas آموزش میدیم! و این رو با یک فایل csv که در اختیار شما هم قرار میدیم به صورت گام به گام پیش میبریم!

اصلاً این فایل csv چی هست که بخوایم توی پایتون (python) بیاریمش؟!

این سوال خیلی بنیادین است! و کل بحث رو منحرف میکنه! برای همین اگر همچین سوالی دارید، به آموزش زیر مراجعه کنید!

فایل csv چیست؟ و چگونه می‌توان یک فایل csv ساخت؟!

یه نکته بگم! اینکه چیزی که قراره در این آموزش بگیم تنها راه وارد کردن و خواندن فایل CSV در پایتون (python) نیست!! اما به نظر من ساده‌ترین راه است!

قبل از هر چیز باید…!

قبل از هر چیز باید پکیج pandas رو نصب کرده باشید! برای آموزش نصب پکیج‌های مختلف می‌تونید به آموزش زیر مراجعه کنید!

آموزش نصب پکیج های مختلف در پایتون

پس سریع برید این پکیج pandas رو نصب کنید و دوباره بیاید اینجا تا باهم ادامه بدیم! فقط سریع! منتظریم ها!!

خواندن فایل csv در پایتون (python)

خب برای اینکه شما هم بتونید با من پیش بیاید باید دوتامووون یک فایل csv استفاده کنیم! تا مطمئن باشیم داریم مثل هم کار می‌کنیم! برای همین از مطلب زیر، برید و دیتاست iris (به معنی گل زنبق) رو دانلود کنید! [شدیداً دیتاست معروفی است! خیلی خیلی معروف!]

دانلود دیتاست iris

در ضمن! اینکه دیتاست چی هست و هر ستونش یعنی چی و چه سطرها و ستون‌هایی داره هم در مطلب بالا بحث شده! و دوباره مطرح کردنش فقط وقت رو تلف میکنه! پس اگر دوست دارید می‌تونید مراجعه کنید!

حالا فرض کنید، من این فایلی که گفتم رو دانلود کردم و گذاشتم توی Desktop و توی پوشه‌ای Koolac ! حالا وقتشه که قطعه کد زیر رو در نظر بگیرید تا جلوتر باهم در موردش صحبت کنیم!

توضیح خط به خط کد

در خط ۱ اومدیم پکیج pandas رو با نام مستعار pd وارد برنامه کردیم! (اگر نمی‌دونید پکیج چیست؟! چجوری وارد برنامه میکنن و این نام مستعار و این حرفا یعنی چی؟! به آموزش زیر مراجعه کنید!)

پکیج چیست؟ راه های import کردن یک پکیج در پایتون

در خط ۲ اومدیم یک متغیری به اسم df تعریف کردیم که اون دیتافریم خودمون رو در قالب متغیری با این اسم ذخیره می‌کنیم!

چی؟ نمی‌دونید دیتافریم (Data Frame) چیست؟! هر چند پیش فرض اینه که جلسه پیش این آموزش رو دنبال کردید اما بازهم لینکش رو در پایین قرار میدم! خلاصه ببخشید دیگه! هِی رفتید به آموزش‌های مختلف و دوباره اومدید! دو دقیقه اومدیم خودتون رو ببینیم همش توی آشپزخونه بودید!!!

دیتا فریم (Data Frame) در پایتون

پس در خط ۲، میگیم از پکیج pandas (اون pd نام مستعار همین pandas بود دیگه! که در خط ۱ تعریفش کردیم!) بیا از تابع read_csv استفاده کن تا برامون یک csv بخونی!

توی پرانتز این تابع باید مسیر فایل رو بدیم! که داخل ” ” مسیر این فایل رو قرار می‌دیم! شاید بپرسید اون r که قبلش گذاشتیم چیست؟!

اونو می‌تونید نذارید ولی در اون صورت مجبورید فلاکت بکشید! و به فرمت زیر آدرس‌ها رو وارد کنید!

اگر دقت کنید \ ها تبدیل شد به / ! (که این خوب نیست! چون آدرسی که از کامپیوتر کپی می‌کنید با \ است! و شاید حوصله نداشته باشید، دونه دونه اینا رو عوض کنید!)

و یا به فرمت زیر:

این همه که واضحه! دوتا \\ گذاشتیم! اما توصیه من همون گذاشتن یک r ساده است قبل از ” ” است! همین!

بریم یه بار دیگه بگیم چیکار کردیم!

چون این وسط مسط‌ها خیلی توضیح دادیم، یه بار دیگه کد رو از اول خیلی گذرا بگم!

در خط ۱، پکیج pandas رو با نام مستعار pd وارد برنامه کردیم!

در خط دوم، با تابع read_csv از پکیج pandas (همون pd نام مستعار pandas بود!) میگیم که می‌خوایم فایل csv بیاریم توی برنامه مووون! و توی پرانتز آدرس اون فایل رو به شکلی که در بالا توضیح دادیم، وارد می‌کنید!

در خط ۳ میایم میگیم جناب پایتون (python)، لطف کنید df (همین دیتافریمی که تا الان ساختیم رو) رو چاپ کنید!

که بخشی ار خروجی که python میده رو من در زیر براتون آوردم! همش زیاد میشد برای همین همش رو نیاوردم!

تاکید میکنم این خروجی ادامه داره! ولی من فقط بخش کوچیکی از خروجی رو آوردم!

این هم از آموزش خواندن یک فایل csv در پایتون! (البته کلیاتش! وگرنه همین خوندن فایل csv هم جزئیات زیادی داره!)