خواندن فایل CSV در پایتون (دستور read_csv در pandas)

در این مطلب، به طور کامل نحوه خواندن فایل csv نمونه‌ای رو در پایتون و با استفاده از دستور read_csv در pandas آموزش میدیم! و این رو با یک فایل csv که در اختیار شما هم قرار میدیم به صورت گام به گام پیش میبریم!

اصلاً این فایل csv چی هست که بخوایم توی پایتون (python) بیاریمش؟!

این سوال خیلی بنیادین است! و کل بحث رو منحرف میکنه! برای همین اگر همچین سوالی دارید، به آموزش زیر مراجعه کنید!

فایل csv چیست؟ و چگونه می‌توان یک فایل csv ساخت؟!

یه نکته بگم! اینکه چیزی که قراره در این آموزش بگیم تنها راه وارد کردن و خواندن فایل CSV در پایتون (python) نیست!! اما به نظر من ساده‌ترین راه است!

قبل از هر چیز باید…!

قبل از هر چیز باید پکیج pandas رو نصب کرده باشید! برای آموزش نصب پکیج‌های مختلف می‌تونید به آموزش زیر مراجعه کنید!

آموزش نصب پکیج های مختلف در پایتون

پس سریع برید این پکیج pandas رو نصب کنید و دوباره بیاید اینجا تا باهم ادامه بدیم! فقط سریع! منتظریم ها!!

خواندن فایل csv در پایتون (python)

خب برای اینکه شما هم بتونید با من پیش بیاید باید دوتامووون یک فایل csv استفاده کنیم! تا مطمئن باشیم داریم مثل هم کار می‌کنیم! برای همین از مطلب زیر، برید و دیتاست iris (به معنی گل زنبق) رو دانلود کنید! [شدیداً دیتاست معروفی است! خیلی خیلی معروف!]

دانلود دیتاست iris

در ضمن! اینکه دیتاست چی هست و هر ستونش یعنی چی و چه سطرها و ستون‌هایی داره هم در مطلب بالا بحث شده! و دوباره مطرح کردنش فقط وقت رو تلف میکنه! پس اگر دوست دارید می‌تونید مراجعه کنید!

حالا فرض کنید، من این فایلی که گفتم رو دانلود کردم و گذاشتم توی Desktop و توی پوشه‌ای Koolac ! حالا وقتشه که قطعه کد زیر رو در نظر بگیرید تا جلوتر باهم در موردش صحبت کنیم!

توضیح خط به خط کد

در خط ۱ اومدیم پکیج pandas رو با نام مستعار pd وارد برنامه کردیم! (اگر نمی‌دونید پکیج چیست؟! چجوری وارد برنامه میکنن و این نام مستعار و این حرفا یعنی چی؟! به آموزش زیر مراجعه کنید!)

پکیج چیست؟ راه های import کردن یک پکیج در پایتون

در خط ۲ اومدیم یک متغیری به اسم df تعریف کردیم که اون دیتافریم خودمون رو در قالب متغیری با این اسم ذخیره می‌کنیم!

چی؟ نمی‌دونید دیتافریم (Data Frame) چیست؟! هر چند پیش فرض اینه که جلسه پیش این آموزش رو دنبال کردید اما بازهم لینکش رو در پایین قرار میدم! خلاصه ببخشید دیگه! هِی رفتید به آموزش‌های مختلف و دوباره اومدید! دو دقیقه اومدیم خودتون رو ببینیم همش توی آشپزخونه بودید!!!

دیتا فریم (Data Frame) در پایتون

پس در خط ۲، میگیم از پکیج pandas (اون pd نام مستعار همین pandas بود دیگه! که در خط ۱ تعریفش کردیم!) بیا از تابع read_csv استفاده کن تا برامون یک csv بخونی!

توی پرانتز این تابع باید مسیر فایل رو بدیم! که داخل ” ” مسیر این فایل رو قرار می‌دیم! شاید بپرسید اون r که قبلش گذاشتیم چیست؟!

اونو می‌تونید نذارید ولی در اون صورت مجبورید فلاکت بکشید! و به فرمت زیر آدرس‌ها رو وارد کنید!

اگر دقت کنید \ ها تبدیل شد به / ! (که این خوب نیست! چون آدرسی که از کامپیوتر کپی می‌کنید با \ است! و شاید حوصله نداشته باشید، دونه دونه اینا رو عوض کنید!)

و یا به فرمت زیر:

این همه که واضحه! دوتا \\ گذاشتیم! اما توصیه من همون گذاشتن یک r ساده است قبل از ” ” است! همین!

بریم یه بار دیگه بگیم چیکار کردیم!

چون این وسط مسط‌ها خیلی توضیح دادیم، یه بار دیگه کد رو از اول خیلی گذرا بگم!

در خط ۱، پکیج pandas رو با نام مستعار pd وارد برنامه کردیم!

در خط دوم، با تابع read_csv از پکیج pandas (همون pd نام مستعار pandas بود!) میگیم که می‌خوایم فایل csv بیاریم توی برنامه مووون! و توی پرانتز آدرس اون فایل رو به شکلی که در بالا توضیح دادیم، وارد می‌کنید!

در خط ۳ میایم میگیم جناب پایتون (python)، لطف کنید df (همین دیتافریمی که تا الان ساختیم رو) رو چاپ کنید!

که بخشی ار خروجی که python میده رو من در زیر براتون آوردم! همش زیاد میشد برای همین همش رو نیاوردم!

تاکید میکنم این خروجی ادامه داره! ولی من فقط بخش کوچیکی از خروجی رو آوردم!

این هم از آموزش خواندن یک فایل csv در پایتون! (البته کلیاتش! وگرنه همین خوندن فایل csv هم جزئیات زیادی داره!)

  1. مینا
    ۱۷:۱۰ مورخه ۰۱ شهریور ۹۸

    واقعا حرف نداشت عاااااااااالی بود
    بسیار تشکر

    • گروه آموزشی کولاک
      ۰۷:۱۵ مورخه ۰۳ شهریور ۹۸

      سلام و عرض ادب، خواهش میکنم
      خیلی ممنون از شما، امیدوارم مفید بوده باشه

  2. یونس
    ۰۰:۲۶ مورخه ۲۶ مهر ۹۸

    سلام ببخشید من توی خوندن از فایل csv یه جاییش بد گیر کردم! یه فایل سی اس وی دارم که یه سری ستون ها دارم که من از قبل نمیدونم اسمشون چی هستن راهی داره که در حین برنامه این اسامی رو توی لیستی ذخیره کنم بعدش به داده های هر ستون دسرسی پیدا کنم
    li=list(df.columns)
    for i in li:
    df.i
    الان i رو جزء ممبر دیتا فریم نمیشناسه ایا راهی دار؟؟

    • گروه آموزشی کولاک
      ۰۹:۳۱ مورخه ۲۷ مهر ۹۸

      سلام، امیدوارم درست منظورتون رو متوجه شده باشم، اگر درست متوجه نشده بودم، مجدداً مطرح کنید لطفاً
      من دیتاست iris رو در نظر می‌گیرم [به عنوان مثال] و روی اون جواب میدم!
      فرض کنید این دیتاست ۵ تا ستون داره! و فرض کنید اسم دیتاست رو گذاشتم df
      حالا داریم:

      import pandas as pd
      df=pd.read_csv(r"D:\Koolac\Datasets\Iris.csv")
      a=list(df.columns)
      for i in a:
      print(df.loc[:,i])

      امیدوارم مفید بوده باشه
      فقط توجه کنید که این کدی که نوشتم، چون برای شما [موقع نمایش] راست چین میشه، یکم شاید خوندنش سخت باشه! اون توووورفتگی‌ها و غیره رو خودتون لحاظ کنید لطفاً!

کانال تلگرامی ما رو هم دنبال کنید (هر روز تمرین پایتون و مطالب مفیدی قرار میدیم)@Koolac_Org
+