خواندن csv با Pandas در پایتون :
یکی از ابزارهای قدرتمند برنامه نویسی پایتون، کتابخانه Pandas است که برای کار با داده های عمده و داده های جدولی استفاده می شود. این کتابخانه قابلیت های مختلفی برای خواندن، تحلیل و تبدیل داده ها را فراهم می کند.
یکی از فرمت های متداول برای ذخیره داده ها، فایل های CSV است. فایل های CSV (Comma-Separated Values) معمولاً شامل داده های جداشده با کاما هستند و به راحتی می توانند توسط برنامه های مختلفی خوانده شوند. با استفاده از کتابخانه Pandas، می توانیم این فایل ها را به سادگی خوانده و به داده های جدولی تبدیل کنیم.
برای خواندن یک فایل CSV در پایتون با استفاده از Pandas، ابتدا باید کتابخانه را وارد کنیم:
“`python
import pandas as pd
“`
سپس می توانیم از تابع `read_csv()` استفاده کنیم تا فایل CSV را بخوانیم و به داده های جدولی تبدیل کنیم. این تابع یک پارامتر اجباری به نام `filepath_or_buffer` دارد که می بایست آدرس فایل CSV را به عنوان ورودی دریافت کند. علاوه بر آن، می توانیم از پارامترهای دیگری مانند `sep` استفاده کنیم تا جدا کننده مورد استفاده در فایل را تعیین کنیم. به طور پیش فرض، این پارامتر به مقدار `,` تنظیم شده است.
“`python
data = pd.read_csv(filepath_or_buffer=’path/to/file.csv’, sep=’,’)
“`
بعد از خواندن فایل، داده ها به صورت یک شی DataFrame در Pandas ذخیره می شوند. DataFrame، یک ساختار داده ای جدولی است که شامل ستون ها و ردیف ها است. با استفاده از این ساختار داده ای، می توانیم به راحتی عملیات مختلفی روی داده ها انجام دهیم.
بعد از خواندن فایل CSV، می توانیم به عناوین ستون ها و داده های ردیف ها دسترسی پیدا کنیم. به عنوان مثال، می توانیم از متد `columns` بر روی شی DataFrame استفاده کنیم تا عناوین ستون ها را بدست آوریم:
“`python
column_names = data.columns
“`
همچنین، می توانیم از متد `head()` بر روی شی DataFrame استفاده کنیم تا چند ردیف اول داده ها را مشاهده کنیم:
“`python
first_rows = data.head()
“`
با استفاده از این قابلیت ها و قابلیت های دیگر کتابخانه Pandas، می توانیم به راحتی داده های موجود در فایل های CSV را خوانده و تحلیل کنیم. همچنین، می توانیم داده ها را به فرمت های دیگری مانند Excel یا SQL ذخیره کنیم.