كيفية استخدام Python لقراءة ملفات CSV

تمت الكتابة بواسطة: عبد الحكيم

تارخ آخر تحديث: 10 سبتمبر 2024

محتوى المقال

كيفية استخدام Python لقراءة ملفات CSV

تعتبر ملفات CSV (Comma-Separated Values) واحدة من أكثر تنسيقات الملفات استخدامًا لتخزين البيانات النصية البسيطة. حيث تُستخدم عادةً لنقل البيانات بين الأنظمة المختلفة أو للاحتفاظ بالسجلات. في هذا المقال، سنتعرف على كيفية استخدام لغة البرمجة Python لقراءة ملفات CSV باستخدام مكتبات مختلفة مثل csv و pandas مع أمثلة توضيحية.

استخدام مكتبة csv لقراءة ملفات CSV

مكتبة csv هي مكتبة مدمجة في Python تسهل التعامل مع ملفات CSV. يمكن استخدامها لقراءة وكتابة ملفات CSV بطرق بسيطة ومباشرة.

قراءة ملفات CSV باستخدام csv.reader()

الدالة csv.reader() تُستخدم لقراءة محتويات ملف CSV وتحويلها إلى قوائم.

import csv

with open('data.csv', 'r') as file:
    reader = csv.reader(file)
    for row in reader:
        print(row)

في هذا المثال، يتم فتح ملف data.csv وقراءته باستخدام csv.reader(). كل صف من الملف يتم تحويله إلى قائمة ويُطبع على الشاشة. هذا الأسلوب مفيد لقراءة البيانات في شكلها الخام.

قراءة ملفات CSV باستخدام csv.DictReader()

الدالة csv.DictReader() تعمل مثل csv.reader() ولكنها تعيد كل صف على شكل قاموس حيث تكون العناوين في السطر الأول هي المفاتيح.

import csv

with open('data.csv', 'r') as file:
    reader = csv.DictReader(file)
    for row in reader:
        print(row)

في هذا المثال، تُستخدم csv.DictReader() لقراءة ملف CSV وتحويل كل صف إلى قاموس، حيث تكون مفاتيح القاموس هي أسماء الأعمدة في الملف. هذا مفيد عند التعامل مع ملفات CSV التي تحتوي على هياكل بيانات معقدة.

استخدام مكتبة pandas لقراءة ملفات CSV

مكتبة pandas هي واحدة من أقوى المكتبات في Python لتحليل البيانات. توفر أدوات متقدمة لقراءة ومعالجة ملفات CSV بطرق مرنة وسهلة الاستخدام.

قراءة ملفات CSV باستخدام pandas.read_csv()

الدالة pandas.read_csv() هي الطريقة الأكثر شيوعًا لقراءة ملفات CSV في Pandas. تقوم بتحميل البيانات في هيكل بيانات يُسمى DataFrame، مما يسهل التعامل معها.

import pandas as pd

df = pd.read_csv('data.csv')
print(df.head())

في هذا المثال، يتم قراءة ملف data.csv وتحميله في DataFrame باستخدام pandas.read_csv(). يتم عرض أول خمس صفوف من الملف باستخدام df.head().

معالجة البيانات بعد قراءة CSV

بعد قراءة ملف CSV باستخدام Pandas، يمكنك القيام بالعديد من العمليات على البيانات مثل التصفية، الفرز، وإجراء العمليات الحسابية. على سبيل المثال:

df_filtered = df[df['Age'] > 30]
print(df_filtered)

في هذا المثال، يتم تصفية البيانات لاختيار الصفوف حيث تكون قيمة العمود Age أكبر من 30.

مقارنة بين csv و pandas في قراءة ملفات CSV

إليك مقارنة بين استخدام csv و pandas لقراءة ملفات CSV:

  • السهولة: pandas يوفر واجهة أبسط وأكثر مرونة للتعامل مع البيانات مقارنة بـ csv.
  • الأداء: pandas أفضل في التعامل مع مجموعات البيانات الكبيرة بسبب تحسيناته المتقدمة.
  • المرونة: csv أكثر مرونة من حيث التحكم اليدوي في قراءة البيانات ومعالجتها.

الخلاصة

قراءة ملفات CSV في Python يمكن أن تتم باستخدام مكتبة csv المدمجة أو مكتبة pandas القوية. كل من الطريقتين توفران مزايا فريدة، ويعتمد الاختيار بينهما على احتياجات المشروع. إن كنت بحاجة إلى معالجة بيانات بسيطة وسريعة، فمكتبة csv تعد خيارًا جيدًا. أما إن كنت تعمل على تحليل بيانات معقدة أو كبيرة الحجم، فإن pandas هو الأفضل بلا شك.

طور مهاراتك: مقالات يجب قراءتها في البرمجة