بضائع

مكتبات بايثون مذهلة ولكنها غير معروفة

يبحث مبرمج Python دائمًا عن مكتبات جديدة يمكنها تحسين العمل في هندسة البيانات ومشاريع ذكاء الأعمال.

في هذه المقالة ، نرى بعض مكتبات بيثون غير المعروفة ولكنها مفيدة جدًا:

1. رقاص الساعة

على الرغم من توفر العديد من المكتبات في بايثون بالنسبة لـ DateTime ، أجد أن البندول سهل الاستخدام في أي عملية تاريخ. البندول هو خزانة الكتب المفضلة لدي للاستخدام اليومي في العمل. يوسع وحدة بايثون للتاريخ والوقت المدمجة ، مضيفًا واجهة برمجة تطبيقات أكثر سهولة لإدارة المناطق الزمنية وتنفيذ عمليات التاريخ والوقت مثل إضافة فترات زمنية وطرح التواريخ والتحويل بين المناطق الزمنية. يوفر واجهة برمجة تطبيقات بسيطة وسهلة الاستخدام لتنسيق التواريخ والأوقات.

تركيب
!pip install pendulum
مثال
# import library

import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
 
#local() creates datetime instance with local timezone

local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)

# Printing UTC time

utc = pendulum.now('UTC')
print("Current UTC time:", utc)
 
# Converting UTC timezone into Europe/Paris time

europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
الناتج

2. فتفي

هل واجهت عندما لا تظهر اللغة الأجنبية في البيانات بشكل صحيح؟ وهذا ما يسمى موجيباك. Mojibake هو مصطلح يستخدم لوصف النص المشوه أو المشوه الذي يحدث نتيجة لمشكلات الترميز أو فك التشفير. يحدث هذا عادةً عندما يتم فك ترميز النص المكتوب بحرف واحد بشكل غير صحيح باستخدام ترميز مختلف. ستساعدك مكتبة ftfy python في إصلاح Mojibake ، وهو أمر مفيد جدًا في حالات استخدام البرمجة اللغوية العصبية.

تركيب
! نقطة تثبيت ftfy
مثال
print (ftfy.fix_text ('صحح الجملة باستخدام "ftfy" x9d. ")) print (ftfy.fix_text (" لا توجد مشاكل مع النص ")) '))
الناتج

بالإضافة إلى Mojibake ، سيقوم ftfy بإصلاح الترميزات السيئة ونهايات الأسطر السيئة والاقتباسات السيئة. قد يفهم النص الذي تم فك تشفيره كأحد الترميزات التالية:

  • لاتيني -1 (ISO-8859–1)
  • Windows-1252 (CP1252 - يُستخدم في منتجات Microsoft)
  • Windows-1251 (CP1251 - النسخة الروسية من CP1252)
  • Windows-1250 (CP1250 - إصدار أوروبا الشرقية من CP1252)
  • ISO-8859–2 (وهو ليس مطابقًا تمامًا لنظام التشغيل Windows-1250)
  • MacRoman (يُستخدم في نظام التشغيل Mac OS 9 والإصدارات الأقدم)
  • cp437 (مستخدم في MS-DOS وبعض إصدارات موجه أوامر Windows)

3. رسم

Sketch هو مساعد ترميز AI فريد مصمم خصيصًا للمستخدمين الذين يعملون مع مكتبة الباندا في Python. يستخدم خوارزميات التعلم الآلي لفهم سياق بيانات المستخدم ويقدم اقتراحات التعليمات البرمجية ذات الصلة لجعل معالجة البيانات ومهام التحليل أسهل وأكثر كفاءة. لا يتطلب Sketch من المستخدمين تثبيت أي مكونات إضافية إضافية في IDE الخاص بهم ، مما يجعله سريعًا وسهل الاستخدام. يمكن أن يؤدي ذلك إلى تقليل الوقت والجهد اللازمين للمهام المتعلقة بالبيانات بشكل كبير ومساعدة المستخدمين على كتابة تعليمات برمجية أفضل وأكثر كفاءة.

تركيب
! رسم تثبيت نقطة
مثال

نحتاج إلى إضافة امتداد .sketch إلى pandas dataframe لاستخدام هذه المكتبة.

.رسم.اسأل

تطلب هي إحدى ميزات Sketch التي تتيح للمستخدمين طرح أسئلة حول بياناتهم بتنسيق لغة طبيعية. يوفر استجابة نصية لاستعلام المستخدم.

# استيراد مكتبات استيراد رسم استيراد الباندا كـ pd # قراءة البيانات (باستخدام بيانات Twitter كمثال) df = pd.read_csv ("tweets.csv") print (df)
# السؤال عن الأعمدة التي تعتبر نوع الفئة df.sketch.ask ("ما الأعمدة التي تمثل نوع الفئة؟")
الناتج
# للعثور على شكل إطار البيانات df.sketch.ask ("ما هو شكل إطار البيانات")

.رسم.كيفية

HOWTO هي ميزة توفر كتلة من التعليمات البرمجية التي يمكن استخدامها كنقطة بداية أو نقطة نهاية للعديد من المهام المتعلقة بالبيانات. يمكننا أن نطلب مقتطفات من التعليمات البرمجية لتطبيع بياناتهم ، وإنشاء ميزات جديدة ، وتتبع البيانات ، وحتى بناء النماذج. سيوفر هذا الوقت ويسهل نسخ الرمز ولصقه ؛ ليس عليك كتابة الكود يدويًا من البداية.

# طلب توفير رمز تم قصه لتصور المشاعر df.sketch.howto ("تصور المشاعر")
الناتج

.رسم.تطبيق

وظيفة .apply يساعد في إنشاء ميزات جديدة وتحليل الحقول وإجراء معالجات أخرى للبيانات. لاستخدام هذه الميزة ، نحتاج إلى امتلاك حساب OpenAI واستخدام مفتاح API لأداء المهام. لم أجرب هذه الميزة.

لقد استمتعت باستخدام هذه المكتبة ، على وجه الخصوص تأتي إنه يعمل ، وأجده مفيدًا.

4. الرمز الجغرافي

"pgeocode" هي مكتبة ممتازة عثرت عليها مؤخرًا وكانت مفيدة بشكل لا يصدق لمشاريع التحليل المكاني الخاصة بي. على سبيل المثال ، يسمح لك بالعثور على المسافة بين رمزين بريديين ويوفر معلومات جغرافية عن طريق إدخال بلد ورمز بريدي.

تركيب
! نقطة تثبيت pgeocode
مثال

الحصول على معلومات جغرافية لرموز بريدية محددة

# التحقق من البلد "الهند" nomi = pgeocode.Nominatim ('In') # الحصول على معلومات جغرافية عن طريق تمرير الرموز البريدية nomi.query_postal_code (["620018"، "620017"، "620012"])
الناتج

يحسب "pgeocode" المسافة بين رمزين بريديين من خلال أخذ البلد والرموز البريدية كمدخلات. يتم التعبير عن النتيجة بالكيلومترات.

# إيجاد مسافة بين مسافة الرمزين البريديين = pgeocode.GeoDistance ('In') Distance.query_postal_code ("620018"، "620012")
الناتج

5. Rembg

rembg هي مكتبة أخرى مفيدة تزيل الخلفية بسهولة من الصور.

تركيب
! نقطة تثبيت rembg
مثال
# استيراد مكتبات
من rembg import remove import cv2 # path of input image (my file: image.jpeg) input_path = 'image.jpeg' # path لحفظ صورة الإخراج وحفظها كمخرج. jpeg output_path = 'output.jpeg' # قراءة المدخلات إدخال الصورة = cv2.imread (input_path) # إزالة إخراج الخلفية = إزالة (الإدخال) # حفظ الملف cv2.imwrite (output_path ، الإخراج)
الناتج

قد تكون بالفعل على دراية ببعض هذه المكتبات ، لكن بالنسبة لي ، لا غنى عن Sketch و Pendulum و pgeocode و ftfy في عملي في هندسة البيانات. أنا أعتمد عليهم كثيرًا في مشاريعي.

6. أنسنة

يوفر Humanize "تنسيقًا بسيطًا وسهل القراءة للسلسلة للأرقام والتواريخ والأوقات. الهدف من المكتبة هو أخذ البيانات وجعلها أكثر سهولة في الاستخدام ، على سبيل المثال عن طريق تحويل عدد من الثواني إلى سلسلة أكثر قابلية للقراءة مثل "2 minutes ago". يمكن للمكتبة تنسيق البيانات بعدة طرق ، بما في ذلك تنسيق الأرقام بفاصلات وتحويل الطوابع الزمنية إلى أوقات نسبية والمزيد.

غالبًا ما أستخدم الأعداد الصحيحة والطوابع الزمنية لمشاريع هندسة البيانات الخاصة بي.

تركيب
! نقطة تثبيت أنسنة
مثال (عدد صحيح)
# استيراد مكتبة استيراد الطابع البشري للوقت والوقت كـ dt # تنسيق الأرقام مع الفاصلة a = humanize.intcomma (951009) # تحويل الأرقام إلى كلمات b = humanize.intword (10046328394) #printing print (a) print (b)
الناتج
مثال (التاريخ والوقت)
استيراد تاريخ الاستيراد البشري والوقت كما dt a = humanize.naturaldate (dt.date (2012، 6، 5)) b = humanize.naturalday (dt.date (2012، 6، 5)) print (a) print (b)

Ercole Palmeri

النشرة الإخبارية
لا تفوّت أهم أخبار الابتكار. قم بالتسجيل لتلقيهم عن طريق البريد الإلكتروني.
الوسوم (تاج): الثعبان

المقالات الأخيرة

يوقع الناشرون وOpenAI اتفاقيات لتنظيم تدفق المعلومات التي تتم معالجتها بواسطة الذكاء الاصطناعي

أعلنت صحيفة فاينانشيال تايمز يوم الاثنين الماضي عن صفقة مع OpenAI. "فاينانشيال تايمز" ترخص صحافتها ذات المستوى العالمي...

أبريل 30 2024

المدفوعات عبر الإنترنت: إليك كيف تجعلك خدمات البث تدفع إلى الأبد

يدفع الملايين من الأشخاص مقابل خدمات البث، ويدفعون رسوم الاشتراك الشهرية. من الشائع أنك…

أبريل 29 2024

يتميز Veeam بالدعم الأكثر شمولاً لبرامج الفدية، بدءًا من الحماية وحتى الاستجابة والاسترداد

سوف تستمر شركة Coveware by Veeam في تقديم خدمات الاستجابة لحوادث الابتزاز السيبراني. ستوفر Coveware إمكانات الطب الشرعي والمعالجة...

أبريل 23 2024

الثورة الخضراء والرقمية: كيف تعمل الصيانة التنبؤية على تغيير صناعة النفط والغاز

تُحدث الصيانة التنبؤية ثورة في قطاع النفط والغاز، من خلال اتباع نهج مبتكر واستباقي لإدارة المحطات.

أبريل 22 2024

اقرأ الابتكار بلغتك

النشرة الإخبارية
لا تفوّت أهم أخبار الابتكار. قم بالتسجيل لتلقيهم عن طريق البريد الإلكتروني.

تابعنا