Maqolalar

Ajoyib, ammo kam ma'lum bo'lgan Python kutubxonalari

Python dasturchisi har doim yangi kutubxonalarni qidiradi, bu esa ma'lumotlar muhandisligi va biznes razvedkasi loyihalarida ishlashni yaxshilaydi.

Ushbu maqolada biz kam ma'lum bo'lgan, ammo juda foydali python kutubxonalarini ko'ramiz:

1. Sarkaç

Ko'pgina kutubxonalar mavjud bo'lsa-da Python DateTime uchun men Pendulumni istalgan sana operatsiyasida ishlatishni oson deb bilaman. Mayatnik - bu ishda kundalik foydalanishim uchun eng sevimli kitob javonim. O'rnatilgan Python datetime modulini kengaytirib, vaqt zonalarini boshqarish va vaqt oraliqlarini qo'shish, sanalarni ayirish va vaqt zonalari o'rtasida konvertatsiya qilish kabi sana va vaqt operatsiyalarini bajarish uchun yanada intuitiv API qo'shadi. Sana va vaqtlarni formatlash uchun oddiy va intuitiv API taqdim etadi.

O'rnatish
!pip install pendulum
misol
# import library

import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
 
#local() creates datetime instance with local timezone

local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)

# Printing UTC time

utc = pendulum.now('UTC')
print("Current UTC time:", utc)
 
# Converting UTC timezone into Europe/Paris time

europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
chiqish

2. ftfy

Ma'lumotlarda chet tili to'g'ri ko'rsatilmaganiga duch keldingizmi? Bu Mojibake deb ataladi. Mojibake - bu kodlash yoki dekodlash muammolari natijasida yuzaga keladigan buzilgan yoki shifrlangan matnni tasvirlash uchun ishlatiladigan atama. Bu odatda bitta belgi kodlash bilan yozilgan matn boshqa kodlash yordamida noto'g'ri dekodlanganda sodir bo'ladi. Ftfy python kutubxonasi NLP foydalanish holatlarida juda foydali bo'lgan Mojibake-ni tuzatishga yordam beradi.

O'rnatish
!pip install ftfy
misol
print(ftfy.fix_text('Gapni “ftfyâ€\x9d yordamida toʻgʻrilang.')) print(ftfy.fix_text('✔ Matnda muammo yoʻq')) print(ftfy.fix_text('à perturber la réflexion) '))
chiqish

Mojibake-ga qo'shimcha ravishda, ftfy noto'g'ri kodlashlar, noto'g'ri chiziq oxiri va yomon tirnoqlarni tuzatadi. Quyidagi kodlashlardan biri sifatida dekodlangan matnni tushunishi mumkin:

  • Lotin-1 (ISO-8859-1)
  • Windows-1252 (cp1252 — Microsoft mahsulotlarida ishlatiladi)
  • Windows-1251 (cp1251 - cp1252 ruscha versiyasi)
  • Windows-1250 (cp1250 - cp1252 ning Sharqiy Yevropa versiyasi)
  • ISO-8859–2 (bu Windows-1250 bilan mutlaqo bir xil emas)
  • MacRoman (Mac OS 9 va undan oldingi versiyalarida ishlatiladi)
  • cp437 (MS-DOS va Windows buyruq satrining ba'zi versiyalarida ishlatiladi)

3. Eskiz

Sketch - bu Python-da pandalar kutubxonasi bilan ishlaydigan foydalanuvchilar uchun maxsus ishlab chiqilgan noyob AI kodlash yordamchisi. U foydalanuvchi ma'lumotlari kontekstini tushunish uchun mashinani o'rganish algoritmlaridan foydalanadi va ma'lumotlarni manipulyatsiya qilish va tahlil qilish vazifalarini oson va samaraliroq qilish uchun tegishli kod takliflarini beradi. Sketch foydalanuvchilardan o'z IDE-ga qo'shimcha plaginlarni o'rnatishni talab qilmaydi, bu uni tez va oson ishlatish imkonini beradi. Bu ma'lumotlar bilan bog'liq vazifalar uchun zarur bo'lgan vaqt va kuchni sezilarli darajada qisqartirishi va foydalanuvchilarga yaxshiroq, samaraliroq kod yozishga yordam berishi mumkin.

O'rnatish
!pip o'rnatish eskizi
misol

Ushbu kutubxonadan foydalanish uchun pandas dataframe-ga .sketch kengaytmasini qo‘shishimiz kerak.

.sketch.ask

so'rang foydalanuvchilarga tabiiy til formatida o'z ma'lumotlari haqida savollar berish imkonini beruvchi Sketch xususiyatidir. Foydalanuvchi so'roviga matn asosida javob beradi.

# Kutubxonalarni import qilish pandalarning eskizini pd sifatida import qiladi # Maʼlumotlarni oʻqish (misol sifatida Twitter maʼlumotlaridan foydalanish) df = pd.read_csv("tweets.csv") print(df)
# Qaysi ustunlar turkum turi ekanligini soʻrash df.sketch.ask (“Qaysi ustunlar turkum turi?”)
chiqish
# Dataframe shaklini topish uchun df.sketch.ask("Dataframening shakli qanday")

.sketch.howto

qanday ma'lumotlar bilan bog'liq turli vazifalar uchun boshlang'ich yoki tugatish nuqtasi sifatida ishlatilishi mumkin bo'lgan kod blokini taqdim etuvchi xususiyatdir. Biz ularning ma'lumotlarini normallashtirish, yangi xususiyatlarni yaratish, ma'lumotlarni kuzatish va hatto modellarni yaratish uchun kod parchalarini so'rashimiz mumkin. Bu vaqtni tejaydi va kodni nusxalash va joylashtirishni osonlashtiradi; kodni noldan qo'lda yozishingiz shart emas.

# Tuyg'ularni ko'rish uchun kesilgan kodni taqdim etishni so'rash df.sketch.howto("Tuyg'ularni vizualizatsiya qilish")
chiqish

.sketch.apply

.apply funksiyasi u yangi xususiyatlarni yaratish, maydonlarni tahlil qilish va boshqa ma'lumotlarni manipulyatsiya qilishda yordam beradi. Ushbu xususiyatdan foydalanish uchun bizda OpenAI hisobi bo'lishi va vazifalarni bajarish uchun API kalitidan foydalanish kerak. Men bu xususiyatni sinab ko'rmadim.

Bu kutubxonadan foydalanish menga juda yoqdi, ayniqsa kelib u ishlaydi va men buni foydali deb bilaman.

4. pgeokod

"Pgeocode" - bu men yaqinda qoqilgan ajoyib kutubxona bo'lib, u mening fazoviy tahlil loyihalarim uchun juda foydali bo'ldi. Masalan, bu sizga ikkita pochta indekslari orasidagi masofani topish imkonini beradi va mamlakat va pochta indeksini kiritish orqali geografik ma'lumotlarni taqdim etadi.

O'rnatish
!pip o'rnatish pgeocode
misol

Muayyan pochta indekslari uchun geografik ma'lumotlarni oling

# "Hindiston" nomli davlat tekshirilmoqda nomi = pgeocode.Nominatim('In') # nomi.query_postal_code (["620018", "620017", "620012"]) pochta indekslarini o'tkazish orqali geoma'lumot olish
chiqish

"Pgeocode" ikki pochta indekslari orasidagi masofani mamlakat va pochta indekslarini kiritish sifatida hisoblab chiqadi. Natija kilometrlarda ifodalanadi.

# Ikki pochta indekslari orasidagi masofani topish masofa = pgeocode.GeoDistance('In') distance.query_postal_code("620018", "620012")
chiqish

5. rembg

rembg - bu rasmlardan fonni osongina olib tashlaydigan yana bir foydali kutubxona.

O'rnatish
!pip install rembg
misol
# Kutubxonalarni import qilish
rembg import dan import cv2 ni olib tashlash # kirish tasvirining yo'li (mening faylim: image.jpeg) input_path = 'image.jpeg' # chiqish tasvirini saqlash va chiqish sifatida saqlash yo'li.jpeg output_path = 'output.jpeg' # Kirishni o'qish tasvir kiritish = cv2.imread(input_path) # Fon chiqishini olib tashlash = olib tashlash(kirish) # cv2.imwrite faylini saqlash (chiqish_yoʻli, chiqish)
chiqish

Siz ushbu kutubxonalarning ba'zilari bilan allaqachon tanish bo'lishingiz mumkin, ammo men uchun Sketch, Pendulum, pgeocode va ftfy ma'lumotlar muhandisligi ishim uchun ajralmasdir. Loyihalarimda ularga ko‘p ishonaman.

6. Insoniylashtirish

Insoniylashtirish” raqamlar, sanalar va vaqtlar uchun oddiy, o‘qilishi oson string formatlashni ta’minlaydi. Kutubxonaning maqsadi ma'lumotlarni olish va uni yanada qulayroq qilishdir, masalan, bir necha soniyalarni "2 daqiqa oldin" kabi o'qilishi mumkin bo'lgan qatorga aylantirish orqali. Kutubxona ma'lumotlarni turli yo'llar bilan formatlashi mumkin, jumladan raqamlarni vergul bilan formatlash, vaqt belgilarini nisbiy vaqtga aylantirish va boshqalar.

Men ko'pincha ma'lumotlar muhandisligi loyihalarim uchun butun sonlar va vaqt belgilaridan foydalanaman.

O'rnatish
!pip install humanize
Misol (butun sonlar)
# Kutubxonani import qilish import sana vaqtini dt sifatida insoniylashtirish # Raqamlarni vergul bilan formatlash a = humanize.intcomma(951009) # raqamlarni so'zlarga aylantirish b = humanize.intword(10046328394) #chop etish (a) chop etish(b)
chiqish
Misol (sana va vaqt)
import humanize import datetime as dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) print(a) print(b)

Ercole Palmeri

Innovatsion axborot byulleteni
Innovatsiyalar haqidagi eng muhim yangiliklarni o'tkazib yubormang. Ularni elektron pochta orqali olish uchun ro'yxatdan o'ting.
Tags: python

So'nggi maqolalar

Bolalar uchun sahifalarni bo'yashning afzalliklari - barcha yoshdagilar uchun sehrli dunyo

Rang berish orqali nozik vosita ko'nikmalarini rivojlantirish bolalarni yozish kabi murakkabroq ko'nikmalarga tayyorlaydi. Rang berish uchun…

2 may 2024

Kelajak bu yerda: Yuk tashish sanoati global iqtisodiyotni qanday inqilob qilmoqda

Harbiy dengiz sektori 150 milliardlik bozorga yo'l olgan haqiqiy global iqtisodiy kuchdir...

1 may 2024

Noshirlar va OpenAI sun'iy intellekt tomonidan qayta ishlangan ma'lumotlar oqimini tartibga solish bo'yicha shartnomalar imzolaydilar.

O'tgan dushanba kuni Financial Times OpenAI bilan shartnoma imzolaganini e'lon qildi. FT o'zining jahon darajasidagi jurnalistikasini litsenziyalaydi...

30 Aprel 2024

Onlayn to'lovlar: Streaming xizmatlari sizni qanday qilib abadiy to'lashga majbur qiladi

Millionlab odamlar oylik abonent to'lovlarini to'lab, oqim xizmatlari uchun to'laydilar. Umumiy fikr, siz ...

29 Aprel 2024