Ushbu maqolada biz kam ma'lum bo'lgan, ammo juda foydali python kutubxonalarini ko'ramiz:
Ko'pgina kutubxonalar mavjud bo'lsa-da Python DateTime uchun men Pendulumni istalgan sana operatsiyasida ishlatishni oson deb bilaman. Mayatnik - bu ishda kundalik foydalanishim uchun eng sevimli kitob javonim. O'rnatilgan Python datetime modulini kengaytirib, vaqt zonalarini boshqarish va vaqt oraliqlarini qo'shish, sanalarni ayirish va vaqt zonalari o'rtasida konvertatsiya qilish kabi sana va vaqt operatsiyalarini bajarish uchun yanada intuitiv API qo'shadi. Sana va vaqtlarni formatlash uchun oddiy va intuitiv API taqdim etadi.
!pip install pendulum
# import library
import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
#local() creates datetime instance with local timezone
local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)
# Printing UTC time
utc = pendulum.now('UTC')
print("Current UTC time:", utc)
# Converting UTC timezone into Europe/Paris time
europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
Ma'lumotlarda chet tili to'g'ri ko'rsatilmaganiga duch keldingizmi? Bu Mojibake deb ataladi. Mojibake - bu kodlash yoki dekodlash muammolari natijasida yuzaga keladigan buzilgan yoki shifrlangan matnni tasvirlash uchun ishlatiladigan atama. Bu odatda bitta belgi kodlash bilan yozilgan matn boshqa kodlash yordamida noto'g'ri dekodlanganda sodir bo'ladi. Ftfy python kutubxonasi NLP foydalanish holatlarida juda foydali bo'lgan Mojibake-ni tuzatishga yordam beradi.
!pip install ftfy
print(ftfy.fix_text('Gapni “ftfyâ€\x9d yordamida toʻgʻrilang.')) print(ftfy.fix_text('✔ Matnda muammo yoʻq')) print(ftfy.fix_text('à perturber la réflexion) '))
Mojibake-ga qo'shimcha ravishda, ftfy noto'g'ri kodlashlar, noto'g'ri chiziq oxiri va yomon tirnoqlarni tuzatadi. Quyidagi kodlashlardan biri sifatida dekodlangan matnni tushunishi mumkin:
Sketch - bu Python-da pandalar kutubxonasi bilan ishlaydigan foydalanuvchilar uchun maxsus ishlab chiqilgan noyob AI kodlash yordamchisi. U foydalanuvchi ma'lumotlari kontekstini tushunish uchun mashinani o'rganish algoritmlaridan foydalanadi va ma'lumotlarni manipulyatsiya qilish va tahlil qilish vazifalarini oson va samaraliroq qilish uchun tegishli kod takliflarini beradi. Sketch foydalanuvchilardan o'z IDE-ga qo'shimcha plaginlarni o'rnatishni talab qilmaydi, bu uni tez va oson ishlatish imkonini beradi. Bu ma'lumotlar bilan bog'liq vazifalar uchun zarur bo'lgan vaqt va kuchni sezilarli darajada qisqartirishi va foydalanuvchilarga yaxshiroq, samaraliroq kod yozishga yordam berishi mumkin.
!pip o'rnatish eskizi
Ushbu kutubxonadan foydalanish uchun pandas dataframe-ga .sketch kengaytmasini qo‘shishimiz kerak.
so'rang foydalanuvchilarga tabiiy til formatida o'z ma'lumotlari haqida savollar berish imkonini beruvchi Sketch xususiyatidir. Foydalanuvchi so'roviga matn asosida javob beradi.
# Kutubxonalarni import qilish pandalarning eskizini pd sifatida import qiladi # Maʼlumotlarni oʻqish (misol sifatida Twitter maʼlumotlaridan foydalanish) df = pd.read_csv("tweets.csv") print(df)
# Qaysi ustunlar turkum turi ekanligini soʻrash df.sketch.ask (“Qaysi ustunlar turkum turi?”)
# Dataframe shaklini topish uchun df.sketch.ask("Dataframening shakli qanday")
.sketch.howto
qanday ma'lumotlar bilan bog'liq turli vazifalar uchun boshlang'ich yoki tugatish nuqtasi sifatida ishlatilishi mumkin bo'lgan kod blokini taqdim etuvchi xususiyatdir. Biz ularning ma'lumotlarini normallashtirish, yangi xususiyatlarni yaratish, ma'lumotlarni kuzatish va hatto modellarni yaratish uchun kod parchalarini so'rashimiz mumkin. Bu vaqtni tejaydi va kodni nusxalash va joylashtirishni osonlashtiradi; kodni noldan qo'lda yozishingiz shart emas.
# Tuyg'ularni ko'rish uchun kesilgan kodni taqdim etishni so'rash df.sketch.howto("Tuyg'ularni vizualizatsiya qilish")
.sketch.apply
.apply funksiyasi u yangi xususiyatlarni yaratish, maydonlarni tahlil qilish va boshqa ma'lumotlarni manipulyatsiya qilishda yordam beradi. Ushbu xususiyatdan foydalanish uchun bizda OpenAI hisobi bo'lishi va vazifalarni bajarish uchun API kalitidan foydalanish kerak. Men bu xususiyatni sinab ko'rmadim.
Bu kutubxonadan foydalanish menga juda yoqdi, ayniqsa kelib u ishlaydi va men buni foydali deb bilaman.
"Pgeocode" - bu men yaqinda qoqilgan ajoyib kutubxona bo'lib, u mening fazoviy tahlil loyihalarim uchun juda foydali bo'ldi. Masalan, bu sizga ikkita pochta indekslari orasidagi masofani topish imkonini beradi va mamlakat va pochta indeksini kiritish orqali geografik ma'lumotlarni taqdim etadi.
!pip o'rnatish pgeocode
Muayyan pochta indekslari uchun geografik ma'lumotlarni oling
# "Hindiston" nomli davlat tekshirilmoqda nomi = pgeocode.Nominatim('In') # nomi.query_postal_code (["620018", "620017", "620012"]) pochta indekslarini o'tkazish orqali geoma'lumot olish
"Pgeocode" ikki pochta indekslari orasidagi masofani mamlakat va pochta indekslarini kiritish sifatida hisoblab chiqadi. Natija kilometrlarda ifodalanadi.
# Ikki pochta indekslari orasidagi masofani topish masofa = pgeocode.GeoDistance('In') distance.query_postal_code("620018", "620012")
rembg - bu rasmlardan fonni osongina olib tashlaydigan yana bir foydali kutubxona.
!pip install rembg
# Kutubxonalarni import qilish
rembg import dan import cv2 ni olib tashlash # kirish tasvirining yo'li (mening faylim: image.jpeg) input_path = 'image.jpeg' # chiqish tasvirini saqlash va chiqish sifatida saqlash yo'li.jpeg output_path = 'output.jpeg' # Kirishni o'qish tasvir kiritish = cv2.imread(input_path) # Fon chiqishini olib tashlash = olib tashlash(kirish) # cv2.imwrite faylini saqlash (chiqish_yoʻli, chiqish)
Siz ushbu kutubxonalarning ba'zilari bilan allaqachon tanish bo'lishingiz mumkin, ammo men uchun Sketch, Pendulum, pgeocode va ftfy ma'lumotlar muhandisligi ishim uchun ajralmasdir. Loyihalarimda ularga ko‘p ishonaman.
Insoniylashtirish” raqamlar, sanalar va vaqtlar uchun oddiy, o‘qilishi oson string formatlashni ta’minlaydi. Kutubxonaning maqsadi ma'lumotlarni olish va uni yanada qulayroq qilishdir, masalan, bir necha soniyalarni "2 daqiqa oldin" kabi o'qilishi mumkin bo'lgan qatorga aylantirish orqali. Kutubxona ma'lumotlarni turli yo'llar bilan formatlashi mumkin, jumladan raqamlarni vergul bilan formatlash, vaqt belgilarini nisbiy vaqtga aylantirish va boshqalar.
Men ko'pincha ma'lumotlar muhandisligi loyihalarim uchun butun sonlar va vaqt belgilaridan foydalanaman.
!pip install humanize
# Kutubxonani import qilish import sana vaqtini dt sifatida insoniylashtirish # Raqamlarni vergul bilan formatlash a = humanize.intcomma(951009) # raqamlarni so'zlarga aylantirish b = humanize.intword(10046328394) #chop etish (a) chop etish(b)
import humanize import datetime as dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) print(a) print(b)
Ercole Palmeri
Rang berish orqali nozik vosita ko'nikmalarini rivojlantirish bolalarni yozish kabi murakkabroq ko'nikmalarga tayyorlaydi. Rang berish uchun…
Harbiy dengiz sektori 150 milliardlik bozorga yo'l olgan haqiqiy global iqtisodiy kuchdir...
O'tgan dushanba kuni Financial Times OpenAI bilan shartnoma imzolaganini e'lon qildi. FT o'zining jahon darajasidagi jurnalistikasini litsenziyalaydi...
Millionlab odamlar oylik abonent to'lovlarini to'lab, oqim xizmatlari uchun to'laydilar. Umumiy fikr, siz ...