Artikel

Pustaka Python sing nggumunake, nanging ora pati ngerti

Programmer Python tansah nggoleki perpustakaan anyar, sing bisa nambah karya ing rekayasa data lan proyek intelijen bisnis.

Ing artikel iki, kita ndeleng sawetara perpustakaan python sing ora dingerteni, nanging migunani banget:

1. Pendulum

Senajan akeh perpustakaan kasedhiya ing Python kanggo DateTime, Aku golek Pendulum gampang kanggo nggunakake ing sembarang operasi tanggal. Pendulum minangka lemari buku favorit kanggo panggunaan saben dina ing kantor. Ngluwihi modul datetime Python sing dibangun, nambah API sing luwih intuisi kanggo ngatur zona wektu lan nindakake operasi tanggal lan wektu kayata nambah interval wektu, nyuda tanggal, lan ngowahi antarane zona wektu. Nyedhiyakake API sing prasaja lan intuisi kanggo format tanggal lan wektu.

Instalasi
!pip install pendulum
contone
# import library

import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
 
#local() creates datetime instance with local timezone

local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)

# Printing UTC time

utc = pendulum.now('UTC')
print("Current UTC time:", utc)
 
# Converting UTC timezone into Europe/Paris time

europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
output

2. ftfy

Apa sampeyan nemokake nalika basa manca ing data ora katon kanthi bener? Iki diarani Mojibake. Mojibake minangka istilah sing digunakake kanggo njlèntrèhaké teks sing kacau utawa scrambled sing kedadeyan minangka akibat saka masalah enkoding utawa dekoding. Biasane kedadeyan nalika teks sing ditulis nganggo enkoding siji karakter ora didekode kanthi nggunakake enkoding sing beda. Pustaka python ftfy bakal mbantu sampeyan ndandani Mojibake, sing migunani banget ing kasus panggunaan NLP.

Instalasi
!pip nginstal ftfy
contone
print(ftfy.fix_text('Mbenerake ukara nganggo “ftfyâ€\x9d.')) print(ftfy.fix_text('✔ Ora ana masalah karo teks')) print(ftfy.fix_text('à perturber la réflexion '))
output

Saliyane Mojibake, ftfy bakal ndandani enkoding ala, ending baris sing ora apik, lan kuotasi sing ala. bisa ngerti teks sing wis decoded minangka salah siji saka enkoding ing ngisor iki:

  • Latin-1 (ISO-8859–1)
  • Windows-1252 (cp1252 — digunakake ing produk Microsoft)
  • Windows-1251 (cp1251 — versi Rusia saka cp1252)
  • Windows-1250 (cp1250 — cp1252 versi Eropa Timur)
  • ISO-8859–2 (sing ora persis padha karo Windows-1250)
  • MacRoman (digunakake ing Mac OS 9 lan sadurunge)
  • cp437 (digunakake ing MS-DOS lan sawetara versi command prompt Windows)

3 Gambar

Sketch minangka asisten coding AI unik sing dirancang khusus kanggo pangguna sing nggarap perpustakaan panda ing Python. Iki nggunakake algoritma pembelajaran mesin kanggo mangerteni konteks data pangguna lan menehi saran kode sing cocog kanggo nggawe tugas manipulasi lan analisis data luwih gampang lan efisien. Sketsa ora mbutuhake pangguna nginstal plug-in tambahan ing IDE, dadi cepet lan gampang digunakake. Iki bisa nyuda wektu lan gaweyan sing dibutuhake kanggo tugas sing gegandhengan karo data lan mbantu pangguna nulis kode sing luwih apik lan efisien.

Instalasi
!pip nginstal sketsa
contone

We kudu nambah extension .sketsa kanggo pandas dataframe kanggo nggunakake perpustakaan iki.

.sketsa.takon

Takon minangka fitur Sketsa sing ngidini pangguna takon babagan data ing format basa alami. Nyedhiyakake tanggepan adhedhasar teks kanggo pitakon pangguna.

# Ngimpor perpustakaan ngimpor sketsa ngimpor panda minangka pd # Maca data (nggunakake data twitter minangka conto) df = pd.read_csv("tweets.csv") print(df)
# Takon kolom endi sing dadi jinis kategori df.sketch.ask("Kolom sing dadi jinis kategori?")
output
# Kanggo nemokake wangun dataframe df.sketch.ask("Apa wangun dataframe")

.sketsa.carane

carane minangka fitur sing nyedhiyakake blok kode sing bisa digunakake minangka titik wiwitan utawa pungkasan kanggo macem-macem tugas sing gegandhengan karo data. Kita bisa njaluk potongan kode kanggo normalake data, nggawe fitur anyar, nglacak data, lan malah nggawe model. Iki bakal ngirit wektu lan nggawe gampang nyalin lan nempel kode kasebut; sampeyan ora kudu nulis kode kanthi manual saka awal.

# Njaluk menehi kode sing dipotong kanggo nggambarake emosi df.sketch.howto("Visualize emosi")
output

.sketsa.nglamar

Fungsi .apply mbantu ngasilake fitur anyar, ngurai kolom, lan nindakake manipulasi data liyane. Kanggo nggunakake fitur iki, kita kudu duwe akun OpenAI lan nggunakake tombol API kanggo nindakake tugas. Aku durung nyoba fitur iki.

Aku seneng nggunakake perpustakaan iki, utamane teka kerjane, lan aku golek migunani.

4. pgeocode

"pgeocode" minangka perpustakaan sing apik banget sing bubar aku kesandhung sing migunani banget kanggo proyek analisis spasial. Contone, ngidini sampeyan nemokake jarak antarane rong kode pos lan menehi informasi geografis kanthi njupuk negara lan kode pos minangka input.

Instalasi
!pip nginstal pgeocode
contone

Entuk informasi geografis kanggo kode pos tartamtu

# Priksa negara "India" nomi = pgeocode.Nominatim('In') # Njupuk informasi geo kanthi ngirim kode pos nomi.query_postal_code(["620018", "620017", "620012"])
output

"pgeocode" ngitung jarak antarane rong kode pos kanthi njupuk negara lan kode pos minangka input. Asil kasebut dituduhake ing kilometer.

# Nemokake jarak antarane rong kode pos jarak = pgeocode.GeoDistance('In') distance.query_postal_code("620018", "620012")
output

5. rembg

rembg minangka perpustakaan migunani liyane sing gampang mbusak latar mburi saka gambar.

Instalasi
!pip nginstal rembg
contone
# Ngimpor perpustakaan
saka rembg ngimpor mbusak cv2 ngimpor # path gambar input (file sandi: image.jpeg) input_path = 'image.jpeg' # path kanggo nyimpen gambar output lan nyimpen minangka output.jpeg output_path = 'output.jpeg' # Maca input input gambar = cv2.imread(input_path) # Mbusak output latar mburi = mbusak (input) # Nyimpen file cv2.imwrite(output_path, output)
output

Sampeyan bisa uga wis kenal karo sawetara perpustakaan iki, nanging kanggo aku, Sketch, Pendulum, pgeocode, lan ftfy pancen penting kanggo karya teknik data. Aku gumantung banget kanggo proyekku.

6. Humanize

Humanize" nyedhiyakake format string sing prasaja lan gampang diwaca kanggo nomer, tanggal, lan wektu. Tujuan saka perpustakaan yaiku njupuk data lan nggawe luwih gampang pangguna, contone kanthi ngowahi sawetara detik dadi senar sing luwih bisa diwaca kaya "2 menit kepungkur". Pustaka bisa ngowahi format data kanthi macem-macem cara, kalebu ngowahi format angka nganggo koma, ngowahi cap wektu dadi wektu relatif, lan liya-liyane.

Aku kerep nggunakake integer lan cap wektu kanggo proyek rekayasa data.

Instalasi
!pip nginstal humanize
Tuladha (wilangan bulat)
# Ngimpor perpustakaan ngimpor humanize import datetime minangka dt # Format angka nganggo koma a = humanize.intcomma(951009) # ngowahi angka dadi tembung b = humanize.intword(10046328394) #printing print(a) print(b)
output
Tuladha (tanggal lan wektu)
import humanize import datetime as dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) print(a) print(b)

Ercole Palmeri

newsletter inovasi
Aja kantun warta paling penting babagan inovasi. Mlebu kanggo nampa wong-wong mau liwat email.
Tags: python

Artikel anyar

Masa Depan Iki: Kepiye Industri Pengiriman Revolusi Ekonomi Global

Sektor angkatan laut minangka kekuwatan ekonomi global sing sejatine, sing wis ngarahake pasar 150 milyar ...

1 May 2024

Penerbit lan OpenAI menehi tandha persetujuan kanggo ngatur aliran informasi sing diproses dening Artificial Intelligence

Senin kepungkur, Financial Times ngumumake kesepakatan karo OpenAI. FT menehi lisensi jurnalisme kelas donya…

30 April 2024

Pembayaran Online: Mangkene Kepiye Layanan Streaming Nggawe Sampeyan Mbayar Selawase

Mayuta-yuta wong mbayar layanan streaming, mbayar biaya langganan saben wulan. Umume pendapat yen sampeyan…

29 April 2024

Veeam nduweni dhukungan paling lengkap kanggo ransomware, saka proteksi nganti respon lan pemulihan

Coveware dening Veeam bakal terus nyedhiyakake layanan respon insiden pemerasan cyber. Coveware bakal nawakake kemampuan forensik lan remediasi…

23 April 2024