Ing artikel iki, kita ndeleng sawetara perpustakaan python sing ora dingerteni, nanging migunani banget:
Senajan akeh perpustakaan kasedhiya ing Python kanggo DateTime, Aku golek Pendulum gampang kanggo nggunakake ing sembarang operasi tanggal. Pendulum minangka lemari buku favorit kanggo panggunaan saben dina ing kantor. Ngluwihi modul datetime Python sing dibangun, nambah API sing luwih intuisi kanggo ngatur zona wektu lan nindakake operasi tanggal lan wektu kayata nambah interval wektu, nyuda tanggal, lan ngowahi antarane zona wektu. Nyedhiyakake API sing prasaja lan intuisi kanggo format tanggal lan wektu.
!pip install pendulum
# import library
import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
#local() creates datetime instance with local timezone
local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)
# Printing UTC time
utc = pendulum.now('UTC')
print("Current UTC time:", utc)
# Converting UTC timezone into Europe/Paris time
europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
Apa sampeyan nemokake nalika basa manca ing data ora katon kanthi bener? Iki diarani Mojibake. Mojibake minangka istilah sing digunakake kanggo njlèntrèhaké teks sing kacau utawa scrambled sing kedadeyan minangka akibat saka masalah enkoding utawa dekoding. Biasane kedadeyan nalika teks sing ditulis nganggo enkoding siji karakter ora didekode kanthi nggunakake enkoding sing beda. Pustaka python ftfy bakal mbantu sampeyan ndandani Mojibake, sing migunani banget ing kasus panggunaan NLP.
!pip nginstal ftfy
print(ftfy.fix_text('Mbenerake ukara nganggo “ftfyâ€\x9d.')) print(ftfy.fix_text('✔ Ora ana masalah karo teks')) print(ftfy.fix_text('à perturber la réflexion '))
Saliyane Mojibake, ftfy bakal ndandani enkoding ala, ending baris sing ora apik, lan kuotasi sing ala. bisa ngerti teks sing wis decoded minangka salah siji saka enkoding ing ngisor iki:
Sketch minangka asisten coding AI unik sing dirancang khusus kanggo pangguna sing nggarap perpustakaan panda ing Python. Iki nggunakake algoritma pembelajaran mesin kanggo mangerteni konteks data pangguna lan menehi saran kode sing cocog kanggo nggawe tugas manipulasi lan analisis data luwih gampang lan efisien. Sketsa ora mbutuhake pangguna nginstal plug-in tambahan ing IDE, dadi cepet lan gampang digunakake. Iki bisa nyuda wektu lan gaweyan sing dibutuhake kanggo tugas sing gegandhengan karo data lan mbantu pangguna nulis kode sing luwih apik lan efisien.
!pip nginstal sketsa
We kudu nambah extension .sketsa kanggo pandas dataframe kanggo nggunakake perpustakaan iki.
Takon minangka fitur Sketsa sing ngidini pangguna takon babagan data ing format basa alami. Nyedhiyakake tanggepan adhedhasar teks kanggo pitakon pangguna.
# Ngimpor perpustakaan ngimpor sketsa ngimpor panda minangka pd # Maca data (nggunakake data twitter minangka conto) df = pd.read_csv("tweets.csv") print(df)
# Takon kolom endi sing dadi jinis kategori df.sketch.ask("Kolom sing dadi jinis kategori?")
# Kanggo nemokake wangun dataframe df.sketch.ask("Apa wangun dataframe")
.sketsa.carane
carane minangka fitur sing nyedhiyakake blok kode sing bisa digunakake minangka titik wiwitan utawa pungkasan kanggo macem-macem tugas sing gegandhengan karo data. Kita bisa njaluk potongan kode kanggo normalake data, nggawe fitur anyar, nglacak data, lan malah nggawe model. Iki bakal ngirit wektu lan nggawe gampang nyalin lan nempel kode kasebut; sampeyan ora kudu nulis kode kanthi manual saka awal.
# Njaluk menehi kode sing dipotong kanggo nggambarake emosi df.sketch.howto("Visualize emosi")
.sketsa.nglamar
Fungsi .apply mbantu ngasilake fitur anyar, ngurai kolom, lan nindakake manipulasi data liyane. Kanggo nggunakake fitur iki, kita kudu duwe akun OpenAI lan nggunakake tombol API kanggo nindakake tugas. Aku durung nyoba fitur iki.
Aku seneng nggunakake perpustakaan iki, utamane teka kerjane, lan aku golek migunani.
"pgeocode" minangka perpustakaan sing apik banget sing bubar aku kesandhung sing migunani banget kanggo proyek analisis spasial. Contone, ngidini sampeyan nemokake jarak antarane rong kode pos lan menehi informasi geografis kanthi njupuk negara lan kode pos minangka input.
!pip nginstal pgeocode
Entuk informasi geografis kanggo kode pos tartamtu
# Priksa negara "India" nomi = pgeocode.Nominatim('In') # Njupuk informasi geo kanthi ngirim kode pos nomi.query_postal_code(["620018", "620017", "620012"])
"pgeocode" ngitung jarak antarane rong kode pos kanthi njupuk negara lan kode pos minangka input. Asil kasebut dituduhake ing kilometer.
# Nemokake jarak antarane rong kode pos jarak = pgeocode.GeoDistance('In') distance.query_postal_code("620018", "620012")
rembg minangka perpustakaan migunani liyane sing gampang mbusak latar mburi saka gambar.
!pip nginstal rembg
# Ngimpor perpustakaan
saka rembg ngimpor mbusak cv2 ngimpor # path gambar input (file sandi: image.jpeg) input_path = 'image.jpeg' # path kanggo nyimpen gambar output lan nyimpen minangka output.jpeg output_path = 'output.jpeg' # Maca input input gambar = cv2.imread(input_path) # Mbusak output latar mburi = mbusak (input) # Nyimpen file cv2.imwrite(output_path, output)
Sampeyan bisa uga wis kenal karo sawetara perpustakaan iki, nanging kanggo aku, Sketch, Pendulum, pgeocode, lan ftfy pancen penting kanggo karya teknik data. Aku gumantung banget kanggo proyekku.
Humanize" nyedhiyakake format string sing prasaja lan gampang diwaca kanggo nomer, tanggal, lan wektu. Tujuan saka perpustakaan yaiku njupuk data lan nggawe luwih gampang pangguna, contone kanthi ngowahi sawetara detik dadi senar sing luwih bisa diwaca kaya "2 menit kepungkur". Pustaka bisa ngowahi format data kanthi macem-macem cara, kalebu ngowahi format angka nganggo koma, ngowahi cap wektu dadi wektu relatif, lan liya-liyane.
Aku kerep nggunakake integer lan cap wektu kanggo proyek rekayasa data.
!pip nginstal humanize
# Ngimpor perpustakaan ngimpor humanize import datetime minangka dt # Format angka nganggo koma a = humanize.intcomma(951009) # ngowahi angka dadi tembung b = humanize.intword(10046328394) #printing print(a) print(b)
import humanize import datetime as dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) print(a) print(b)
Ercole Palmeri
Sektor angkatan laut minangka kekuwatan ekonomi global sing sejatine, sing wis ngarahake pasar 150 milyar ...
Senin kepungkur, Financial Times ngumumake kesepakatan karo OpenAI. FT menehi lisensi jurnalisme kelas donya…
Mayuta-yuta wong mbayar layanan streaming, mbayar biaya langganan saben wulan. Umume pendapat yen sampeyan…
Coveware dening Veeam bakal terus nyedhiyakake layanan respon insiden pemerasan cyber. Coveware bakal nawakake kemampuan forensik lan remediasi…