Katika nakala hii tunaona maktaba zisizojulikana sana, lakini muhimu sana za python:
Ingawa maktaba nyingi zinapatikana ndani Chatu kwa DateTime, napata Pendulum rahisi kutumia kwenye operesheni yoyote ya tarehe. Pendulum ni kabati ninalopenda zaidi la matumizi ya kila siku kazini. Hurefusha moduli ya tarehe ya Python iliyojengewa ndani, na kuongeza API angavu zaidi ya kudhibiti maeneo ya saa na kutekeleza shughuli za tarehe na saa kama vile kuongeza vipindi vya muda, kupunguza tarehe na kubadilisha kati ya saa za eneo. Hutoa API rahisi na angavu ya kupanga tarehe na nyakati.
!pip install pendulum
# import library
import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
#local() creates datetime instance with local timezone
local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)
# Printing UTC time
utc = pendulum.now('UTC')
print("Current UTC time:", utc)
# Converting UTC timezone into Europe/Paris time
europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
Umekutana na wakati lugha ya kigeni kwenye data haionekani kwa usahihi? Hii inaitwa Mojibake. Mojibake ni neno linalotumiwa kuelezea maandishi yaliyoharibika au yaliyochapwa ambayo hutokea kwa sababu ya matatizo ya usimbaji au usimbaji. Kwa kawaida hutokea wakati maandishi yaliyoandikwa na usimbaji wa herufi moja yanapotolewa msimbo kimakosa kwa kutumia usimbaji tofauti. Maktaba ya ftfy python itakusaidia kurekebisha Mojibake, ambayo ni muhimu sana katika kesi za utumiaji wa NLP.
!pip install ftfy
print(ftfy.fix_text('Sahihisha sentensi ukitumia “ftfyâ€\x9d.')) print(ftfy.fix_text('✔ Hakuna matatizo na maandishi')) print(ftfy.fix_text('à perturber la réflexion '))
Kando na Mojibake, ftfy itarekebisha usimbaji mbaya, miisho mibaya ya laini na nukuu mbaya. inaweza kuelewa maandishi ambayo yamesimbuliwa kama mojawapo ya usimbaji ufuatao:
Mchoro ni msaidizi wa kipekee wa uandishi wa AI iliyoundwa mahsusi kwa watumiaji wanaofanya kazi na maktaba ya pandas huko Python. Inatumia algoriti za kujifunza kwa mashine ili kuelewa muktadha wa data ya mtumiaji na hutoa mapendekezo ya msimbo husika ili kufanya uchezeshaji na kazi za uchambuzi kuwa rahisi na ufanisi zaidi. Mchoro hauhitaji watumiaji kusakinisha programu-jalizi zozote za ziada kwenye IDE zao, na kuifanya iwe ya haraka na rahisi kutumia. Hili linaweza kupunguza kwa kiasi kikubwa muda na juhudi zinazohitajika kwa kazi zinazohusiana na data na kusaidia watumiaji kuandika nambari bora zaidi na bora zaidi.
!mchoro wa kusakinisha bomba
Tunahitaji kuongeza kiendelezi cha .sketch kwenye mfumo wa data wa panda ili kutumia maktaba hii.
kuuliza ni kipengele cha Mchoro ambacho huruhusu watumiaji kuuliza maswali kuhusu data zao katika umbizo la lugha asilia. Hutoa majibu kulingana na maandishi kwa swali la mtumiaji.
# Kuagiza maktaba kuagiza panda za mchoro kama pd # Kusoma data (kwa kutumia data ya twitter kama mfano) df = pd.read_csv("tweets.csv") print(df)
# Kuuliza ni safu wima zipi ni aina ya kategoria df.sketch.ask("Safu zipi ni za aina ya kategoria?")
# Ili kupata umbo la mfumo wa data df.sketch.ask("Umbo la mfumo wa data ni nini")
.mchoro.jinsi
howto ni kipengele kinachotoa kizuizi cha msimbo ambacho kinaweza kutumika kama mahali pa kuanzia au kumalizia kwa kazi mbalimbali zinazohusiana na data. Tunaweza kuomba vijisehemu vya msimbo ili kurekebisha data zao, kuunda vipengele vipya, kufuatilia data na hata kuunda miundo. Hii itaokoa muda na kurahisisha kunakili na kubandika msimbo; sio lazima uandike nambari hiyo kwa mikono kutoka mwanzo.
# Kuuliza kutoa msimbo uliochorwa kwa taswira ya hisia df.sketch.howto("Taswira ya hisia")
.mchoro.tumia
Kitendaji cha .apply inasaidia kuzalisha vipengele vipya, kuchanganua nyuga, na kufanya upotoshaji mwingine wa data. Ili kutumia kipengele hiki, tunahitaji kuwa na akaunti ya OpenAI na kutumia ufunguo wa API kutekeleza majukumu. Sijajaribu kipengele hiki.
Nilifurahia kutumia maktaba hii, hasa Kuja inafanya kazi, na ninaona inafaa.
"pgeocode" ni maktaba bora ambayo nilijikwaa hivi majuzi ambayo imekuwa muhimu sana kwa miradi yangu ya uchambuzi wa anga. Kwa mfano, hukuruhusu kupata umbali kati ya misimbo miwili ya posta na kutoa maelezo ya kijiografia kwa kuchukua nchi na msimbo wa posta kama ingizo.
!pip sakinisha pgeocode
Pata maelezo ya kijiografia kwa misimbo mahususi ya posta
# Inatafuta nchi "India" nomi = pgeocode.Nominatim('Katika') # Kupata maelezo ya kijiografia kwa kupitisha misimbo ya posta nomi.query_postal_code(["620018", "620017", "620012"])
"pgeocode" hukokotoa umbali kati ya misimbo miwili ya posta kwa kuchukua nchi na misimbo kama ingizo. Matokeo yanaonyeshwa kwa kilomita.
# Kupata umbali kati ya misimbo miwili umbali = pgeocode.GeoDistance('In') distance.query_postal_code("620018", "620012")
rembg ni maktaba nyingine muhimu ambayo huondoa mandharinyuma kwa urahisi kutoka kwa picha.
!pip install rembg
# Kuagiza maktaba
kutoka kwa uingizaji wa rembg ondoa kuingiza cv2 # njia ya picha ya ingizo (faili langu: image.jpeg) input_path = 'image.jpeg' # njia ya kuhifadhi picha ya pato na kuhifadhi kama matokeo.jpeg output_path = 'output.jpeg' # Kusoma ingizo ingizo la picha = cv2.imread(input_path) # Kuondoa pato la usuli = ondoa(input) # Kuhifadhi faili cv2.imwrite(output_path, output)
Huenda tayari unafahamu baadhi ya maktaba hizi, lakini kwangu, Mchoro, Pendulum, pgeocode, na ftfy ni muhimu sana kwa kazi yangu ya uhandisi wa data. Ninawategemea sana kwa miradi yangu.
Humanize” hutoa umbizo la kamba rahisi na rahisi kusoma kwa nambari, tarehe na nyakati. Lengo la maktaba ni kuchukua data na kuifanya ifae watumiaji zaidi, kwa mfano kwa kubadilisha idadi ya sekunde kuwa mfuatano unaosomeka zaidi kama "dakika 2 zilizopita". Maktaba inaweza kufomati data kwa njia mbalimbali, ikiwa ni pamoja na kuumbiza nambari kwa koma, kubadilisha mihuri ya muda hadi saa linganishi, na zaidi.
Mara nyingi mimi hutumia nambari kamili na mihuri ya muda kwa miradi yangu ya uhandisi wa data.
!pip install humanize
# Kuagiza maktaba kuagiza kuagiza tarehe kama dt # Kupanga nambari kwa koma a = humanize.intcomma(951009) # kubadilisha nambari kuwa maneno b = humanize.intword(10046328394) #printing print(a) print(b)
agiza ubinadamu wa tarehe ya kuagiza kama dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) chapa(a) chapa(b)
Ercole Palmeri
Jumatatu iliyopita, Financial Times ilitangaza makubaliano na OpenAI. FT inatoa leseni kwa uandishi wake wa habari wa kiwango cha kimataifa…
Mamilioni ya watu hulipia huduma za utiririshaji, kulipa ada za usajili za kila mwezi. Ni maoni ya kawaida kwamba wewe…
Coveware by Veeam itaendelea kutoa huduma za kukabiliana na matukio ya ulaghai mtandaoni. Coveware itatoa uwezo wa uchunguzi na urekebishaji…
Matengenezo ya kitabiri yanaleta mapinduzi katika sekta ya mafuta na gesi, kwa mbinu bunifu na makini ya usimamizi wa mitambo.…