Yn dit artikel sjogge wy wat min bekende, mar heul nuttige python-biblioteken:
Hoewol in protte bibleteken binne beskikber yn Python foar DateTime, Ik fyn Pendulum maklik te brûken op eltse datum operaasje. In slinger is myn favorite boekekast foar myn deistich gebrûk op it wurk. Wreidet de ynboude Python datetime-module út, it tafoegjen fan in mear yntuïtive API foar it behearen fan tiidsônes en it útfieren fan datum- en tiidoperaasjes, lykas it tafoegjen fan tiidintervallen, it subtrahearjen fan datums en it konvertearjen tusken tiidsônes. Biedt in ienfâldige en yntuïtive API foar opmaak fan datums en tiden.
!pip install pendulum
# import library
import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
#local() creates datetime instance with local timezone
local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)
# Printing UTC time
utc = pendulum.now('UTC')
print("Current UTC time:", utc)
# Converting UTC timezone into Europe/Paris time
europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
Hawwe jo tsjinkommen as de frjemde taal yn 'e gegevens net goed ferskynt? Dit wurdt Mojibake neamd. Mojibake is in term dy't brûkt wurdt foar it beskriuwen fan fersmoarge of ferwurde tekst dy't foarkomt as gefolch fan kodearring of dekodearjen problemen. It komt normaal foar as tekst skreaun mei ien karakterkodearring ferkeard dekodearre wurdt mei in oare kodearring. De ftfy python-bibleteek sil jo helpe om Mojibake te reparearjen, wat heul nuttich is yn gefallen fan NLP-gebrûk.
!pip ynstallearje ftfy
print(ftfy.fix_text('Korrigearje de sin mei “ftfyâ€\x9d.')) print(ftfy.fix_text('âœ" Gjin problemen mei tekst')) print(ftfy.fix_text('à perturber la réflexion '))
Neist Mojibake sil ftfy minne kodearrings, minne line-eindingen en minne quotes reparearje. kin tekst ferstean dy't is dekodearre as ien fan 'e folgjende kodearrings:
Sketch is in unike AI-kodearjen assistint spesifyk ûntworpen foar brûkers dy't wurkje mei de panda-bibleteek yn Python. It brûkt algoritmen foar masine-learen om de kontekst fan brûkersgegevens te begripen en leveret relevante koade-suggestjes om gegevensmanipulaasje en analysetaken makliker en effisjinter te meitsjen. Sketch fereasket gjin brûkers om ekstra plug-ins yn har IDE te ynstallearjen, wêrtroch it fluch en maklik te brûken is. Dit kin de tiid en ynspanningen dy't nedich binne foar data-relatearre taken signifikant ferminderje en brûkers helpe om bettere, effisjinter koade te skriuwen.
!pip ynstallearje skets
Wy moatte in .sketch tafoeging tafoegje oan pandas dataframe om dizze bibleteek te brûken.
freegje is in funksje fan Sketch wêrmei brûkers fragen kinne stelle oer har gegevens yn in natuerlik taalformaat. Jout in tekst-basearre antwurd op de fraach fan de brûker.
# Bibleteken ymportearje ymportearje sketch ymportearje panda's as pd # Lêzen fan de gegevens (brûkende twittergegevens as foarbyld) df = pd.read_csv("tweets.csv") print(df)
# Freegje hokker kolommen binne kategory type df.sketch.ask ("Hokker kolommen binne kategory type?")
# Om de foarm fan it dataframe te finen df.sketch.ask("Wat is de foarm fan it dataframe")
.sketch.howto
howto is in funksje dy't in blok koade leveret dy't kin wurde brûkt as begjin- of einpunt foar ferskate data-relatearre taken. Wy kinne om snippets fan koade freegje om har gegevens te normalisearjen, nije funksjes te meitsjen, gegevens te folgjen en sels modellen te bouwen. Dit sil tiid besparje en it maklik meitsje om de koade te kopiearjen en te plakjen; jo hoege de koade net fanôf de hân te skriuwen.
# Freegje om koade snipped te leverjen foar it visualisearjen fan de emoasjes df.sketch.howto ("Visualisearje de emoasjes")
.sketch.apply
De funksje .apply it helpt om nije funksjes te generearjen, fjilden te parsearjen en oare gegevensmanipulaasjes út te fieren. Om dizze funksje te brûken, moatte wy in OpenAI-akkount hawwe en de API-kaai brûke om de taken út te fieren. Ik haw net besocht dizze funksje.
Ik genietsje fan it brûken fan dizze bibleteek, foaral komme it wurket, en ik fyn it nuttich.
"pgeocode" is in poerbêste bibleteek dy't ik koartlyn stroffele op dy't ongelooflijk nuttich west hat foar myn romtlike analyseprojekten. Sa kinne jo bygelyks de ôfstân fine tusken twa postkoades en jout geografyske ynformaasje troch in lân en postkoade as ynfier te nimmen.
!pip ynstallearje pgeocode
Krij geografyske ynformaasje foar spesifike postkoades
# Kontrolearje foar lân "Yndia" nomi = pgeocode.Nominatim('In') # Geo-ynformaasje krije troch de postkoades troch te jaan nomi.query_postal_code(["620018", "620017", "620012"])
"pgeocode" berekkent de ôfstân tusken twa postkoades troch it lân en de postkoades as ynfier te nimmen. It resultaat wurdt útdrukt yn kilometers.
# In ôfstân fine tusken twa postkoades ôfstân = pgeocode.GeoDistance('In') distance.query_postal_code("620018", "620012")
rembg is in oare nuttige bibleteek dy't de eftergrûn maklik fan ôfbyldings ferwideret.
!pip ynstallearje rembg
# Biblioteken ymportearje
fan rembg ymport fuortsmite ymport cv2 # paad fan ynfierôfbylding (myn bestân: image.jpeg) input_path = 'image.jpeg' # paad foar it bewarjen fan útfierôfbylding en opslaan as in output.jpeg output_path = 'output.jpeg' # It lêzen fan de ynfier image input = cv2.imread(input_path) # Fuortsmite eftergrûnútfier = fuortsmite(ynfier) # Bestân opslaan cv2.imwrite(output_path, útfier)
Jo binne miskien al bekend mei guon fan dizze biblioteken, mar foar my binne Sketch, Pendulum, pgeocode en ftfy ûnmisber foar myn data-engineeringwurk. Ik fertrou in protte op har foar myn projekten.
Humanize" biedt ienfâldige, maklik te lêzen tekenrige opmaak foar nûmers, datums en tiden. It doel fan de bibleteek is om de gegevens te nimmen en brûkerfreonliker te meitsjen, bygelyks troch in oantal sekonden om te setten yn in mear lêsbere tekenrige lykas "2 minuten lyn". De bibleteek kin gegevens op in ferskaat oan manieren opmaak, ynklusyf it opmeitsjen fan nûmers mei komma's, it konvertearjen fan tiidstempels nei relative tiden, en mear.
Ik brûk faak hiele getallen en tiidstempels foar myn data engineering projekten.
!pip ynstallearje ferminsklike
# Bibleteek ymportearje humanisearje ymportearje datetime as dt # Opmaak fan nûmers mei komma a = humanize.intcomma(951009) # omsette fan sifers yn wurden b = humanize.intword(10046328394) #printing print(a) print(b)
import humanize import datetime as dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) print(a) print(b)
Ercole Palmeri
In ophthalmoplasty-operaasje mei de Apple Vision Pro kommersjele werjouwer waard útfierd by de Catania Polyclinic ...
It ûntwikkeljen fan fynmotoryske feardigens troch kleurjen taret bern op mear komplekse feardigens lykas skriuwen. Kleurje...
De marinesektor is in wiere wrâldwide ekonomyske macht, dy't navigearre is nei in merk fan 150 miljard ...
Ofrûne moandei kundige de Financial Times in deal oan mei OpenAI. FT lisinsje har sjoernalistyk fan wrâldklasse ...