artikels

Amazing, mar lyts bekende Python-biblioteken

De Python-programmeur siket altyd nei nije bibleteken, dy't it wurk kinne ferbetterje yn data-engineering en projekten foar saaklike yntelliginsje.

Yn dit artikel sjogge wy wat min bekende, mar heul nuttige python-biblioteken:

1. Pendulum

Hoewol in protte bibleteken binne beskikber yn Python foar DateTime, Ik fyn Pendulum maklik te brûken op eltse datum operaasje. In slinger is myn favorite boekekast foar myn deistich gebrûk op it wurk. Wreidet de ynboude Python datetime-module út, it tafoegjen fan in mear yntuïtive API foar it behearen fan tiidsônes en it útfieren fan datum- en tiidoperaasjes, lykas it tafoegjen fan tiidintervallen, it subtrahearjen fan datums en it konvertearjen tusken tiidsônes. Biedt in ienfâldige en yntuïtive API foar opmaak fan datums en tiden.

Ynstallaasje
!pip install pendulum
foarbyld
# import library

import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
 
#local() creates datetime instance with local timezone

local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)

# Printing UTC time

utc = pendulum.now('UTC')
print("Current UTC time:", utc)
 
# Converting UTC timezone into Europe/Paris time

europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
útfier

2. ftfy

Hawwe jo tsjinkommen as de frjemde taal yn 'e gegevens net goed ferskynt? Dit wurdt Mojibake neamd. Mojibake is in term dy't brûkt wurdt foar it beskriuwen fan fersmoarge of ferwurde tekst dy't foarkomt as gefolch fan kodearring of dekodearjen problemen. It komt normaal foar as tekst skreaun mei ien karakterkodearring ferkeard dekodearre wurdt mei in oare kodearring. De ftfy python-bibleteek sil jo helpe om Mojibake te reparearjen, wat heul nuttich is yn gefallen fan NLP-gebrûk.

Ynstallaasje
!pip ynstallearje ftfy
foarbyld
print(ftfy.fix_text('Korrigearje de sin mei “ftfyâ€\x9d.')) print(ftfy.fix_text('âœ" Gjin problemen mei tekst')) print(ftfy.fix_text('à perturber la réflexion '))
útfier

Neist Mojibake sil ftfy minne kodearrings, minne line-eindingen en minne quotes reparearje. kin tekst ferstean dy't is dekodearre as ien fan 'e folgjende kodearrings:

  • Latyn-1 (ISO-8859-1)
  • Windows-1252 (cp1252 - brûkt yn Microsoft-produkten)
  • Windows-1251 (cp1251 - de Russyske ferzje fan cp1252)
  • Windows-1250 (cp1250 - de East-Jeropeeske ferzje fan cp1252)
  • ISO-8859–2 (dat is net krekt itselde as Windows-1250)
  • MacRoman (brûkt op Mac OS 9 en earder)
  • cp437 (brûkt yn MS-DOS en guon ferzjes fan 'e Windows kommando-prompt)

3 Skets

Sketch is in unike AI-kodearjen assistint spesifyk ûntworpen foar brûkers dy't wurkje mei de panda-bibleteek yn Python. It brûkt algoritmen foar masine-learen om de kontekst fan brûkersgegevens te begripen en leveret relevante koade-suggestjes om gegevensmanipulaasje en analysetaken makliker en effisjinter te meitsjen. Sketch fereasket gjin brûkers om ekstra plug-ins yn har IDE te ynstallearjen, wêrtroch it fluch en maklik te brûken is. Dit kin de tiid en ynspanningen dy't nedich binne foar data-relatearre taken signifikant ferminderje en brûkers helpe om bettere, effisjinter koade te skriuwen.

Ynstallaasje
!pip ynstallearje skets
foarbyld

Wy moatte in .sketch tafoeging tafoegje oan pandas dataframe om dizze bibleteek te brûken.

.sketch.ask

freegje is in funksje fan Sketch wêrmei brûkers fragen kinne stelle oer har gegevens yn in natuerlik taalformaat. Jout in tekst-basearre antwurd op de fraach fan de brûker.

# Bibleteken ymportearje ymportearje sketch ymportearje panda's as pd # Lêzen fan de gegevens (brûkende twittergegevens as foarbyld) df = pd.read_csv("tweets.csv") print(df)
# Freegje hokker kolommen binne kategory type df.sketch.ask ("Hokker kolommen binne kategory type?")
útfier
# Om de foarm fan it dataframe te finen df.sketch.ask("Wat is de foarm fan it dataframe")

.sketch.howto

howto is in funksje dy't in blok koade leveret dy't kin wurde brûkt as begjin- of einpunt foar ferskate data-relatearre taken. Wy kinne om snippets fan koade freegje om har gegevens te normalisearjen, nije funksjes te meitsjen, gegevens te folgjen en sels modellen te bouwen. Dit sil tiid besparje en it maklik meitsje om de koade te kopiearjen en te plakjen; jo hoege de koade net fanôf de hân te skriuwen.

# Freegje om koade snipped te leverjen foar it visualisearjen fan de emoasjes df.sketch.howto ("Visualisearje de emoasjes")
útfier

.sketch.apply

De funksje .apply it helpt om nije funksjes te generearjen, fjilden te parsearjen en oare gegevensmanipulaasjes út te fieren. Om dizze funksje te brûken, moatte wy in OpenAI-akkount hawwe en de API-kaai brûke om de taken út te fieren. Ik haw net besocht dizze funksje.

Ik genietsje fan it brûken fan dizze bibleteek, foaral komme it wurket, en ik fyn it nuttich.

4. pagecode

"pgeocode" is in poerbêste bibleteek dy't ik koartlyn stroffele op dy't ongelooflijk nuttich west hat foar myn romtlike analyseprojekten. Sa kinne jo bygelyks de ôfstân fine tusken twa postkoades en jout geografyske ynformaasje troch in lân en postkoade as ynfier te nimmen.

Ynstallaasje
!pip ynstallearje pgeocode
foarbyld

Krij geografyske ynformaasje foar spesifike postkoades

# Kontrolearje foar lân "Yndia" nomi = pgeocode.Nominatim('In') # Geo-ynformaasje krije troch de postkoades troch te jaan nomi.query_postal_code(["620018", "620017", "620012"])
útfier

"pgeocode" berekkent de ôfstân tusken twa postkoades troch it lân en de postkoades as ynfier te nimmen. It resultaat wurdt útdrukt yn kilometers.

# In ôfstân fine tusken twa postkoades ôfstân = pgeocode.GeoDistance('In') distance.query_postal_code("620018", "620012")
útfier

5. remb

rembg is in oare nuttige bibleteek dy't de eftergrûn maklik fan ôfbyldings ferwideret.

Ynstallaasje
!pip ynstallearje rembg
foarbyld
# Biblioteken ymportearje
fan rembg ymport fuortsmite ymport cv2 # paad fan ynfierôfbylding (myn bestân: image.jpeg) input_path = 'image.jpeg' # paad foar it bewarjen fan útfierôfbylding en opslaan as in output.jpeg output_path = 'output.jpeg' # It lêzen fan de ynfier image input = cv2.imread(input_path) # Fuortsmite eftergrûnútfier = fuortsmite(ynfier) ​​# Bestân opslaan cv2.imwrite(output_path, útfier)
útfier

Jo binne miskien al bekend mei guon fan dizze biblioteken, mar foar my binne Sketch, Pendulum, pgeocode en ftfy ûnmisber foar myn data-engineeringwurk. Ik fertrou in protte op har foar myn projekten.

6. Humanisearje

Humanize" biedt ienfâldige, maklik te lêzen tekenrige opmaak foar nûmers, datums en tiden. It doel fan de bibleteek is om de gegevens te nimmen en brûkerfreonliker te meitsjen, bygelyks troch in oantal sekonden om te setten yn in mear lêsbere tekenrige lykas "2 minuten lyn". De bibleteek kin gegevens op in ferskaat oan manieren opmaak, ynklusyf it opmeitsjen fan nûmers mei komma's, it konvertearjen fan tiidstempels nei relative tiden, en mear.

Ik brûk faak hiele getallen en tiidstempels foar myn data engineering projekten.

Ynstallaasje
!pip ynstallearje ferminsklike
Foarbyld (Integers)
# Bibleteek ymportearje humanisearje ymportearje datetime as dt # Opmaak fan nûmers mei komma a = humanize.intcomma(951009) # omsette fan sifers yn wurden b = humanize.intword(10046328394) #printing print(a) print(b)
útfier
Foarbyld (datum en tiid)
import humanize import datetime as dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) print(a) print(b)

Ercole Palmeri

Ynnovaasje nijsbrief
Mis it wichtichste nijs oer ynnovaasje net. Meld jo oan om se fia e-post te ûntfangen.
Tags: python

Recent articles

Ynnovative yntervinsje yn Augmented Reality, mei in Apple-sjogger by de Catania Polyclinic

In ophthalmoplasty-operaasje mei de Apple Vision Pro kommersjele werjouwer waard útfierd by de Catania Polyclinic ...

3 mei 2024

De foardielen fan kleurplaten foar bern - in wrâld fan magy foar alle leeftiden

It ûntwikkeljen fan fynmotoryske feardigens troch kleurjen taret bern op mear komplekse feardigens lykas skriuwen. Kleurje...

2 mei 2024

De takomst is hjir: hoe't de skipfeartsektor de wrâldekonomy revolúsjonearret

De marinesektor is in wiere wrâldwide ekonomyske macht, dy't navigearre is nei in merk fan 150 miljard ...

1 mei 2024

Utjouwers en OpenAI tekenje oerienkomsten om de stream fan ynformaasje te regeljen ferwurke troch Artificial Intelligence

Ofrûne moandei kundige de Financial Times in deal oan mei OpenAI. FT lisinsje har sjoernalistyk fan wrâldklasse ...

30 april 2024