I denne artikkelen ser vi noen lite kjente, men veldig nyttige pythonbiblioteker:
Selv om mange biblioteker er tilgjengelige i Python for DateTime finner jeg Pendulum enkel å bruke på enhver datooperasjon. En pendel er min favoritt bokhylle til daglig bruk på jobben. Utvider den innebygde Python datetime-modulen, legger til et mer intuitivt API for å administrere tidssoner og utføre dato- og klokkeslettoperasjoner som å legge til tidsintervaller, trekke fra datoer og konvertere mellom tidssoner. Gir et enkelt og intuitivt API for formatering av datoer og klokkeslett.
!pip install pendulum
# import library
import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
#local() creates datetime instance with local timezone
local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)
# Printing UTC time
utc = pendulum.now('UTC')
print("Current UTC time:", utc)
# Converting UTC timezone into Europe/Paris time
europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
Har du støtt på når fremmedspråket i dataene ikke vises riktig? Dette kalles Mojibake. Mojibake er et begrep som brukes for å beskrive forvansket eller kryptert tekst som oppstår som et resultat av kodings- eller dekodingsproblemer. Det oppstår vanligvis når tekst skrevet med én tegnkoding er feil dekodet med en annen koding. ftfy python-biblioteket vil hjelpe deg med å fikse Mojibake, som er veldig nyttig i NLP-brukstilfeller.
!pip install ftfy
print(ftfy.fix_text('Korriger setningen med “ftfyâ€\x9d.')) print(ftfy.fix_text('âœ" Ingen problemer med tekst')) print(ftfy.fix_text('à perturber la réflexion '))
I tillegg til Mojibake, vil ftfy fikse dårlige kodinger, dårlige linjeavslutninger og dårlige anførselstegn. kan forstå tekst som har blitt dekodet som en av følgende kodinger:
Sketch er en unik AI-kodeassistent designet spesielt for brukere som jobber med panda-biblioteket i Python. Den bruker maskinlæringsalgoritmer for å forstå konteksten til brukerdata og gir relevante kodeforslag for å gjøre datamanipulering og analyseoppgaver enklere og mer effektive. Sketch krever ikke at brukere installerer noen ekstra plug-ins i IDE, noe som gjør det raskt og enkelt å bruke. Dette kan redusere tiden og innsatsen som kreves for datarelaterte oppgaver betydelig og hjelpe brukere med å skrive bedre og mer effektiv kode.
!pip installasjonsskisse
Vi må legge til en .sketch-utvidelse til pandas dataramme for å bruke dette biblioteket.
spør er en funksjon i Sketch som lar brukere stille spørsmål om dataene deres i et naturlig språkformat. Gir et tekstbasert svar på brukerens forespørsel.
# Importerer biblioteker importer skisse importer pandaer som pd # Leser dataene (bruker twitterdata som eksempel) df = pd.read_csv("tweets.csv") print(df)
# Spør hvilke kolonner er kategoritype df.sketch.ask("Hvilke kolonner er kategoritype?")
# For å finne formen på datarammen df.sketch.ask("Hva er formen på datarammen")
.skisse.howto
hvordan er en funksjon som gir en kodeblokk som kan brukes som et start- eller sluttpunkt for ulike datarelaterte oppgaver. Vi kan be om kodebiter for å normalisere dataene deres, lage nye funksjoner, spore data og til og med bygge modeller. Dette vil spare tid og gjøre det enkelt å kopiere og lime inn koden; du trenger ikke å skrive koden manuelt fra bunnen av.
# Ber om å gi kode klippet for å visualisere følelsene df.sketch.howto("Visualiser følelsene")
.skisse.bruk
.apply-funksjonen det hjelper med å generere nye funksjoner, analysere felt og utføre andre datamanipulasjoner. For å bruke denne funksjonen må vi ha en OpenAI-konto og bruke API-nøkkelen til å utføre oppgavene. Jeg har ikke prøvd denne funksjonen.
Jeg likte å bruke dette biblioteket, spesielt Kom det fungerer, og jeg synes det er nyttig.
"pgeocode" er et utmerket bibliotek som jeg nylig snublet over som har vært utrolig nyttig for mine romlige analyseprosjekter. For eksempel lar den deg finne avstanden mellom to postnumre og gir geografisk informasjon ved å ta et land og postnummer som input.
!pip installer sidekode
Få geografisk informasjon for bestemte postnumre
# Sjekker for landet "India" nomi = pgeocode.Nominatim('In') # Får geoinformasjon ved å sende postnummerene nomi.query_postal_code(["620018", "620017", "620012"])
"pgeocode" beregner avstanden mellom to postnumre ved å ta landet og postnumrene som input. Resultatet er uttrykt i kilometer.
# Finne en avstand mellom to postnumre avstand = pgeocode.GeoDistance('In') distance.query_postal_code("620018", "620012")
rembg er et annet nyttig bibliotek som enkelt fjerner bakgrunnen fra bilder.
!pip installer rembg
# Importerer biblioteker
fra rembg import fjern import cv2 # bane til inndatabilde (min fil: image.jpeg) input_path = 'image.jpeg' # bane for lagring av utdatabilde og lagring som en output.jpeg output_path = 'output.jpeg' # Leser inndata bildeinngang = cv2.imread(input_path) # Fjerner bakgrunnsoutput = remove(input) # Lagrer fil cv2.imwrite(output_path, output)
Du er kanskje allerede kjent med noen av disse bibliotekene, men for meg er Sketch, Pendulum, pgeocode og ftfy uunnværlige for mitt dataingeniørarbeid. Jeg stoler mye på dem for prosjektene mine.
Humanize" gir enkel, lettlest strengformatering for tall, datoer og klokkeslett. Målet med biblioteket er å ta dataene og gjøre dem mer brukervennlige, for eksempel ved å konvertere et antall sekunder til en mer lesbar streng som "2 minutter siden". Biblioteket kan formatere data på en rekke måter, inkludert formatering av tall med kommaer, konvertering av tidsstempler til relative tider og mer.
Jeg bruker ofte heltall og tidsstempler for mine dataingeniørprosjekter.
!pip installer menneskeliggjøring
# Importerer bibliotek import humanize import datetime as dt # Formatering av tall med komma a = humanize.intcomma(951009) # konvertering av tall til ord b = humanize.intword(10046328394) #printing print(a) print(b)
import humanize import datetime as dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) print(a) print(b)
Ercole Palmeri
Marinesektoren er en ekte global økonomisk makt, som har navigert mot et 150 milliarder marked...
Sist mandag kunngjorde Financial Times en avtale med OpenAI. FT lisensierer sin journalistikk i verdensklasse...
Millioner av mennesker betaler for strømmetjenester og betaler månedlige abonnementsavgifter. Det er vanlig oppfatning at du...
Coveware by Veeam vil fortsette å tilby responstjenester for cyberutpressing. Coveware vil tilby kriminaltekniske og utbedringsmuligheter...