εμπορεύματα

Καταπληκτικές, αλλά ελάχιστα γνωστές βιβλιοθήκες Python

Ο προγραμματιστής Python αναζητά πάντα νέες βιβλιοθήκες, οι οποίες μπορούν να βελτιώσουν την εργασία σε έργα μηχανικής δεδομένων και επιχειρηματικής ευφυΐας.

Σε αυτό το άρθρο βλέπουμε μερικές ελάχιστα γνωστές, αλλά πολύ χρήσιμες βιβλιοθήκες python:

1. Εκκρεμές

Αν και πολλές βιβλιοθήκες είναι διαθέσιμες σε Python για το DateTime, βρίσκω το Pendulum εύκολο στη χρήση σε οποιαδήποτε λειτουργία ημερομηνίας. Ένα εκκρεμές είναι η αγαπημένη μου βιβλιοθήκη για την καθημερινή μου χρήση στη δουλειά. Επεκτείνει την ενσωματωμένη μονάδα ημερομηνίας Python, προσθέτοντας ένα πιο διαισθητικό API για τη διαχείριση ζωνών ώρας και την εκτέλεση λειτουργιών ημερομηνίας και ώρας, όπως η προσθήκη χρονικών διαστημάτων, η αφαίρεση ημερομηνιών και η μετατροπή μεταξύ ζωνών ώρας. Παρέχει ένα απλό και διαισθητικό API για τη μορφοποίηση ημερομηνιών και ωρών.

Εγκατάσταση
!pip install pendulum
Παράδειγμα
# import library

import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
 
#local() creates datetime instance with local timezone

local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)

# Printing UTC time

utc = pendulum.now('UTC')
print("Current UTC time:", utc)
 
# Converting UTC timezone into Europe/Paris time

europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
Παραγωγή

2. ftfy

Έχετε αντιμετωπίσει πότε η ξένη γλώσσα στα δεδομένα δεν εμφανίζεται σωστά; Αυτό ονομάζεται Mojibake. Το Mojibake είναι ένας όρος που χρησιμοποιείται για να περιγράψει αλλοιωμένο ή ανακατεμένο κείμενο που προκύπτει ως αποτέλεσμα προβλημάτων κωδικοποίησης ή αποκωδικοποίησης. Συνήθως συμβαίνει όταν το κείμενο που γράφεται με κωδικοποίηση ενός χαρακτήρα αποκωδικοποιείται εσφαλμένα χρησιμοποιώντας διαφορετική κωδικοποίηση. Η βιβλιοθήκη ftfy python θα σας βοηθήσει να διορθώσετε το Mojibake, το οποίο είναι πολύ χρήσιμο σε περιπτώσεις χρήσης NLP.

Εγκατάσταση
!pip install ftfy
Παράδειγμα
print(ftfy.fix_text('Διορθώστε την πρόταση χρησιμοποιώντας “ftfyâ€\x9d.')) print(ftfy.fix_text('âœ" Κανένα πρόβλημα με το κείμενο')) print(ftfy.fix_text('à perturber la réflexion '))
Παραγωγή

Εκτός από το Mojibake, το ftfy θα διορθώσει κακές κωδικοποιήσεις, κακές καταλήξεις γραμμών και κακές εισαγωγικά. μπορεί να κατανοήσει κείμενο που έχει αποκωδικοποιηθεί ως μία από τις ακόλουθες κωδικοποιήσεις:

  • Latin-1 (ISO-8859-1)
  • Windows-1252 (cp1252 — χρησιμοποιείται σε προϊόντα της Microsoft)
  • Windows-1251 (cp1251 — η ρωσική έκδοση του cp1252)
  • Windows-1250 (cp1250 — η ανατολικοευρωπαϊκή έκδοση του cp1252)
  • ISO-8859–2 (που δεν είναι ακριβώς το ίδιο με τα Windows-1250)
  • MacRoman (χρησιμοποιείται σε Mac OS 9 και παλαιότερα)
  • cp437 (χρησιμοποιείται στο MS-DOS και σε ορισμένες εκδόσεις της γραμμής εντολών των Windows)

3 Σκίτσο

Το Sketch είναι ένας μοναδικός βοηθός κωδικοποίησης AI που έχει σχεδιαστεί ειδικά για χρήστες που εργάζονται με τη βιβλιοθήκη pandas στην Python. Χρησιμοποιεί αλγόριθμους μηχανικής μάθησης για την κατανόηση του πλαισίου των δεδομένων χρήστη και παρέχει σχετικές προτάσεις κώδικα για να κάνει τις εργασίες χειρισμού και ανάλυσης δεδομένων ευκολότερες και πιο αποτελεσματικές. Το Sketch δεν απαιτεί από τους χρήστες να εγκαταστήσουν πρόσθετα πρόσθετα στο IDE τους, καθιστώντας το γρήγορο και εύκολο στη χρήση. Αυτό μπορεί να μειώσει σημαντικά τον χρόνο και την προσπάθεια που απαιτείται για εργασίες που σχετίζονται με δεδομένα και να βοηθήσει τους χρήστες να γράψουν καλύτερο και πιο αποτελεσματικό κώδικα.

Εγκατάσταση
Σκίτσο εγκατάστασης !pip
Παράδειγμα

Πρέπει να προσθέσουμε μια επέκταση .sketch στο πλαίσιο δεδομένων pandas για να χρησιμοποιήσουμε αυτήν τη βιβλιοθήκη.

.σκίτσο.ρωτώ

ζητώ είναι μια δυνατότητα του Sketch που επιτρέπει στους χρήστες να κάνουν ερωτήσεις σχετικά με τα δεδομένα τους σε μορφή φυσικής γλώσσας. Παρέχει μια απάντηση με βάση το κείμενο στο ερώτημα του χρήστη.

# Εισαγωγή βιβλιοθηκών εισαγωγή σκίτσου εισαγωγής panda ως pd # Ανάγνωση των δεδομένων (χρησιμοποιώντας δεδομένα twitter ως παράδειγμα) df = pd.read_csv("tweets.csv") print(df)
# Ερώτηση ποιες στήλες είναι τύπου κατηγορίας df.sketch.ask("Ποιες στήλες είναι τύπου κατηγορίας;")
Παραγωγή
# Για να βρείτε το σχήμα του πλαισίου δεδομένων df.sketch.ask("Ποιο είναι το σχήμα του πλαισίου δεδομένων")

.σκίτσο.πώς

howto είναι μια δυνατότητα που παρέχει ένα μπλοκ κώδικα που μπορεί να χρησιμοποιηθεί ως σημείο εκκίνησης ή λήξης για διάφορες εργασίες που σχετίζονται με δεδομένα. Μπορούμε να ζητήσουμε αποσπάσματα κώδικα για να ομαλοποιήσουμε τα δεδομένα τους, να δημιουργήσουμε νέες δυνατότητες, να παρακολουθήσουμε δεδομένα και ακόμη και να δημιουργήσουμε μοντέλα. Αυτό θα εξοικονομήσει χρόνο και θα διευκολύνει την αντιγραφή και επικόλληση του κώδικα. δεν χρειάζεται να γράψετε τον κώδικα χειροκίνητα από την αρχή.

# Ζητείται η παροχή κώδικα που έχει αποκοπεί για την οπτικοποίηση των συναισθημάτων df.sketch.howto ("Οπτικοποίηση των συναισθημάτων")
Παραγωγή

.σκίτσο.εφαρμόζω

Η συνάρτηση .apply βοηθά στη δημιουργία νέων δυνατοτήτων, στην ανάλυση πεδίων και στην εκτέλεση άλλων χειρισμών δεδομένων. Για να χρησιμοποιήσουμε αυτήν τη δυνατότητα, πρέπει να έχουμε λογαριασμό OpenAI και να χρησιμοποιούμε το κλειδί API για να εκτελέσουμε τις εργασίες. Δεν έχω δοκιμάσει αυτή τη δυνατότητα.

Μου άρεσε ιδιαίτερα η χρήση αυτής της βιβλιοθήκης Ελάτε λειτουργεί και το βρίσκω χρήσιμο.

4. pgeocode

Το "pgeocode" είναι μια εξαιρετική βιβλιοθήκη στην οποία έπεσα πρόσφατα και ήταν απίστευτα χρήσιμη για τα έργα χωρικής ανάλυσης μου. Για παράδειγμα, σας επιτρέπει να βρείτε την απόσταση μεταξύ δύο ταχυδρομικών κωδίκων και παρέχει γεωγραφικές πληροφορίες λαμβάνοντας ως είσοδο μια χώρα και ταχυδρομικό κώδικα.

Εγκατάσταση
!pip εγκατάσταση pgeocode
Παράδειγμα

Λάβετε γεωγραφικές πληροφορίες για συγκεκριμένους ταχυδρομικούς κώδικες

# Έλεγχος για χώρα "Ινδία" nomi = pgeocode.Nominatim('In') # Λήψη γεωγραφικών πληροφοριών περνώντας τους ταχυδρομικούς κώδικες nomi.query_postal_code(["620018", "620017", "620012"])
Παραγωγή

Το "pgeocode" υπολογίζει την απόσταση μεταξύ δύο ταχυδρομικών κωδίκων λαμβάνοντας τη χώρα και τους ταχυδρομικούς κώδικες ως είσοδο. Το αποτέλεσμα εκφράζεται σε χιλιόμετρα.

# Εύρεση απόστασης μεταξύ δύο ταχυδρομικών κωδίκων απόσταση = pgeocode.GeoDistance('In') distance.query_postal_code("620018", "620012")
Παραγωγή

5. ρεμβγ

Το rembg είναι μια άλλη χρήσιμη βιβλιοθήκη που αφαιρεί εύκολα το φόντο από τις εικόνες.

Εγκατάσταση
!pip install rembg
Παράδειγμα
# Εισαγωγή βιβλιοθηκών
από εισαγωγή rembg αφαίρεση εισαγωγής cv2 # διαδρομή εικόνας εισόδου (το αρχείο μου: image.jpeg) input_path = 'image.jpeg' # διαδρομή για αποθήκευση εικόνας εξόδου και αποθήκευση ως output.jpeg output_path = 'output.jpeg' # Ανάγνωση της εισόδου είσοδος εικόνας = cv2.imread(διαδρομή_εισόδου) # Αφαίρεση εξόδου φόντου = αφαίρεση(εισαγωγή) # Αποθήκευση αρχείου cv2.imwrite(διαδρομή_εξόδου, έξοδος)
Παραγωγή

Μπορεί να είστε ήδη εξοικειωμένοι με μερικές από αυτές τις βιβλιοθήκες, αλλά για μένα, το Sketch, το Pendulum, το pgeocode και το ftfy είναι απαραίτητα για τη δουλειά μου στη μηχανική δεδομένων. Βασίζομαι πολύ σε αυτούς για τα έργα μου.

6. Εξανθρωπίζω

Humanize» παρέχει απλή, ευανάγνωστη μορφοποίηση συμβολοσειρών για αριθμούς, ημερομηνίες και ώρες. Ο στόχος της βιβλιοθήκης είναι να λάβει τα δεδομένα και να τα κάνει πιο φιλικά προς τον χρήστη, για παράδειγμα μετατρέποντας έναν αριθμό δευτερολέπτων σε μια πιο ευανάγνωστη συμβολοσειρά όπως "πριν από 2 λεπτά". Η βιβλιοθήκη μπορεί να μορφοποιήσει δεδομένα με διάφορους τρόπους, συμπεριλαμβανομένης της μορφοποίησης αριθμών με κόμμα, της μετατροπής χρονικών σφραγίδων σε σχετικούς χρόνους και πολλά άλλα.

Συχνά χρησιμοποιώ ακέραιους αριθμούς και χρονικές σημάνσεις για τα έργα μηχανικής δεδομένων μου.

Εγκατάσταση
!pip install humanize
Παράδειγμα (Ακέραιοι)
# Εισαγωγή βιβλιοθήκης εισαγωγή εξανθρωπισμός εισαγωγή ημερομηνίας ως dt # Μορφοποίηση αριθμών με κόμμα a = humanize.intcomma(951009) # μετατροπή αριθμών σε λέξεις b = humanize.intword(10046328394) #printing print(a) print(b)
Παραγωγή
Παράδειγμα (ημερομηνία και ώρα)
εισαγωγή εξανθρωπισμός εισαγωγή ημερομηνίαώρα ως dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) print(a) print(b)

Ercole Palmeri

Ενημερωτικό δελτίο καινοτομίας
Μην χάσετε τα πιο σημαντικά νέα για την καινοτομία. Εγγραφείτε για να τα λάβετε μέσω email.
Ετικέτες: Πύθων

Πρόσφατα άρθρα

Το μέλλον είναι εδώ: Πώς η ναυτιλιακή βιομηχανία φέρνει επανάσταση στην παγκόσμια οικονομία

Ο ναυτικός τομέας είναι μια πραγματική παγκόσμια οικονομική δύναμη, η οποία έχει προσανατολιστεί προς μια αγορά 150 δισεκατομμυρίων...

1 Μαΐου 2024

Οι εκδότες και το OpenAI υπογράφουν συμφωνίες για τη ρύθμιση της ροής πληροφοριών που επεξεργάζεται η τεχνητή νοημοσύνη

Την περασμένη Δευτέρα, οι Financial Times ανακοίνωσαν συμφωνία με το OpenAI. Η FT αδειοδοτεί την παγκόσμιας κλάσης δημοσιογραφία της…

Απρίλιος 30 2024

Ηλεκτρονικές πληρωμές: Δείτε πώς οι υπηρεσίες ροής σας κάνουν να πληρώνετε για πάντα

Εκατομμύρια άνθρωποι πληρώνουν για υπηρεσίες ροής, πληρώνοντας μηνιαίες συνδρομές. Είναι κοινή γνώμη ότι…

Απρίλιος 29 2024

Το Veeam διαθέτει την πιο ολοκληρωμένη υποστήριξη για ransomware, από προστασία έως απόκριση και ανάκτηση

Η Coveware από την Veeam θα συνεχίσει να παρέχει υπηρεσίες αντιμετώπισης περιστατικών εκβιασμών στον κυβερνοχώρο. Το Coveware θα προσφέρει ιατροδικαστικές και δυνατότητες αποκατάστασης…

Απρίλιος 23 2024

Διαβάστε την Καινοτομία στη γλώσσα σας

Ενημερωτικό δελτίο καινοτομίας
Μην χάσετε τα πιο σημαντικά νέα για την καινοτομία. Εγγραφείτε για να τα λάβετε μέσω email.

Seguici