Məqalələr

Heyrətamiz, lakin az tanınan Python kitabxanaları

Python proqramçısı həmişə məlumat mühəndisliyi və biznes kəşfiyyatı layihələrində işi təkmilləşdirə bilən yeni kitabxanalar axtarır.

Bu yazıda bəzi az tanınan, lakin çox faydalı python kitabxanalarını görürük:

1. Sarkaç

Baxmayaraq ki, çoxlu kitabxanalar mövcuddur Python DateTime üçün Pendulumun istənilən tarix əməliyyatında istifadəsini asan hesab edirəm. Sarkaç gündəlik işimdə istifadə etdiyim kitab şkafıdır. Daxili Python datetime modulunu genişləndirir, vaxt zonalarını idarə etmək və vaxt intervalları əlavə etmək, tarixləri çıxarmaq və vaxt zonaları arasında konvertasiya kimi tarix və vaxt əməliyyatlarını yerinə yetirmək üçün daha intuitiv API əlavə edir. Tarixləri və vaxtları formatlaşdırmaq üçün sadə və intuitiv API təmin edir.

Quraşdırma
!pip install pendulum
misal
# import library

import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
 
#local() creates datetime instance with local timezone

local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)

# Printing UTC time

utc = pendulum.now('UTC')
print("Current UTC time:", utc)
 
# Converting UTC timezone into Europe/Paris time

europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
Buraxılış

2. ftfy

Məlumatlarda xarici dilin düzgün görünməməsi ilə qarşılaşmısınızmı? Buna Mojibake deyilir. Mojibake kodlaşdırma və ya dekodlaşdırma problemləri nəticəsində yaranan pozulmuş və ya şifrələnmiş mətni təsvir etmək üçün istifadə edilən bir termindir. Bu, adətən bir simvol kodlaşdırması ilə yazılmış mətnin başqa kodlaşdırmadan istifadə edərək səhv deşifr edilməsi zamanı baş verir. Ftfy python kitabxanası NLP istifadə vəziyyətlərində çox faydalı olan Mojibake-i düzəltməyə kömək edəcək.

Quraşdırma
!pip quraşdırma ftfy
misal
print(ftfy.fix_text('“ftfyâ€\x9d istifadə edərək cümləni düzəldin.')) print(ftfy.fix_text('✔ Mətndə problem yoxdur')) print(ftfy.fix_text('à perturber la réflexion) '))
Buraxılış

Mojibake ilə yanaşı, ftfy pis kodlaşdırmaları, pis sətir sonlarını və pis sitatları düzəldəcək. Aşağıdakı kodlaşdırmalardan biri kimi deşifrə olunmuş mətni başa düşə bilər:

  • Latın-1 (ISO-8859-1)
  • Windows-1252 (cp1252 — Microsoft məhsullarında istifadə olunur)
  • Windows-1251 (cp1251 — cp1252-nin rus versiyası)
  • Windows-1250 (cp1250 — cp1252-nin Şərqi Avropa versiyası)
  • ISO-8859–2 (bu, Windows-1250 ilə tam eyni deyil)
  • MacRoman (Mac OS 9 və daha əvvəl istifadə olunur)
  • cp437 (MS-DOS-da və Windows əmr sorğusunun bəzi versiyalarında istifadə olunur)

3. Sketch

Sketch, Python-da pandalar kitabxanası ilə işləyən istifadəçilər üçün xüsusi olaraq hazırlanmış unikal AI kodlaşdırma köməkçisidir. O, istifadəçi məlumatlarının kontekstini başa düşmək üçün maşın öyrənmə alqoritmlərindən istifadə edir və məlumatların manipulyasiyası və təhlili tapşırıqlarını asan və daha səmərəli etmək üçün müvafiq kod təklifləri verir. Sketch istifadəçilərdən IDE-də hər hansı əlavə plaginlər quraşdırmağı tələb etmir, bu da onu tez və asan istifadə edir. Bu, məlumatla əlaqəli tapşırıqlar üçün tələb olunan vaxtı və səyi əhəmiyyətli dərəcədə azalda bilər və istifadəçilərə daha yaxşı, daha səmərəli kod yazmağa kömək edə bilər.

Quraşdırma
!pip quraşdırma eskizi
misal

Bu kitabxanadan istifadə etmək üçün pandas dataframe-ə .sketch genişləndirilməsi əlavə etməliyik.

.sketch.ask

sual istifadəçilərə öz məlumatları haqqında təbii dil formatında suallar verməyə imkan verən Sketch funksiyasıdır. İstifadəçinin sorğusuna mətn əsaslı cavab verir.

# Kitabxanaların idxalı sketch idxal pandaları pd olaraq idxal edir # Məlumatların oxunması (məsələn, twitter məlumatlarından istifadə etməklə) df = pd.read_csv("tweets.csv") print(df)
# Hansı sütunların kateqoriya növü olduğunu soruşmaq df.sketch.ask("Hansı sütunlar kateqoriya növüdür?")
Buraxılış
# Dataframe formasını tapmaq üçün df.sketch.ask("Dataframe forması nədir")

.eskiz.necə

necə verilənlərlə bağlı müxtəlif tapşırıqlar üçün başlanğıc və ya bitmə nöqtəsi kimi istifadə edilə bilən kod blokunu təmin edən xüsusiyyətdir. Biz onların məlumatlarını normallaşdırmaq, yeni funksiyalar yaratmaq, məlumatları izləmək və hətta modellər yaratmaq üçün kod parçaları istəyə bilərik. Bu, vaxta qənaət edəcək və kodu kopyalayıb yapışdırmağı asanlaşdıracaq; kodu sıfırdan əl ilə yazmağa ehtiyac yoxdur.

# Emosiyaların vizuallaşdırılması üçün kəsilmiş kodun təqdim edilməsi xahişi df.sketch.howto("Emosiyaları vizuallaşdır")
Buraxılış

.eskiz.tətbiq edin

.apply funksiyası o, yeni funksiyalar yaratmağa, sahələri təhlil etməyə və digər məlumat manipulyasiyalarını həyata keçirməyə kömək edir. Bu funksiyadan istifadə etmək üçün bizim OpenAI hesabına sahib olmalıyıq və tapşırıqları yerinə yetirmək üçün API açarından istifadə etməliyik. Mən bu funksiyanı sınamamışam.

Bu kitabxanadan istifadə etmək xüsusilə xoşuma gəldi gəl işləyir və mən bunu faydalı hesab edirəm.

4. pgeocode

“pgeocode” bu yaxınlarda rastlaşdığım əla kitabxanadır ki, bu, mənim məkan analizi layihələrim üçün inanılmaz dərəcədə faydalı olub. Məsələn, o, iki poçt kodu arasındakı məsafəni tapmağa imkan verir və ölkə və poçt kodunu giriş kimi götürərək coğrafi məlumat verir.

Quraşdırma
!pip pgeocode quraşdırın
misal

Xüsusi poçt indeksləri üçün coğrafi məlumat əldə edin

# Ölkə yoxlanılır "Hindistan" nomi = pgeocode.Nominatim('In') # nom.query_postal_code (["620018", "620017", "620012"]) poçt kodlarını keçməklə coğrafi məlumat əldə edilir.
Buraxılış

“pgeocode” ölkə və poçt indekslərini daxil olmaqla iki poçt indeksi arasındakı məsafəni hesablayır. Nəticə kilometrlərlə ifadə edilir.

# İki poçt kodu arasında məsafənin tapılması məsafə = pgeocode.GeoDistance('In') məsafə.query_postal_code("620018", "620012")
Buraxılış

5. rembg

rembg şəkillərdən fonu asanlıqla silən başqa bir faydalı kitabxanadır.

Quraşdırma
!pip install rembg
misal
# Kitabxanaların idxalı
rembg importdan import cv2 çıxarın # giriş şəklinin yolu (mənim faylım: image.jpeg) input_path = 'image.jpeg' # çıxış şəklini saxlamaq və çıxış kimi saxlamaq üçün yol.jpeg output_path = 'output.jpeg' # Girişin oxunması şəkil girişi = cv2.imread(input_path) # Fon çıxışı silinir = silin(giriş) # cv2.imwrite faylı saxlanılır(çıxış_yolu, çıxış)
Buraxılış

Bu kitabxanalardan bəziləri ilə artıq tanış ola bilərsiniz, lakin mənim üçün Sketch, Pendulum, pgeocode və ftfy mənim data mühəndisliyi işlərim üçün əvəzolunmazdır. Layihələrimdə onlara çox güvənirəm.

6. İnsanlaşdırmaq

Humanize” nömrələr, tarixlər və vaxtlar üçün sadə, oxunması asan sim formatını təmin edir. Kitabxananın məqsədi, məsələn, bir neçə saniyəni "2 dəqiqə əvvəl" kimi daha oxunaqlı sətirə çevirməklə məlumatları götürmək və onu daha istifadəçi dostu etməkdir. Kitabxana məlumatları müxtəlif yollarla formatlaya bilər, o cümlədən nömrələri vergüllə formatlaşdırmaq, vaxt ştamplarını nisbi vaxtlara çevirmək və s.

Mən məlumat mühəndisliyi layihələrim üçün tez-tez tam ədədlərdən və vaxt ştamplarından istifadə edirəm.

Quraşdırma
!pip install humanize
Nümunə (tam ədədlər)
# Kitabxananın idxalı idxalın idxal tarixi vaxtını dt kimi humanistləşdirin # Nömrələrin vergüllə formatlaşdırılması a = humanize.intcomma(951009) # rəqəmlərin sözlərə çevrilməsi b = humanize.intword(10046328394) #printing print(a) print(b)
Buraxılış
Nümunə (tarix və vaxt)
import humanize import datetime as dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) print(a) print(b)

Ercole Palmeri

İnnovasiya bülleteni
Yeniliklərlə bağlı ən vacib xəbərləri qaçırmayın. Onları e-poçtla almaq üçün qeydiyyatdan keçin.
Tags: python

Articoli recenti

Catania Poliklinikasında Apple tamaşaçısı ilə Artırılmış Reallığa innovativ müdaxilə

Kataniya poliklinikasında Apple Vision Pro kommersiya görüntüləyicisi ilə oftalmoplastika əməliyyatı həyata keçirilib...

3 May 2024

Uşaqlar üçün Boyama Səhifələrinin Faydaları - bütün yaşlar üçün sehrli bir dünya

Rəngləmə yolu ilə incə motor bacarıqlarının inkişafı uşaqları yazı kimi daha mürəkkəb bacarıqlara hazırlayır. Rəngləmək üçün…

2 May 2024

Gələcək buradadır: Gəmiçilik Sənayesi Qlobal İqtisadiyyatda Necə inqilab edir

Dəniz sektoru 150 milyardlıq bazara doğru irəliləyən əsl qlobal iqtisadi gücdür...

1 May 2024

Nəşriyyatçılar və OpenAI süni intellekt tərəfindən işlənmiş məlumat axınını tənzimləmək üçün müqavilələr imzalayırlar.

Keçən bazar ertəsi Financial Times OpenAI ilə müqavilə elan etdi. FT dünya səviyyəli jurnalistikasına lisenziya verir...

30 Aprel 2024