लेख

आश्चर्यजनक, तर थोरै ज्ञात पाइथन पुस्तकालयहरू

पाइथन प्रोग्रामर सधैं नयाँ पुस्तकालयहरूको खोजीमा हुन्छ, जसले डाटा इन्जिनियरिङ् र व्यापार खुफिया परियोजनाहरूमा काम सुधार गर्न सक्छ।

यस लेखमा हामी केहि थोरै ज्ञात, तर धेरै उपयोगी पाइथन पुस्तकालयहरू देख्छौं:

End. पेंडुलम

यद्यपि धेरै पुस्तकालयहरू उपलब्ध छन् अजगर DateTime को लागि, मलाई पेन्डुलम कुनै पनि मिति सञ्चालनमा प्रयोग गर्न सजिलो लाग्छ। काममा मेरो दैनिक प्रयोगको लागि पेंडुलम मेरो मनपर्ने बुककेस हो। बिल्ट-इन पाइथन डेटटाइम मोड्युल विस्तार गर्दछ, समय क्षेत्रहरू प्रबन्ध गर्न र मिति र समय कार्यहरू प्रदर्शन गर्नको लागि थप सहज API थप्दै, समय अन्तरालहरू थप्ने, मितिहरू घटाउने, र समय क्षेत्रहरू बीच रूपान्तरण गर्ने। मिति र समय ढाँचाको लागि एक सरल र सहज API प्रदान गर्दछ।

स्थापना
!pip install pendulum
उदाहरणका
# import library

import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
 
#local() creates datetime instance with local timezone

local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)

# Printing UTC time

utc = pendulum.now('UTC')
print("Current UTC time:", utc)
 
# Converting UTC timezone into Europe/Paris time

europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
उत्पादन

2. ftfy

के तपाईंले डाटामा विदेशी भाषा सही रूपमा देखा पर्दैन जब सामना गर्नुभयो? यसलाई मोजिबाके भनिन्छ। Mojibake एक शब्द हो जुन विकृत वा स्क्र्याम्बल गरिएको पाठलाई वर्णन गर्न प्रयोग गरिन्छ जुन एन्कोडिङ वा डिकोडिङ समस्याहरूको परिणाम स्वरूप हुन्छ। यो सामान्यतया तब हुन्छ जब एउटा क्यारेक्टर एन्कोडिङसँग लेखिएको पाठलाई फरक इन्कोडिङ प्रयोग गरेर गलत तरिकाले डिकोड गरिन्छ। ftfy पाइथन पुस्तकालयले तपाईंलाई Mojibake ठीक गर्न मद्दत गर्नेछ, जुन NLP प्रयोगका केसहरूमा धेरै उपयोगी छ।

स्थापना
!pip ftfy स्थापना गर्नुहोस्
उदाहरणका
प्रिन्ट(ftfy.fix_text('“ftfyâ€\x9d प्रयोग गरेर वाक्य सच्याउनुहोस्।')) print(ftfy.fix_text('✔ पाठसँग कुनै समस्या छैन')) print(ftfy.fix_text('à perturber la réflexion) '))
उत्पादन

Mojibake को अतिरिक्त, ftfy ले खराब इन्कोडिङहरू, खराब लाइन अन्त्यहरू, र खराब उद्धरणहरू ठीक गर्नेछ। निम्न सङ्केतनहरू मध्ये एकको रूपमा डिकोड गरिएको पाठ बुझ्न सक्छ:

  • ल्याटिन-1 (ISO-8859-1)
  • Windows-1252 (cp1252 — Microsoft उत्पादनहरूमा प्रयोग गरिएको)
  • Windows-1251 (cp1251 — cp1252 को रूसी संस्करण)
  • Windows-1250 (cp1250 — cp1252 को पूर्वी यूरोपीय संस्करण)
  • ISO-8859–2 (जो ठ्याक्कै Windows-1250 जस्तै छैन)
  • MacRoman (Mac OS 9 र अघिल्लो मा प्रयोग गरिएको)
  • cp437 (MS-DOS र Windows कमाण्ड प्रम्प्टको केही संस्करणहरूमा प्रयोग गरिएको)

3। स्केच

स्केच एक अद्वितीय AI कोडिङ सहायक हो जुन विशेष गरी Python मा pandas लाइब्रेरीसँग काम गर्ने प्रयोगकर्ताहरूका लागि डिजाइन गरिएको हो। यसले प्रयोगकर्ताको डेटाको सन्दर्भ बुझ्न मेसिन लर्निङ एल्गोरिदमहरू प्रयोग गर्छ र डेटा हेरफेर र विश्लेषण कार्यहरूलाई सजिलो र प्रभावकारी बनाउन सान्दर्भिक कोड सुझावहरू प्रदान गर्दछ। स्केचले प्रयोगकर्ताहरूलाई उनीहरूको IDE मा कुनै पनि अतिरिक्त प्लग-इनहरू स्थापना गर्न आवश्यक पर्दैन, यसलाई छिटो र प्रयोग गर्न सजिलो बनाउँदै। यसले डेटा-सम्बन्धित कार्यहरूको लागि आवश्यक समय र प्रयासलाई उल्लेखनीय रूपमा घटाउन सक्छ र प्रयोगकर्ताहरूलाई अझ राम्रो, अधिक कुशल कोड लेख्न मद्दत गर्दछ।

स्थापना
!pip स्थापना स्केच
उदाहरणका

हामीले यो पुस्तकालय प्रयोग गर्नको लागि पाण्डा डेटाफ्रेममा .sketch विस्तार थप्नु पर्छ।

.sketch.ask

सोध्नु स्केचको सुविधा हो जसले प्रयोगकर्ताहरूलाई उनीहरूको डेटाको बारेमा प्राकृतिक भाषा ढाँचामा प्रश्नहरू सोध्न अनुमति दिन्छ। प्रयोगकर्ताको प्रश्नमा पाठ-आधारित प्रतिक्रिया प्रदान गर्दछ।

# आयात गर्ने पुस्तकालयहरूले pd को रूपमा स्केच आयात पाण्डाहरू आयात गर्दछ # डाटा पढ्दै (उदाहरणको रूपमा ट्विटर डाटा प्रयोग गर्दै) df = pd.read_csv("tweets.csv") print(df)
# कुन स्तम्भहरू श्रेणी प्रकार हुन् भनेर सोध्दै df.sketch.ask ("कुन स्तम्भहरू कोटी प्रकार हुन्?")
उत्पादन
# डाटाफ्रेमको आकार पत्ता लगाउन df.sketch.ask ("डेटाफ्रेमको आकार के हो")

स्केच।कसरी

कसरी एक सुविधा हो जसले कोडको ब्लक प्रदान गर्दछ जुन विभिन्न डेटा-सम्बन्धित कार्यहरूको लागि सुरूवात वा अन्त्य बिन्दुको रूपमा प्रयोग गर्न सकिन्छ। हामी तिनीहरूको डेटा सामान्य बनाउन, नयाँ सुविधाहरू सिर्जना गर्न, डेटा ट्र्याक गर्न, र मोडेलहरू निर्माण गर्न कोडको स्निपेटहरू सोध्न सक्छौं। यसले समय बचत गर्नेछ र कोड प्रतिलिपि गर्न र टाँस्न सजिलो बनाउँदछ; तपाईंले स्क्र्याचबाट म्यानुअल रूपमा कोड लेख्नु पर्दैन।

# भावनाहरू df.sketch.howto ("भावनाहरू कल्पना गर्नुहोस्") को लागी snipped कोड प्रदान गर्न सोध्दै
उत्पादन

.sketch.apply

.apply प्रकार्य यसले नयाँ सुविधाहरू उत्पन्न गर्न, क्षेत्रहरू पार्स गर्न र अन्य डेटा हेरफेरहरू गर्न मद्दत गर्दछ। यो सुविधा प्रयोग गर्न, हामीसँग OpenAI खाता हुनुपर्छ र कार्यहरू गर्न API कुञ्जी प्रयोग गर्नुहोस्। मैले यो सुविधा प्रयास गरेको छैन।

मलाई यो पुस्तकालय प्रयोग गरेर रमाइलो लाग्यो, विशेष गरी आउन यसले काम गर्छ, र मलाई यो उपयोगी लाग्छ।

4. pgeocode

"pgeocode" एक उत्कृष्ट पुस्तकालय हो जुन मैले भर्खरै ठक्कर खाएँ जुन मेरो स्थानिय विश्लेषण परियोजनाहरूको लागि अविश्वसनीय रूपमा उपयोगी भएको छ। उदाहरणका लागि, यसले तपाईंलाई दुई हुलाक कोडहरू बीचको दूरी पत्ता लगाउन अनुमति दिन्छ र इनपुटको रूपमा देश र हुलाक कोड लिएर भौगोलिक जानकारी प्रदान गर्दछ।

स्थापना
!pip pgeocode स्थापना गर्नुहोस्
उदाहरणका

विशिष्ट पोष्टकोडहरूको लागि भौगोलिक जानकारी प्राप्त गर्नुहोस्

# देश "India" nomi = pgeocode.Nominatim('In') को लागि जाँच गर्दै # postcodes nomi.query_postal_code(["620018", "620017", "620012"]) पास गरेर भौगोलिक जानकारी प्राप्त गर्दै
उत्पादन

"pgeocode" ले देश र पोष्टकोडहरूलाई इनपुटको रूपमा लिएर दुई पोष्टकोडहरू बीचको दूरी गणना गर्दछ। नतिजा किलोमिटर मा व्यक्त गरिएको छ।

# दुई पोष्टकोडहरू बीचको दूरी पत्ता लगाउँदै दूरी = pgeocode।GeoDistance('In') दूरी। query_postal_code("620018", "620012")
उत्पादन

5. rembg

rembg अर्को उपयोगी पुस्तकालय हो जसले सजिलै छविहरूबाट पृष्ठभूमि हटाउँछ।

स्थापना
!pip rembg स्थापना गर्नुहोस्
उदाहरणका
# पुस्तकालयहरू आयात गर्दै
बाट rembg आयात हटाउनुहोस् import cv2 # इनपुट छविको पथ (मेरो फाइल: image.jpeg) input_path = 'image.jpeg' # आउटपुट छवि बचत गर्न र output.jpeg output_path = 'output.jpeg' # इनपुट पढ्दै छवि इनपुट = cv2.imread(input_path) # पृष्ठभूमि आउटपुट हटाउँदै = हटाउनुहोस्(इनपुट) # फाइल बचत गर्दै cv2.imwrite(output_path, output)
उत्पादन

तपाइँ यी मध्ये केहि पुस्तकालयहरूसँग पहिले नै परिचित हुन सक्नुहुन्छ, तर मेरो लागि, स्केच, पेन्डुलम, pgeocode, र ftfy मेरो डाटा इन्जिनियरिङ कार्यको लागि अपरिहार्य छन्। म मेरो परियोजनाहरूको लागि तिनीहरूमा धेरै भरोसा गर्छु।

6. मानवीकरण

Humanize" ले नम्बरहरू, मितिहरू र समयहरूको लागि सरल, पढ्न सजिलो स्ट्रिङ ढाँचा प्रदान गर्दछ। पुस्तकालयको लक्ष्य भनेको डेटा लिनु र यसलाई थप प्रयोगकर्ता-अनुकूल बनाउनु हो, उदाहरणका लागि धेरै सेकेन्डहरूलाई "2 मिनेट अघि" जस्तै पढ्न योग्य स्ट्रिङमा रूपान्तरण गरेर। पुस्तकालयले विभिन्न तरिकामा डेटा ढाँचा गर्न सक्छ, अल्पविराम संग ढाँचा संख्या सहित, सापेक्ष समय मा टाइमस्ट्याम्प रूपान्तरण, र थप।

म प्रायः मेरो डेटा इन्जिनियरिङ परियोजनाहरूको लागि पूर्णांक र टाइमस्ट्याम्पहरू प्रयोग गर्छु।

स्थापना
!pip मानवीकरण स्थापना गर्नुहोस्
उदाहरण (पूर्णांक)
# पुस्तकालय आयात गर्दै मानवीकरण आयात मिति समय dt को रूपमा आयात गर्दै # अल्पविरामको साथ नम्बरहरू ढाँचा a = humanize.intcomma(951009) # संख्याहरूलाई शब्दहरूमा रूपान्तरण गर्दै b = humanize.intword(10046328394) #printing print(a) print(b)
उत्पादन
उदाहरण (मिति र समय)
dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) print(a) print(b) को रूपमा मानवीकरण आयात मिति समय आयात गर्नुहोस्

Ercole Palmeri

नवाचार न्यूजलेटर
नवीनता मा सबैभन्दा महत्त्वपूर्ण समाचार नछुटाउनुहोस्। तिनीहरूलाई ईमेल द्वारा प्राप्त गर्न साइन अप गर्नुहोस्।
टैग: अजगर

भर्खरका लेखहरू

प्रकाशकहरू र ओपनएआईले आर्टिफिसियल इन्टेलिजेन्सद्वारा प्रशोधित सूचनाको प्रवाहलाई विनियमित गर्न सम्झौतामा हस्ताक्षर गर्छन्

गत सोमबार, फाइनान्सियल टाइम्सले OpenAI सँग सम्झौताको घोषणा गर्‍यो। FT ले आफ्नो विश्व स्तरीय पत्रकारिता लाई लाइसेन्स...

30 अप्रिल 2024

अनलाइन भुक्तानीहरू: यहाँ कसरी स्ट्रिमिङ सेवाहरूले तपाईंलाई सधैंभरि भुक्तान गर्छ

लाखौं मानिसहरूले स्ट्रिमिङ सेवाहरूको लागि भुक्तानी गर्छन्, मासिक सदस्यता शुल्क तिर्छन्। यो आम धारणा छ कि तपाईं…

29 अप्रिल 2024

Veeam ले ransomware को लागि सुरक्षा देखि प्रतिक्रिया र रिकभरी को लागी सबै भन्दा व्यापक समर्थन को सुविधा दिन्छ

Veeam द्वारा Coveware ले साइबर जबरजस्ती घटना प्रतिक्रिया सेवाहरू प्रदान गर्न जारी राख्नेछ। Coveware ले फोरेन्सिक र उपचार क्षमताहरू प्रदान गर्दछ ...

23 अप्रिल 2024

हरियो र डिजिटल क्रान्ति: कसरी पूर्वानुमानात्मक रखरखावले तेल र ग्यास उद्योगलाई रूपान्तरण गर्दैछ

अनुमानित मर्मतसम्भारले तेल र ग्यास क्षेत्रमा क्रान्तिकारी परिवर्तन गर्दैछ, बिरुवा व्यवस्थापनको लागि एक नवीन र सक्रिय दृष्टिकोणको साथ।…

22 अप्रिल 2024

आफ्नो भाषामा नवीनता पढ्नुहोस्

नवाचार न्यूजलेटर
नवीनता मा सबैभन्दा महत्त्वपूर्ण समाचार नछुटाउनुहोस्। तिनीहरूलाई ईमेल द्वारा प्राप्त गर्न साइन अप गर्नुहोस्।

हामीलाई पछ्याउनुहोस्