यस लेखमा हामी केहि थोरै ज्ञात, तर धेरै उपयोगी पाइथन पुस्तकालयहरू देख्छौं:
यद्यपि धेरै पुस्तकालयहरू उपलब्ध छन् अजगर DateTime को लागि, मलाई पेन्डुलम कुनै पनि मिति सञ्चालनमा प्रयोग गर्न सजिलो लाग्छ। काममा मेरो दैनिक प्रयोगको लागि पेंडुलम मेरो मनपर्ने बुककेस हो। बिल्ट-इन पाइथन डेटटाइम मोड्युल विस्तार गर्दछ, समय क्षेत्रहरू प्रबन्ध गर्न र मिति र समय कार्यहरू प्रदर्शन गर्नको लागि थप सहज API थप्दै, समय अन्तरालहरू थप्ने, मितिहरू घटाउने, र समय क्षेत्रहरू बीच रूपान्तरण गर्ने। मिति र समय ढाँचाको लागि एक सरल र सहज API प्रदान गर्दछ।
!pip install pendulum
# import library
import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
#local() creates datetime instance with local timezone
local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)
# Printing UTC time
utc = pendulum.now('UTC')
print("Current UTC time:", utc)
# Converting UTC timezone into Europe/Paris time
europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
के तपाईंले डाटामा विदेशी भाषा सही रूपमा देखा पर्दैन जब सामना गर्नुभयो? यसलाई मोजिबाके भनिन्छ। Mojibake एक शब्द हो जुन विकृत वा स्क्र्याम्बल गरिएको पाठलाई वर्णन गर्न प्रयोग गरिन्छ जुन एन्कोडिङ वा डिकोडिङ समस्याहरूको परिणाम स्वरूप हुन्छ। यो सामान्यतया तब हुन्छ जब एउटा क्यारेक्टर एन्कोडिङसँग लेखिएको पाठलाई फरक इन्कोडिङ प्रयोग गरेर गलत तरिकाले डिकोड गरिन्छ। ftfy पाइथन पुस्तकालयले तपाईंलाई Mojibake ठीक गर्न मद्दत गर्नेछ, जुन NLP प्रयोगका केसहरूमा धेरै उपयोगी छ।
!pip ftfy स्थापना गर्नुहोस्
प्रिन्ट(ftfy.fix_text('“ftfyâ€\x9d प्रयोग गरेर वाक्य सच्याउनुहोस्।')) print(ftfy.fix_text('✔ पाठसँग कुनै समस्या छैन')) print(ftfy.fix_text('à perturber la réflexion) '))
Mojibake को अतिरिक्त, ftfy ले खराब इन्कोडिङहरू, खराब लाइन अन्त्यहरू, र खराब उद्धरणहरू ठीक गर्नेछ। निम्न सङ्केतनहरू मध्ये एकको रूपमा डिकोड गरिएको पाठ बुझ्न सक्छ:
स्केच एक अद्वितीय AI कोडिङ सहायक हो जुन विशेष गरी Python मा pandas लाइब्रेरीसँग काम गर्ने प्रयोगकर्ताहरूका लागि डिजाइन गरिएको हो। यसले प्रयोगकर्ताको डेटाको सन्दर्भ बुझ्न मेसिन लर्निङ एल्गोरिदमहरू प्रयोग गर्छ र डेटा हेरफेर र विश्लेषण कार्यहरूलाई सजिलो र प्रभावकारी बनाउन सान्दर्भिक कोड सुझावहरू प्रदान गर्दछ। स्केचले प्रयोगकर्ताहरूलाई उनीहरूको IDE मा कुनै पनि अतिरिक्त प्लग-इनहरू स्थापना गर्न आवश्यक पर्दैन, यसलाई छिटो र प्रयोग गर्न सजिलो बनाउँदै। यसले डेटा-सम्बन्धित कार्यहरूको लागि आवश्यक समय र प्रयासलाई उल्लेखनीय रूपमा घटाउन सक्छ र प्रयोगकर्ताहरूलाई अझ राम्रो, अधिक कुशल कोड लेख्न मद्दत गर्दछ।
!pip स्थापना स्केच
हामीले यो पुस्तकालय प्रयोग गर्नको लागि पाण्डा डेटाफ्रेममा .sketch विस्तार थप्नु पर्छ।
सोध्नु स्केचको सुविधा हो जसले प्रयोगकर्ताहरूलाई उनीहरूको डेटाको बारेमा प्राकृतिक भाषा ढाँचामा प्रश्नहरू सोध्न अनुमति दिन्छ। प्रयोगकर्ताको प्रश्नमा पाठ-आधारित प्रतिक्रिया प्रदान गर्दछ।
# आयात गर्ने पुस्तकालयहरूले pd को रूपमा स्केच आयात पाण्डाहरू आयात गर्दछ # डाटा पढ्दै (उदाहरणको रूपमा ट्विटर डाटा प्रयोग गर्दै) df = pd.read_csv("tweets.csv") print(df)
# कुन स्तम्भहरू श्रेणी प्रकार हुन् भनेर सोध्दै df.sketch.ask ("कुन स्तम्भहरू कोटी प्रकार हुन्?")
# डाटाफ्रेमको आकार पत्ता लगाउन df.sketch.ask ("डेटाफ्रेमको आकार के हो")
स्केच।कसरी
कसरी एक सुविधा हो जसले कोडको ब्लक प्रदान गर्दछ जुन विभिन्न डेटा-सम्बन्धित कार्यहरूको लागि सुरूवात वा अन्त्य बिन्दुको रूपमा प्रयोग गर्न सकिन्छ। हामी तिनीहरूको डेटा सामान्य बनाउन, नयाँ सुविधाहरू सिर्जना गर्न, डेटा ट्र्याक गर्न, र मोडेलहरू निर्माण गर्न कोडको स्निपेटहरू सोध्न सक्छौं। यसले समय बचत गर्नेछ र कोड प्रतिलिपि गर्न र टाँस्न सजिलो बनाउँदछ; तपाईंले स्क्र्याचबाट म्यानुअल रूपमा कोड लेख्नु पर्दैन।
# भावनाहरू df.sketch.howto ("भावनाहरू कल्पना गर्नुहोस्") को लागी snipped कोड प्रदान गर्न सोध्दै
.sketch.apply
.apply प्रकार्य यसले नयाँ सुविधाहरू उत्पन्न गर्न, क्षेत्रहरू पार्स गर्न र अन्य डेटा हेरफेरहरू गर्न मद्दत गर्दछ। यो सुविधा प्रयोग गर्न, हामीसँग OpenAI खाता हुनुपर्छ र कार्यहरू गर्न API कुञ्जी प्रयोग गर्नुहोस्। मैले यो सुविधा प्रयास गरेको छैन।
मलाई यो पुस्तकालय प्रयोग गरेर रमाइलो लाग्यो, विशेष गरी आउन यसले काम गर्छ, र मलाई यो उपयोगी लाग्छ।
"pgeocode" एक उत्कृष्ट पुस्तकालय हो जुन मैले भर्खरै ठक्कर खाएँ जुन मेरो स्थानिय विश्लेषण परियोजनाहरूको लागि अविश्वसनीय रूपमा उपयोगी भएको छ। उदाहरणका लागि, यसले तपाईंलाई दुई हुलाक कोडहरू बीचको दूरी पत्ता लगाउन अनुमति दिन्छ र इनपुटको रूपमा देश र हुलाक कोड लिएर भौगोलिक जानकारी प्रदान गर्दछ।
!pip pgeocode स्थापना गर्नुहोस्
विशिष्ट पोष्टकोडहरूको लागि भौगोलिक जानकारी प्राप्त गर्नुहोस्
# देश "India" nomi = pgeocode.Nominatim('In') को लागि जाँच गर्दै # postcodes nomi.query_postal_code(["620018", "620017", "620012"]) पास गरेर भौगोलिक जानकारी प्राप्त गर्दै
"pgeocode" ले देश र पोष्टकोडहरूलाई इनपुटको रूपमा लिएर दुई पोष्टकोडहरू बीचको दूरी गणना गर्दछ। नतिजा किलोमिटर मा व्यक्त गरिएको छ।
# दुई पोष्टकोडहरू बीचको दूरी पत्ता लगाउँदै दूरी = pgeocode।GeoDistance('In') दूरी। query_postal_code("620018", "620012")
rembg अर्को उपयोगी पुस्तकालय हो जसले सजिलै छविहरूबाट पृष्ठभूमि हटाउँछ।
!pip rembg स्थापना गर्नुहोस्
# पुस्तकालयहरू आयात गर्दै
बाट rembg आयात हटाउनुहोस् import cv2 # इनपुट छविको पथ (मेरो फाइल: image.jpeg) input_path = 'image.jpeg' # आउटपुट छवि बचत गर्न र output.jpeg output_path = 'output.jpeg' # इनपुट पढ्दै छवि इनपुट = cv2.imread(input_path) # पृष्ठभूमि आउटपुट हटाउँदै = हटाउनुहोस्(इनपुट) # फाइल बचत गर्दै cv2.imwrite(output_path, output)
तपाइँ यी मध्ये केहि पुस्तकालयहरूसँग पहिले नै परिचित हुन सक्नुहुन्छ, तर मेरो लागि, स्केच, पेन्डुलम, pgeocode, र ftfy मेरो डाटा इन्जिनियरिङ कार्यको लागि अपरिहार्य छन्। म मेरो परियोजनाहरूको लागि तिनीहरूमा धेरै भरोसा गर्छु।
Humanize" ले नम्बरहरू, मितिहरू र समयहरूको लागि सरल, पढ्न सजिलो स्ट्रिङ ढाँचा प्रदान गर्दछ। पुस्तकालयको लक्ष्य भनेको डेटा लिनु र यसलाई थप प्रयोगकर्ता-अनुकूल बनाउनु हो, उदाहरणका लागि धेरै सेकेन्डहरूलाई "2 मिनेट अघि" जस्तै पढ्न योग्य स्ट्रिङमा रूपान्तरण गरेर। पुस्तकालयले विभिन्न तरिकामा डेटा ढाँचा गर्न सक्छ, अल्पविराम संग ढाँचा संख्या सहित, सापेक्ष समय मा टाइमस्ट्याम्प रूपान्तरण, र थप।
म प्रायः मेरो डेटा इन्जिनियरिङ परियोजनाहरूको लागि पूर्णांक र टाइमस्ट्याम्पहरू प्रयोग गर्छु।
!pip मानवीकरण स्थापना गर्नुहोस्
# पुस्तकालय आयात गर्दै मानवीकरण आयात मिति समय dt को रूपमा आयात गर्दै # अल्पविरामको साथ नम्बरहरू ढाँचा a = humanize.intcomma(951009) # संख्याहरूलाई शब्दहरूमा रूपान्तरण गर्दै b = humanize.intword(10046328394) #printing print(a) print(b)
dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) print(a) print(b) को रूपमा मानवीकरण आयात मिति समय आयात गर्नुहोस्
Ercole Palmeri
गत सोमबार, फाइनान्सियल टाइम्सले OpenAI सँग सम्झौताको घोषणा गर्यो। FT ले आफ्नो विश्व स्तरीय पत्रकारिता लाई लाइसेन्स...
लाखौं मानिसहरूले स्ट्रिमिङ सेवाहरूको लागि भुक्तानी गर्छन्, मासिक सदस्यता शुल्क तिर्छन्। यो आम धारणा छ कि तपाईं…
Veeam द्वारा Coveware ले साइबर जबरजस्ती घटना प्रतिक्रिया सेवाहरू प्रदान गर्न जारी राख्नेछ। Coveware ले फोरेन्सिक र उपचार क्षमताहरू प्रदान गर्दछ ...
अनुमानित मर्मतसम्भारले तेल र ग्यास क्षेत्रमा क्रान्तिकारी परिवर्तन गर्दैछ, बिरुवा व्यवस्थापनको लागि एक नवीन र सक्रिय दृष्टिकोणको साथ।…