લેખ

અમેઝિંગ, પરંતુ ઓછી જાણીતી પાયથોન લાઇબ્રેરીઓ

પાયથોન પ્રોગ્રામર હંમેશા નવી લાઇબ્રેરીઓની શોધમાં હોય છે, જે ડેટા એન્જિનિયરિંગ અને બિઝનેસ ઇન્ટેલિજન્સ પ્રોજેક્ટ્સમાં કામમાં સુધારો કરી શકે છે.

આ લેખમાં આપણે કેટલીક ઓછી જાણીતી, પરંતુ ખૂબ જ ઉપયોગી પાયથોન લાઇબ્રેરીઓ જોઈએ છીએ:

1. લોલક

માં ઘણી લાઈબ્રેરીઓ ઉપલબ્ધ હોવા છતાં પાયથોન DateTime માટે, મને પેન્ડુલમનો ઉપયોગ કોઈપણ તારીખ કામગીરી પર સરળ લાગે છે. કામ પર મારા રોજિંદા ઉપયોગ માટે લોલક મારી પ્રિય બુકકેસ છે. બિલ્ટ-ઇન પાયથોન ડેટટાઇમ મોડ્યુલને વિસ્તૃત કરે છે, સમય ઝોનનું સંચાલન કરવા માટે વધુ સાહજિક API ઉમેરીને અને સમય અંતરાલ ઉમેરવા, તારીખોની બાદબાકી અને સમય ઝોન વચ્ચે રૂપાંતર જેવી તારીખ અને સમય કામગીરી કરવા માટે. તારીખો અને સમય ફોર્મેટિંગ માટે એક સરળ અને સાહજિક API પ્રદાન કરે છે.

ઇન્સ્ટlaલેઝિઓન
!pip install pendulum
ઉદાહરણ
# import library

import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
 
#local() creates datetime instance with local timezone

local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)

# Printing UTC time

utc = pendulum.now('UTC')
print("Current UTC time:", utc)
 
# Converting UTC timezone into Europe/Paris time

europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
આઉટપુટ

2. ftfy

જ્યારે ડેટામાં વિદેશી ભાષા યોગ્ય રીતે દેખાતી નથી ત્યારે શું તમે અનુભવ્યું છે? આને મોજીબેકે કહે છે. મોજીબેક એ એક શબ્દ છે જે એન્કોડિંગ અથવા ડીકોડિંગ સમસ્યાઓના પરિણામે ઉદ્ભવતા ગરબલ્ડ અથવા સ્ક્રેમ્બલ્ડ ટેક્સ્ટનું વર્ણન કરવા માટે વપરાય છે. તે સામાન્ય રીતે ત્યારે થાય છે જ્યારે એક અક્ષર એન્કોડિંગ સાથે લખાયેલ ટેક્સ્ટ અલગ એન્કોડિંગનો ઉપયોગ કરીને ખોટી રીતે ડીકોડ કરવામાં આવે છે. ftfy પાયથોન લાઇબ્રેરી તમને મોજીબેકને ઠીક કરવામાં મદદ કરશે, જે NLP ઉપયોગના કેસોમાં ખૂબ જ ઉપયોગી છે.

ઇન્સ્ટlaલેઝિઓન
!pip ftfy ઇન્સ્ટોલ કરો
ઉદાહરણ
print(ftfy.fix_text('“ftfyâ€\x9d.' નો ઉપયોગ કરીને વાક્ય સુધારો.')) print(ftfy.fix_text('✔ ટેક્સ્ટ સાથે કોઈ સમસ્યા નથી')) પ્રિન્ટ(ftfy.fix_text('à perturber la réflexion) '))
આઉટપુટ

Mojibake ઉપરાંત, ftfy ખરાબ એન્કોડિંગ્સ, ખરાબ લાઇન એન્ડિંગ્સ અને ખરાબ અવતરણને ઠીક કરશે. નીચેના એન્કોડિંગ્સમાંથી એક તરીકે ડીકોડ કરવામાં આવેલ ટેક્સ્ટને સમજી શકે છે:

  • લેટિન-1 (ISO-8859–1)
  • Windows-1252 (cp1252 — Microsoft ઉત્પાદનોમાં વપરાય છે)
  • Windows-1251 (cp1251 — cp1252 નું રશિયન સંસ્કરણ)
  • Windows-1250 (cp1250 — cp1252 નું પૂર્વીય યુરોપીયન સંસ્કરણ)
  • ISO-8859–2 (જે બરાબર Windows-1250 જેવું નથી)
  • MacRoman (Mac OS 9 અને પહેલાનાં પર વપરાયેલ)
  • cp437 (MS-DOS અને Windows કમાન્ડ પ્રોમ્પ્ટના કેટલાક સંસ્કરણોમાં વપરાય છે)

3. સ્કેચ

સ્કેચ એ અનન્ય AI કોડિંગ સહાયક છે જે ખાસ કરીને Python માં pandas લાઇબ્રેરી સાથે કામ કરતા વપરાશકર્તાઓ માટે રચાયેલ છે. તે વપરાશકર્તા ડેટાના સંદર્ભને સમજવા માટે મશીન લર્નિંગ અલ્ગોરિધમનો ઉપયોગ કરે છે અને ડેટા મેનીપ્યુલેશન અને વિશ્લેષણ કાર્યોને સરળ અને વધુ કાર્યક્ષમ બનાવવા માટે સંબંધિત કોડ સૂચનો પ્રદાન કરે છે. સ્કેચ માટે વપરાશકર્તાઓને તેમના IDE માં કોઈપણ વધારાના પ્લગ-ઈન્સ ઇન્સ્ટોલ કરવાની જરૂર નથી, જે તેને ઝડપી અને ઉપયોગમાં સરળ બનાવે છે. આ ડેટા-સંબંધિત કાર્યો માટે જરૂરી સમય અને પ્રયત્નને નોંધપાત્ર રીતે ઘટાડી શકે છે અને વપરાશકર્તાઓને બહેતર, વધુ કાર્યક્ષમ કોડ લખવામાં મદદ કરે છે.

ઇન્સ્ટlaલેઝિઓન
!pip ઇન્સ્ટોલ સ્કેચ
ઉદાહરણ

આ લાઇબ્રેરીનો ઉપયોગ કરવા માટે અમારે પાંડા ડેટાફ્રેમમાં .sketch એક્સ્ટેંશન ઉમેરવાની જરૂર છે.

.સ્કેચ.પૂછો

પુછવું સ્કેચની એક વિશેષતા છે જે વપરાશકર્તાઓને તેમના ડેટા વિશે કુદરતી ભાષાના ફોર્મેટમાં પ્રશ્નો પૂછવાની મંજૂરી આપે છે. વપરાશકર્તાની ક્વેરીનો ટેક્સ્ટ-આધારિત પ્રતિસાદ આપે છે.

# આયાત કરતી લાઇબ્રેરીઓ પીડી તરીકે સ્કેચ આયાત કરે છે પંડા # ડેટા વાંચવું (ઉદાહરણ તરીકે ટ્વિટર ડેટાનો ઉપયોગ કરીને) df = pd.read_csv("tweets.csv") print(df)
# પૂછવું કે કઈ કૉલમ કૅટેગરી પ્રકાર છે df.sketch.ask("કયા કૉલમ કૅટેગરી પ્રકાર છે?")
આઉટપુટ
# ડેટાફ્રેમનો આકાર શોધવા માટે df.sketch.ask ("ડેટાફ્રેમનો આકાર શું છે")

.સ્કેચ.કેવી રીતે

કઈ રીતે એક એવી સુવિધા છે જે કોડનો બ્લોક પૂરો પાડે છે જેનો ઉપયોગ વિવિધ ડેટા-સંબંધિત કાર્યો માટે પ્રારંભિક અથવા અંતિમ બિંદુ તરીકે થઈ શકે છે. અમે તેમના ડેટાને સામાન્ય બનાવવા, નવી સુવિધાઓ બનાવવા, ડેટા ટ્રૅક કરવા અને મોડલ બનાવવા માટે કોડના સ્નિપેટ્સ માટે કહી શકીએ છીએ. આનાથી સમય બચશે અને કોડની નકલ અને પેસ્ટ કરવાનું સરળ બનશે; તમારે શરૂઆતથી મેન્યુઅલી કોડ લખવાની જરૂર નથી.

# લાગણીઓને વિઝ્યુઅલાઈઝ કરવા df.sketch.howto("ભાવનાઓને વિઝ્યુઅલાઈઝ કરો") માટે સ્નિપ કરેલ કોડ પ્રદાન કરવા માટે પૂછવું
આઉટપુટ

.sketch.apply

.apply ફંક્શન તે નવા ફીચર્સ જનરેટ કરવામાં, ફીલ્ડ્સને પાર્સ કરવામાં અને અન્ય ડેટા મેનિપ્યુલેશન કરવામાં મદદ કરે છે. આ સુવિધાનો ઉપયોગ કરવા માટે, અમારી પાસે OpenAI એકાઉન્ટ હોવું જરૂરી છે અને કાર્યો કરવા માટે API કીનો ઉપયોગ કરવો જોઈએ. મેં આ સુવિધાનો પ્રયાસ કર્યો નથી.

ખાસ કરીને આ પુસ્તકાલયનો ઉપયોગ કરીને મને આનંદ થયો આવે તે કામ કરે છે, અને મને તે ઉપયોગી લાગે છે.

4. pgeocode

"pgeocode" એ એક ઉત્તમ લાઇબ્રેરી છે જેને મેં તાજેતરમાં જ ઠોકર મારી છે જે મારા અવકાશી વિશ્લેષણ પ્રોજેક્ટ્સ માટે અતિ ઉપયોગી છે. ઉદાહરણ તરીકે, તે તમને બે પોસ્ટલ કોડ વચ્ચેનું અંતર શોધવા માટે પરવાનગી આપે છે અને ઇનપુટ તરીકે દેશ અને પોસ્ટલ કોડ લઈને ભૌગોલિક માહિતી પ્રદાન કરે છે.

ઇન્સ્ટlaલેઝિઓન
!pip pgeocode ઇન્સ્ટોલ કરો
ઉદાહરણ

ચોક્કસ પોસ્ટકોડ માટે ભૌગોલિક માહિતી મેળવો

# દેશ "ભારત" નોમી માટે તપાસી રહ્યું છે = pgeocode.Nominatim('In') # પોસ્ટકોડ nomi.query_postal_code(["620018", "620017", "620012"]) પસાર કરીને ભૌગોલિક માહિતી મેળવવી
આઉટપુટ

"pgeocode" દેશ અને પોસ્ટકોડને ઇનપુટ તરીકે લઈને બે પોસ્ટકોડ વચ્ચેના અંતરની ગણતરી કરે છે. પરિણામ કિલોમીટરમાં દર્શાવવામાં આવે છે.

# બે પોસ્ટકોડ વચ્ચેનું અંતર શોધવું અંતર = pgeocode.GeoDistance('In') दूरी.query_postal_code("620018", "620012")
આઉટપુટ

5. rembg

rembg એ બીજી ઉપયોગી લાઈબ્રેરી છે જે ઈમેજીસમાંથી બેકગ્રાઉન્ડને સરળતાથી દૂર કરે છે.

ઇન્સ્ટlaલેઝિઓન
!pip rembg ઇન્સ્ટોલ કરો
ઉદાહરણ
# પુસ્તકાલયો આયાત કરી રહ્યા છીએ
gujarati rembg import remove import cv2 # ઇનપુટ ઇમેજનો પાથ (મારી ફાઇલ: image.jpeg) input_path = 'image.jpeg' # આઉટપુટ ઇમેજને સાચવવા અને આઉટપુટ તરીકે સાચવવા માટેનો માર્ગ.jpeg output_path = 'output.jpeg' # ઇનપુટ વાંચવું ઇમેજ ઇનપુટ = cv2.imread(input_path) # પૃષ્ઠભૂમિ આઉટપુટ દૂર કરી રહ્યું છે = દૂર(ઇનપુટ) # ફાઇલ સાચવી રહ્યું છે cv2.imwrite(output_path, આઉટપુટ)
આઉટપુટ

તમે આમાંની કેટલીક લાઇબ્રેરીઓથી પહેલાથી જ પરિચિત હશો, પરંતુ મારા માટે, સ્કેચ, પેન્ડુલમ, pgeocode અને ftfy મારા ડેટા એન્જિનિયરિંગ કાર્ય માટે અનિવાર્ય છે. હું મારા પ્રોજેક્ટ માટે તેમના પર ઘણો આધાર રાખું છું.

6. માનવીકરણ

માનવીકરણ” નંબરો, તારીખો અને સમય માટે સરળ, વાંચવા માટે સરળ સ્ટ્રિંગ ફોર્મેટિંગ પ્રદાન કરે છે. લાઇબ્રેરીનો ધ્યેય ડેટા લેવાનો અને તેને વધુ વપરાશકર્તા-મૈત્રીપૂર્ણ બનાવવાનો છે, ઉદાહરણ તરીકે "2 મિનિટ પહેલા" જેવી વધુ વાંચી શકાય તેવી સ્ટ્રિંગમાં સંખ્યાબંધ સેકન્ડોને રૂપાંતરિત કરીને. લાઇબ્રેરી ડેટાને વિવિધ રીતે ફોર્મેટ કરી શકે છે, જેમાં અલ્પવિરામ સાથે નંબરોનું ફોર્મેટિંગ, ટાઇમસ્ટેમ્પને સંબંધિત સમયમાં રૂપાંતરિત કરવું અને વધુનો સમાવેશ થાય છે.

હું મારા ડેટા એન્જીનિયરિંગ પ્રોજેક્ટ્સ માટે વારંવાર પૂર્ણાંકો અને ટાઇમસ્ટેમ્પનો ઉપયોગ કરું છું.

ઇન્સ્ટlaલેઝિઓન
!pip હ્યુમનાઇઝ ઇન્સ્ટોલ કરો
ઉદાહરણ (પૂર્ણાંક)
# લાઇબ્રેરી આયાત કરી રહ્યું છે આયાત માનવીકરણ આયાત તારીખ સમય dt તરીકે # અલ્પવિરામ સાથે નંબરોનું ફોર્મેટિંગ a = humanize.intcomma(951009) # નંબરોને શબ્દોમાં રૂપાંતરિત કરવું b = humanize.intword(10046328394) #printing print(a) print(b)
આઉટપુટ
ઉદાહરણ (તારીખ અને સમય)
dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) print(a) print(b)

Ercole Palmeri

ઇનોવેશન ન્યૂઝલેટર
નવીનતા પરના સૌથી મહત્વપૂર્ણ સમાચારને ચૂકશો નહીં. તેમને ઇમેઇલ દ્વારા પ્રાપ્ત કરવા માટે સાઇન અપ કરો.
ટૅગ્સ: અજગર

તાજેતરના લેખો

બાળકો માટે રંગીન પૃષ્ઠોના ફાયદા - તમામ ઉંમરના લોકો માટે જાદુની દુનિયા

રંગ દ્વારા સુંદર મોટર કૌશલ્ય વિકસાવવાથી બાળકોને લેખન જેવી વધુ જટિલ કુશળતા માટે તૈયાર કરવામાં આવે છે. રંગ કરવા માટે…

2 મે 2024

ભાવિ અહીં છે: શિપિંગ ઉદ્યોગ વૈશ્વિક અર્થતંત્રમાં કેવી રીતે ક્રાંતિ લાવી રહ્યો છે

નૌકાદળ ક્ષેત્ર એ સાચી વૈશ્વિક આર્થિક શક્તિ છે, જેણે 150 અબજના બજાર તરફ નેવિગેટ કર્યું છે...

1 મે 2024

પ્રકાશકો અને OpenAI આર્ટિફિશિયલ ઇન્ટેલિજન્સ દ્વારા પ્રક્રિયા કરાયેલ માહિતીના પ્રવાહને નિયંત્રિત કરવા માટે કરાર પર હસ્તાક્ષર કરે છે

ગયા સોમવારે, ફાઇનાન્શિયલ ટાઇમ્સે OpenAI સાથેના સોદાની જાહેરાત કરી હતી. FT તેના વિશ્વ કક્ષાના પત્રકારત્વને લાઇસન્સ આપે છે...

30 એપ્રિલ 2024

ઓનલાઈન ચુકવણીઓ: સ્ટ્રીમિંગ સેવાઓ તમને કાયમ માટે કેવી રીતે ચૂકવણી કરે છે તે અહીં છે

લાખો લોકો સ્ટ્રીમિંગ સેવાઓ માટે ચૂકવણી કરે છે, માસિક સબ્સ્ક્રિપ્શન ફી ચૂકવે છે. સામાન્ય અભિપ્રાય છે કે તમે…

29 એપ્રિલ 2024

તમારી ભાષામાં ઇનોવેશન વાંચો

ઇનોવેશન ન્યૂઝલેટર
નવીનતા પરના સૌથી મહત્વપૂર્ણ સમાચારને ચૂકશો નહીં. તેમને ઇમેઇલ દ્વારા પ્રાપ્ત કરવા માટે સાઇન અપ કરો.

અમને અનુસરો