આ લેખમાં આપણે કેટલીક ઓછી જાણીતી, પરંતુ ખૂબ જ ઉપયોગી પાયથોન લાઇબ્રેરીઓ જોઈએ છીએ:
માં ઘણી લાઈબ્રેરીઓ ઉપલબ્ધ હોવા છતાં પાયથોન DateTime માટે, મને પેન્ડુલમનો ઉપયોગ કોઈપણ તારીખ કામગીરી પર સરળ લાગે છે. કામ પર મારા રોજિંદા ઉપયોગ માટે લોલક મારી પ્રિય બુકકેસ છે. બિલ્ટ-ઇન પાયથોન ડેટટાઇમ મોડ્યુલને વિસ્તૃત કરે છે, સમય ઝોનનું સંચાલન કરવા માટે વધુ સાહજિક API ઉમેરીને અને સમય અંતરાલ ઉમેરવા, તારીખોની બાદબાકી અને સમય ઝોન વચ્ચે રૂપાંતર જેવી તારીખ અને સમય કામગીરી કરવા માટે. તારીખો અને સમય ફોર્મેટિંગ માટે એક સરળ અને સાહજિક API પ્રદાન કરે છે.
!pip install pendulum
# import library
import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
#local() creates datetime instance with local timezone
local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)
# Printing UTC time
utc = pendulum.now('UTC')
print("Current UTC time:", utc)
# Converting UTC timezone into Europe/Paris time
europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
જ્યારે ડેટામાં વિદેશી ભાષા યોગ્ય રીતે દેખાતી નથી ત્યારે શું તમે અનુભવ્યું છે? આને મોજીબેકે કહે છે. મોજીબેક એ એક શબ્દ છે જે એન્કોડિંગ અથવા ડીકોડિંગ સમસ્યાઓના પરિણામે ઉદ્ભવતા ગરબલ્ડ અથવા સ્ક્રેમ્બલ્ડ ટેક્સ્ટનું વર્ણન કરવા માટે વપરાય છે. તે સામાન્ય રીતે ત્યારે થાય છે જ્યારે એક અક્ષર એન્કોડિંગ સાથે લખાયેલ ટેક્સ્ટ અલગ એન્કોડિંગનો ઉપયોગ કરીને ખોટી રીતે ડીકોડ કરવામાં આવે છે. ftfy પાયથોન લાઇબ્રેરી તમને મોજીબેકને ઠીક કરવામાં મદદ કરશે, જે NLP ઉપયોગના કેસોમાં ખૂબ જ ઉપયોગી છે.
!pip ftfy ઇન્સ્ટોલ કરો
print(ftfy.fix_text('“ftfyâ€\x9d.' નો ઉપયોગ કરીને વાક્ય સુધારો.')) print(ftfy.fix_text('✔ ટેક્સ્ટ સાથે કોઈ સમસ્યા નથી')) પ્રિન્ટ(ftfy.fix_text('à perturber la réflexion) '))
Mojibake ઉપરાંત, ftfy ખરાબ એન્કોડિંગ્સ, ખરાબ લાઇન એન્ડિંગ્સ અને ખરાબ અવતરણને ઠીક કરશે. નીચેના એન્કોડિંગ્સમાંથી એક તરીકે ડીકોડ કરવામાં આવેલ ટેક્સ્ટને સમજી શકે છે:
સ્કેચ એ અનન્ય AI કોડિંગ સહાયક છે જે ખાસ કરીને Python માં pandas લાઇબ્રેરી સાથે કામ કરતા વપરાશકર્તાઓ માટે રચાયેલ છે. તે વપરાશકર્તા ડેટાના સંદર્ભને સમજવા માટે મશીન લર્નિંગ અલ્ગોરિધમનો ઉપયોગ કરે છે અને ડેટા મેનીપ્યુલેશન અને વિશ્લેષણ કાર્યોને સરળ અને વધુ કાર્યક્ષમ બનાવવા માટે સંબંધિત કોડ સૂચનો પ્રદાન કરે છે. સ્કેચ માટે વપરાશકર્તાઓને તેમના IDE માં કોઈપણ વધારાના પ્લગ-ઈન્સ ઇન્સ્ટોલ કરવાની જરૂર નથી, જે તેને ઝડપી અને ઉપયોગમાં સરળ બનાવે છે. આ ડેટા-સંબંધિત કાર્યો માટે જરૂરી સમય અને પ્રયત્નને નોંધપાત્ર રીતે ઘટાડી શકે છે અને વપરાશકર્તાઓને બહેતર, વધુ કાર્યક્ષમ કોડ લખવામાં મદદ કરે છે.
!pip ઇન્સ્ટોલ સ્કેચ
આ લાઇબ્રેરીનો ઉપયોગ કરવા માટે અમારે પાંડા ડેટાફ્રેમમાં .sketch એક્સ્ટેંશન ઉમેરવાની જરૂર છે.
પુછવું સ્કેચની એક વિશેષતા છે જે વપરાશકર્તાઓને તેમના ડેટા વિશે કુદરતી ભાષાના ફોર્મેટમાં પ્રશ્નો પૂછવાની મંજૂરી આપે છે. વપરાશકર્તાની ક્વેરીનો ટેક્સ્ટ-આધારિત પ્રતિસાદ આપે છે.
# આયાત કરતી લાઇબ્રેરીઓ પીડી તરીકે સ્કેચ આયાત કરે છે પંડા # ડેટા વાંચવું (ઉદાહરણ તરીકે ટ્વિટર ડેટાનો ઉપયોગ કરીને) df = pd.read_csv("tweets.csv") print(df)
# પૂછવું કે કઈ કૉલમ કૅટેગરી પ્રકાર છે df.sketch.ask("કયા કૉલમ કૅટેગરી પ્રકાર છે?")
# ડેટાફ્રેમનો આકાર શોધવા માટે df.sketch.ask ("ડેટાફ્રેમનો આકાર શું છે")
.સ્કેચ.કેવી રીતે
કઈ રીતે એક એવી સુવિધા છે જે કોડનો બ્લોક પૂરો પાડે છે જેનો ઉપયોગ વિવિધ ડેટા-સંબંધિત કાર્યો માટે પ્રારંભિક અથવા અંતિમ બિંદુ તરીકે થઈ શકે છે. અમે તેમના ડેટાને સામાન્ય બનાવવા, નવી સુવિધાઓ બનાવવા, ડેટા ટ્રૅક કરવા અને મોડલ બનાવવા માટે કોડના સ્નિપેટ્સ માટે કહી શકીએ છીએ. આનાથી સમય બચશે અને કોડની નકલ અને પેસ્ટ કરવાનું સરળ બનશે; તમારે શરૂઆતથી મેન્યુઅલી કોડ લખવાની જરૂર નથી.
# લાગણીઓને વિઝ્યુઅલાઈઝ કરવા df.sketch.howto("ભાવનાઓને વિઝ્યુઅલાઈઝ કરો") માટે સ્નિપ કરેલ કોડ પ્રદાન કરવા માટે પૂછવું
.sketch.apply
.apply ફંક્શન તે નવા ફીચર્સ જનરેટ કરવામાં, ફીલ્ડ્સને પાર્સ કરવામાં અને અન્ય ડેટા મેનિપ્યુલેશન કરવામાં મદદ કરે છે. આ સુવિધાનો ઉપયોગ કરવા માટે, અમારી પાસે OpenAI એકાઉન્ટ હોવું જરૂરી છે અને કાર્યો કરવા માટે API કીનો ઉપયોગ કરવો જોઈએ. મેં આ સુવિધાનો પ્રયાસ કર્યો નથી.
ખાસ કરીને આ પુસ્તકાલયનો ઉપયોગ કરીને મને આનંદ થયો આવે તે કામ કરે છે, અને મને તે ઉપયોગી લાગે છે.
"pgeocode" એ એક ઉત્તમ લાઇબ્રેરી છે જેને મેં તાજેતરમાં જ ઠોકર મારી છે જે મારા અવકાશી વિશ્લેષણ પ્રોજેક્ટ્સ માટે અતિ ઉપયોગી છે. ઉદાહરણ તરીકે, તે તમને બે પોસ્ટલ કોડ વચ્ચેનું અંતર શોધવા માટે પરવાનગી આપે છે અને ઇનપુટ તરીકે દેશ અને પોસ્ટલ કોડ લઈને ભૌગોલિક માહિતી પ્રદાન કરે છે.
!pip pgeocode ઇન્સ્ટોલ કરો
ચોક્કસ પોસ્ટકોડ માટે ભૌગોલિક માહિતી મેળવો
# દેશ "ભારત" નોમી માટે તપાસી રહ્યું છે = pgeocode.Nominatim('In') # પોસ્ટકોડ nomi.query_postal_code(["620018", "620017", "620012"]) પસાર કરીને ભૌગોલિક માહિતી મેળવવી
"pgeocode" દેશ અને પોસ્ટકોડને ઇનપુટ તરીકે લઈને બે પોસ્ટકોડ વચ્ચેના અંતરની ગણતરી કરે છે. પરિણામ કિલોમીટરમાં દર્શાવવામાં આવે છે.
# બે પોસ્ટકોડ વચ્ચેનું અંતર શોધવું અંતર = pgeocode.GeoDistance('In') दूरी.query_postal_code("620018", "620012")
rembg એ બીજી ઉપયોગી લાઈબ્રેરી છે જે ઈમેજીસમાંથી બેકગ્રાઉન્ડને સરળતાથી દૂર કરે છે.
!pip rembg ઇન્સ્ટોલ કરો
# પુસ્તકાલયો આયાત કરી રહ્યા છીએ
gujarati rembg import remove import cv2 # ઇનપુટ ઇમેજનો પાથ (મારી ફાઇલ: image.jpeg) input_path = 'image.jpeg' # આઉટપુટ ઇમેજને સાચવવા અને આઉટપુટ તરીકે સાચવવા માટેનો માર્ગ.jpeg output_path = 'output.jpeg' # ઇનપુટ વાંચવું ઇમેજ ઇનપુટ = cv2.imread(input_path) # પૃષ્ઠભૂમિ આઉટપુટ દૂર કરી રહ્યું છે = દૂર(ઇનપુટ) # ફાઇલ સાચવી રહ્યું છે cv2.imwrite(output_path, આઉટપુટ)
તમે આમાંની કેટલીક લાઇબ્રેરીઓથી પહેલાથી જ પરિચિત હશો, પરંતુ મારા માટે, સ્કેચ, પેન્ડુલમ, pgeocode અને ftfy મારા ડેટા એન્જિનિયરિંગ કાર્ય માટે અનિવાર્ય છે. હું મારા પ્રોજેક્ટ માટે તેમના પર ઘણો આધાર રાખું છું.
માનવીકરણ” નંબરો, તારીખો અને સમય માટે સરળ, વાંચવા માટે સરળ સ્ટ્રિંગ ફોર્મેટિંગ પ્રદાન કરે છે. લાઇબ્રેરીનો ધ્યેય ડેટા લેવાનો અને તેને વધુ વપરાશકર્તા-મૈત્રીપૂર્ણ બનાવવાનો છે, ઉદાહરણ તરીકે "2 મિનિટ પહેલા" જેવી વધુ વાંચી શકાય તેવી સ્ટ્રિંગમાં સંખ્યાબંધ સેકન્ડોને રૂપાંતરિત કરીને. લાઇબ્રેરી ડેટાને વિવિધ રીતે ફોર્મેટ કરી શકે છે, જેમાં અલ્પવિરામ સાથે નંબરોનું ફોર્મેટિંગ, ટાઇમસ્ટેમ્પને સંબંધિત સમયમાં રૂપાંતરિત કરવું અને વધુનો સમાવેશ થાય છે.
હું મારા ડેટા એન્જીનિયરિંગ પ્રોજેક્ટ્સ માટે વારંવાર પૂર્ણાંકો અને ટાઇમસ્ટેમ્પનો ઉપયોગ કરું છું.
!pip હ્યુમનાઇઝ ઇન્સ્ટોલ કરો
# લાઇબ્રેરી આયાત કરી રહ્યું છે આયાત માનવીકરણ આયાત તારીખ સમય dt તરીકે # અલ્પવિરામ સાથે નંબરોનું ફોર્મેટિંગ a = humanize.intcomma(951009) # નંબરોને શબ્દોમાં રૂપાંતરિત કરવું b = humanize.intword(10046328394) #printing print(a) print(b)
dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) print(a) print(b)
Ercole Palmeri
રંગ દ્વારા સુંદર મોટર કૌશલ્ય વિકસાવવાથી બાળકોને લેખન જેવી વધુ જટિલ કુશળતા માટે તૈયાર કરવામાં આવે છે. રંગ કરવા માટે…
નૌકાદળ ક્ષેત્ર એ સાચી વૈશ્વિક આર્થિક શક્તિ છે, જેણે 150 અબજના બજાર તરફ નેવિગેટ કર્યું છે...
ગયા સોમવારે, ફાઇનાન્શિયલ ટાઇમ્સે OpenAI સાથેના સોદાની જાહેરાત કરી હતી. FT તેના વિશ્વ કક્ષાના પત્રકારત્વને લાઇસન્સ આપે છે...
લાખો લોકો સ્ટ્રીમિંગ સેવાઓ માટે ચૂકવણી કરે છે, માસિક સબ્સ્ક્રિપ્શન ફી ચૂકવે છે. સામાન્ય અભિપ્રાય છે કે તમે…