Հոդվածներ

Զարմանալի, բայց քիչ հայտնի Python գրադարաններ

Python-ի ծրագրավորողը միշտ փնտրում է նոր գրադարաններ, որոնք կարող են բարելավել աշխատանքը տվյալների ճարտարագիտության և բիզնես հետախուզության նախագծերում:

Այս հոդվածում մենք տեսնում ենք մի քանի քիչ հայտնի, բայց շատ օգտակար python գրադարաններ.

1. Pոճանակ

Չնայած նրան, որ շատ գրադարաններ կան այստեղ Python DateTime-ի համար ես գտնում եմ, որ ճոճանակը հեշտ է օգտագործել ցանկացած ամսաթվի գործողության ժամանակ: Ճոճանակն իմ ամենասիրած գրապահարանն է, որն իմ ամենօրյա օգտագործումն է աշխատավայրում: Ընդլայնում է ներկառուցված Python datetime մոդուլը՝ ավելացնելով ավելի ինտուիտիվ API՝ ժամային գոտիները կառավարելու և ամսաթվի և ժամի գործողություններ կատարելու համար, ինչպիսիք են ժամանակային ընդմիջումներ ավելացնելը, ամսաթվերը հանելը և ժամային գոտիների միջև փոխակերպումը: Ապահովում է պարզ և ինտուիտիվ API՝ ամսաթվերի և ժամերի ձևաչափման համար:

Տեղադրեք
!pip install pendulum
օրինակ
# import library

import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
 
#local() creates datetime instance with local timezone

local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)

# Printing UTC time

utc = pendulum.now('UTC')
print("Current UTC time:", utc)
 
# Converting UTC timezone into Europe/Paris time

europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
Արտադրողականություն

2. ftfy

Հանդիպե՞լ եք, երբ տվյալների մեջ օտար լեզուն ճիշտ չի երևում։ Սա կոչվում է Mojibake: Mojibake-ը տերմին է, որն օգտագործվում է նկարագրելու աղավաղված կամ խճճված տեքստը, որն առաջանում է կոդավորման կամ վերծանման խնդիրների հետևանքով: Սովորաբար դա տեղի է ունենում, երբ մեկ նիշի կոդավորմամբ գրված տեքստը սխալ է վերծանվում՝ օգտագործելով այլ կոդավորում: ftfy python գրադարանը կօգնի ձեզ շտկել Mojibake-ը, որը շատ օգտակար է NLP-ի օգտագործման դեպքերում։

Տեղադրեք
!pip install ftfy
օրինակ
print(ftfy.fix_text('Ուղղիր նախադասությունը՝ օգտագործելով “ftfyâ€\x9d')) print(ftfy.fix_text('✔ Տեքստի հետ խնդիրներ չկան')) print(ftfy.fix_text('à perturber la réflexion '))
Արտադրողականություն

Բացի Mojibake-ից, ftfy-ն կշտկի վատ կոդավորումները, վատ տողերի վերջավորությունները և վատ մեջբերումները: կարող է հասկանալ տեքստը, որը վերծանվել է որպես հետևյալ կոդավորումներից մեկը.

  • Լատինական-1 (ISO-8859–1)
  • Windows-1252 (cp1252 — օգտագործվում է Microsoft-ի արտադրանքներում)
  • Windows-1251 (cp1251 — cp1252-ի ռուսերեն տարբերակը)
  • Windows-1250 (cp1250 — cp1252-ի արևելաեվրոպական տարբերակը)
  • ISO-8859–2 (որը բոլորովին նույնը չէ Windows-1250-ին)
  • MacRoman (օգտագործվում է Mac OS 9-ում և ավելի վաղ)
  • cp437 (օգտագործվում է MS-DOS-ում և Windows հրամանի տողի որոշ տարբերակներում)

3 Ուրվագիծ

Sketch-ը եզակի AI կոդավորման օգնական է, որը նախատեսված է հատուկ Python-ում պանդաների գրադարանի հետ աշխատող օգտատերերի համար: Այն օգտագործում է մեքենայական ուսուցման ալգորիթմներ՝ հասկանալու օգտատերերի տվյալների համատեքստը և տրամադրում է համապատասխան կոդերի առաջարկներ՝ տվյալների մանիպուլյացիայի և վերլուծության առաջադրանքները ավելի հեշտ և արդյունավետ դարձնելու համար: Sketch-ը չի պահանջում օգտատերերից իրենց IDE-ում տեղադրել լրացուցիչ հավելումներ՝ դարձնելով այն արագ և հեշտ օգտագործման համար: Սա կարող է զգալիորեն նվազեցնել տվյալների հետ կապված առաջադրանքների համար պահանջվող ժամանակը և ջանքերը և օգնել օգտվողներին գրել ավելի լավ, ավելի արդյունավետ կոդ:

Տեղադրեք
!pip install sketch
օրինակ

Այս գրադարանն օգտագործելու համար մենք պետք է ավելացնենք .sketch ընդլայնում pandas dataframe-ում:

.ուրվագիծ.հարցրեք

խնդրել Sketch-ի առանձնահատկությունն է, որը թույլ է տալիս օգտատերերին հարցեր տալ իրենց տվյալների վերաբերյալ բնական լեզվով: Տրամադրում է տեքստի վրա հիմնված պատասխան օգտվողի հարցմանը:

# Ներմուծող գրադարաններ ներմուծում են էսքիզ ներմուծվող պանդաները որպես pd # Տվյալների ընթերցում (օգտագործելով twitter-ի տվյալները որպես օրինակ) df = pd.read_csv("tweets.csv") print(df)
# Հարցնում, թե որ սյունակներն են կատեգորիայի տիպը df.sketch.ask («Ո՞ր սյունակներն են կատեգորիայի տեսակը»):
Արտադրողականություն
# Տվյալների շրջանակի ձևը գտնելու համար df.sketch.ask («Ինչ է տվյալների շրջանակի ձևը»)

.ուրվագիծ.ինչպես

Ինչպես հատկություն է, որն ապահովում է կոդի բլոկ, որը կարող է օգտագործվել որպես ելակետ կամ վերջնակետ տվյալների հետ կապված տարբեր առաջադրանքների համար: Մենք կարող ենք խնդրել կոդի հատվածներ՝ իրենց տվյալները նորմալացնելու, նոր հնարավորություններ ստեղծելու, տվյալների հետևելու և նույնիսկ մոդելներ ստեղծելու համար: Սա կխնայի ժամանակը և կհեշտացնի ծածկագրի պատճենումը և տեղադրումը. պետք չէ կոդը ձեռքով զրոյից գրել:

# Խնդրում ենք տրամադրել կտրված կոդը՝ զգացմունքները պատկերացնելու համար df.sketch.howto («Պատկերացրեք զգացմունքները»)
Արտադրողականություն

.ուրվագիծ.դիմել

Դիմել ֆունկցիան այն օգնում է ստեղծել նոր հնարավորություններ, վերլուծել դաշտերը և կատարել տվյալների այլ մանիպուլյացիաներ: Այս հնարավորությունն օգտագործելու համար մենք պետք է ունենանք OpenAI հաշիվ և օգտագործենք API ստեղնը՝ առաջադրանքները կատարելու համար: Ես չեմ փորձել այս գործառույթը:

Ինձ դուր եկավ հատկապես այս գրադարանից օգտվելը Գալ այն աշխատում է, և ես գտնում եմ, որ այն օգտակար է:

4. pgeocode

«pgeocode»-ը հիանալի գրադարան է, որը ես վերջերս պատահաբար հանդիպեցի, որը աներևակայելի օգտակար էր իմ տարածական վերլուծության նախագծերի համար: Օրինակ, այն թույլ է տալիս գտնել երկու փոստային ինդեքսների միջև հեռավորությունը և տրամադրում է աշխարհագրական տեղեկատվություն՝ որպես մուտքագրում երկիր և փոստային ինդեքս:

Տեղադրեք
!pip տեղադրել pgeocode
օրինակ

Ստացեք աշխարհագրական տեղեկատվություն կոնկրետ փոստային ինդեքսների համար

# Ստուգում է երկրի «Հնդկաստան» nomi = pgeocode.Nominatim('In') # Ստացեք աշխարհագրական տեղեկատվություն՝ փոխանցելով փոստային կոդերը nomi.query_postal_code(["620018", "620017", "620012"])
Արտադրողականություն

«pgeocode»-ը հաշվարկում է երկու փոստային ինդեքսների միջև եղած հեռավորությունը՝ որպես մուտքագրում ընդունելով երկիրը և փոստային ինդեքսները: Արդյունքն արտահայտվում է կիլոմետրերով։

# Գտնել հեռավորություն երկու փոստային կոդերի միջև հեռավորություն = pgeocode.GeoDistance('In') distance.query_postal_code("620018", "620012")
Արտադրողականություն

5. rembg

rembg-ը ևս մեկ օգտակար գրադարան է, որը հեշտությամբ հեռացնում է ֆոնը պատկերներից:

Տեղադրեք
!pip install rembg
օրինակ
# Գրադարանների ներմուծում
rembg ներմուծումից հեռացնել ներմուծումը cv2 # մուտքագրման պատկերի ուղին (իմ ֆայլը՝ image.jpeg) input_path = 'image.jpeg' # ուղի ելքային պատկերը պահելու և որպես output.jpeg output_path = 'output.jpeg' # Մուտքի ընթերցում պատկերի մուտքագրում = cv2.imread(մուտքագրման_ուղի) # Հեռացնելով ֆոնային ելքը = հեռացնել(մուտքագրում) # Ֆայլի պահպանում cv2.imwrite(ելքի_ուղի, ելք)
Արտադրողականություն

Հնարավոր է, որ դուք արդեն ծանոթ եք այս գրադարաններից մի քանիսին, բայց ինձ համար Sketch, Pendulum, pgeocode և ftfy-ն անփոխարինելի են իմ տվյալների ինժեներական աշխատանքի համար: Իմ նախագծերում ես շատ եմ ապավինում նրանց:

6. Մարդկայնացնել

Humanize»–ն ապահովում է թվերի, ամսաթվերի և ժամերի պարզ, հեշտ ընթեռնելի տողերի ձևաչափում։ Գրադարանի նպատակն է վերցնել տվյալները և դրանք ավելի հարմար դարձնել օգտատերերի համար, օրինակ՝ մի քանի վայրկյան վերածելով ավելի ընթեռնելի տողի, ինչպիսին է «2 րոպե առաջ»: Գրադարանը կարող է ֆորմատավորել տվյալները տարբեր ձևերով, այդ թվում՝ թվերի ձևաչափումը ստորակետերով, ժամանակի դրոշմանիշները հարաբերական ժամանակների փոխակերպում և այլն:

Ես հաճախ օգտագործում եմ ամբողջ թվեր և ժամանակի դրոշմներ իմ տվյալների ինժեներական նախագծերի համար:

Տեղադրեք
!pip install humanize
Օրինակ (ամբողջ թվեր)
# Ներմուծող գրադարանի ներմուծում մարդկայնացնել ներմուծման ամսաթիվը որպես dt # Թվերի ձևաչափում ստորակետով a = humanize.intcomma(951009) # թվերի վերածում բառերի b = humanize.intword(10046328394) #printing print(a) print(b)
Արտադրողականություն
Օրինակ (ամսաթիվ և ժամ)
ներմուծել հումանիզացնել ներմուծման ամսաթիվը ժամը որպես dt a = humanize.naturaldate(dt.date(2012, 6, 5)) b = humanize.naturalday(dt.date(2012, 6, 5)) print(a) print(b)

Ercole Palmeri

Նորարարության տեղեկագիր
Բաց մի թողեք նորարարության մասին ամենակարևոր նորությունները: Գրանցվեք դրանք էլփոստով ստանալու համար:
Tags: Python

Վերջին հոդվածները

Նորարարական միջամտություն ընդլայնված իրականության մեջ, Apple-ի դիտողի հետ Կատանիայի պոլիկլինիկայում

Կատանիայի պոլիկլինիկայում ակնաբուժական վիրահատություն է կատարվել Apple Vision Pro գովազդային հեռուստադիտողի միջոցով…

3 Մայիս 2024

Երեխաների գունազարդման էջերի առավելությունները՝ կախարդական աշխարհ բոլոր տարիքի համար

Գունավորելու միջոցով նուրբ շարժիչ հմտությունների զարգացումը երեխաներին պատրաստում է ավելի բարդ հմտությունների, ինչպիսին է գրելը: Գունավորելու…

2 Մայիս 2024

Ապագան այստեղ է. Ինչպես է բեռնափոխադրման արդյունաբերությունը հեղափոխում համաշխարհային տնտեսությունը

Ծովային ոլորտը իսկական համաշխարհային տնտեսական տերություն է, որը նավարկվել է դեպի 150 միլիարդանոց շուկա...

1 Մայիս 2024

Հրատարակիչները և OpenAI-ը ստորագրում են համաձայնագրեր՝ արհեստական ​​ինտելեկտի կողմից մշակվող տեղեկատվության հոսքը կարգավորելու համար

Անցյալ երկուշաբթի Financial Times-ը հայտարարեց OpenAI-ի հետ գործարքի մասին: FT-ն արտոնագրում է իր համաշխարհային մակարդակի լրագրությունը…

30 Ապրիլ 2024

Կարդացեք նորարարությունը ձեր լեզվով

Նորարարության տեղեկագիր
Բաց մի թողեք նորարարության մասին ամենակարևոր նորությունները: Գրանցվեք դրանք էլփոստով ստանալու համար:

Հետեւեք մեզ