Чланци

Невероватне, али мало познате Питхон библиотеке

Питхон програмер је увек у потрази за новим библиотекама, које могу побољшати рад у пројектима инжењеринга података и пословне интелигенције.

У овом чланку видимо неке мало познате, али веома корисне Питхон библиотеке:

1. Клатно

Иако су многе библиотеке доступне у Питон за ДатеТиме, сматрам да је Пендулум лак за употребу у било којој операцији датума. Клатно је моја омиљена полица за књиге за свакодневну употребу на послу. Проширује уграђени Питхон модул датума и времена, додајући интуитивнији АПИ за управљање временским зонама и извођење операција датума и времена као што су додавање временских интервала, одузимање датума и конверзија између временских зона. Пружа једноставан и интуитиван АПИ за форматирање датума и времена.

Инсталација
!pip install pendulum
пример
# import library

import pendulum
dt = pendulum.datetime(2023, 1, 31)
print(dt)
 
#local() creates datetime instance with local timezone

local = pendulum.local(2023, 1, 31)
print("Local Time:", local)
print("Local Time Zone:", local.timezone.name)

# Printing UTC time

utc = pendulum.now('UTC')
print("Current UTC time:", utc)
 
# Converting UTC timezone into Europe/Paris time

europe = utc.in_timezone('Europe/Paris')
print("Current time in Paris:", europe)
Излаз

2. фтфи

Да ли сте се сусрели када се страни језик у подацима не појављује исправно? Ово се зове Мојибаке. Мојибаке је термин који се користи за описивање искривљеног или шифрованог текста који се јавља као резултат проблема кодирања или декодирања. Обично се дешава када се текст написан једним кодирањем знакова погрешно декодира коришћењем другог кодирања. фтфи питхон библиотека ће вам помоћи да поправите Мојибаке, што је веома корисно у случајевима коришћења НЛП-а.

Инсталација
!пип инсталл фтфи
пример
принт(фтфи.фик_тект('Исправи реченицу користећи а€œфтфиа€\к9д.')) принт(фтфи.фик_тект('аœ” Нема проблема са текстом')) принт(фтфи.фик_тект('А пертурбер ла рА©флекион '))
Излаз

Поред Мојибаке-а, фтфи ће поправити лоша кодирања, лоше завршетке линија и лоше цитате. може да разуме текст који је декодован као једно од следећих кодирања:

  • латиница-1 (ИСО-8859–1)
  • Виндовс-1252 (цп1252 — користи се у Мицрософт производима)
  • Виндовс-1251 (цп1251 — руска верзија цп1252)
  • Виндовс-1250 (цп1250 — источноевропска верзија цп1252)
  • ИСО-8859–2 (што није потпуно исто као Виндовс-1250)
  • МацРоман (користи се на Мац ОС 9 и ранијим верзијама)
  • цп437 (користи се у МС-ДОС-у и неким верзијама Виндовс командне линије)

3. Скица

Скетцх је јединствени помоћник за АИ кодирање дизајниран посебно за кориснике који раде са библиотеком панда у Питхон-у. Користи алгоритме машинског учења за разумевање контекста корисничких података и пружа релевантне предлоге кода како би манипулацију подацима и задатке анализе учинили лакшим и ефикаснијим. Скетцх не захтева од корисника да инсталирају додатне додатке у свој ИДЕ, што га чини брзим и лаким за коришћење. Ово може значајно смањити време и труд који су потребни за задатке у вези са подацима и помоћи корисницима да пишу бољи, ефикаснији код.

Инсталација
!пип инсталацијска скица
пример

Морамо да додамо екстензију .скетцх у пандас датафраме да бисмо користили ову библиотеку.

.скетцх.аск

питати је карактеристика Скетцх-а која омогућава корисницима да постављају питања о својим подацима у формату природног језика. Пружа текстуални одговор на упит корисника.

# Увоз библиотека увози скице импорт панда као пд # Читање података (користећи твиттер податке као пример) дф = пд.реад_цсв("твеетс.цсв") принт(дф)
# Питам које су колоне типа категорије дф.скетцх.аск("Које колоне су типа категорије?")
Излаз
# Да бисте пронашли облик оквира података дф.скетцх.аск("Који је облик оквира података")

.скица.ховто

Ховто је функција која обезбеђује блок кода који се може користити као почетна или завршна тачка за различите задатке у вези са подацима. Можемо тражити исечке кода за нормализацију њихових података, креирање нових функција, праћење података, па чак и прављење модела. Ово ће уштедети време и олакшати копирање и лепљење кода; не морате ручно писати код од нуле.

# Тражим да се обезбеди исечен код за визуелизацију емоција дф.скетцх.ховто("Визуализуј емоције")
Излаз

.скица.примени

Функција .аппли помаже у генерисању нових функција, рашчлањивању поља и обављању других манипулација подацима. Да бисмо користили ову функцију, потребно је да имамо ОпенАИ налог и да користимо АПИ кључ за обављање задатака. Нисам пробао ову функцију.

Посебно сам уживао у коришћењу ове библиотеке како ради и сматрам да је корисно.

4. пгеокод

„пгеоцоде“ је одлична библиотека на коју сам недавно наишао и која је била невероватно корисна за моје пројекте просторне анализе. На пример, омогућава вам да пронађете растојање између два поштанска кода и пружа географске информације узимајући земљу и поштански број као улаз.

Инсталација
!пип инсталл пгеоцоде
пример

Добијте географске информације за одређене поштанске бројеве

# Провера земље "Индија" номи = пгеоцоде.Номинатим('Ин') # Добијање географских информација прослеђивањем поштанских бројева номи.куери_постал_цоде(["620018", "620017", "620012"])
Излаз

„пгеоцоде“ израчунава растојање између два поштанска броја узимајући земљу и поштанске бројеве као улаз. Резултат се изражава у километрима.

# Проналажење удаљености између два поштанска броја дистанце = пгеоцоде.ГеоДистанце('Ин') дистанце.куери_постал_цоде("620018", "620012")
Излаз

5. рембг

рембг је још једна корисна библиотека која лако уклања позадину са слика.

Инсталација
!пип инсталл рембг
пример
# Увоз библиотека
фром рембг импорт ремове импорт цв2 # путања улазне слике (мој фајл: имаге.јпег) инпут_патх = 'имаге.јпег' # путања за чување излазне слике и чување као оутпут.јпег оутпут_патх = 'оутпут.јпег' # Читање улаза имаге инпут = цв2.имреад(инпут_патх) # Уклањање позадинског излаза = ремове(инпут) # Чување датотеке цв2.имврите(оутпут_патх, оутпут)
Излаз

Можда сте већ упознати са неким од ових библиотека, али за мене су Скетцх, Пендулум, пгеоцоде и фтфи неопходни за мој рад на инжењерингу података. Много се ослањам на њих за своје пројекте.

6. Хуманизовати

Хуманизе“ пружа једноставно, лако читљиво форматирање стрингова за бројеве, датуме и времена. Циљ библиотеке је да узме податке и учини их лакшим за коришћење, на пример претварањем броја секунди у читљивији стринг као што је „пре 2 минута“. Библиотека може да форматира податке на различите начине, укључујући форматирање бројева са зарезима, претварање временских ознака у релативна времена и још много тога.

Често користим целе бројеве и временске ознаке за своје пројекте инжењеринга података.

Инсталација
!пип инсталл хуманизе
Пример (цели бројеви)
# Увоз библиотеке импорт хуманизе импорт датетиме као дт # Форматирање бројева са зарезом а = хуманизе.интцомма(951009) # претварање бројева у речи б = хуманизе.интворд(10046328394) #штампање принт(а) принт(б)
Излаз
Пример (датум и време)
импорт хуманизе импорт датетиме ас дт а = хуманизе.натуралдате(дт.дате(2012, 6, 5)) б = хуманизе.натуралдаи(дт.дате(2012, 6, 5)) принт(а) принт(б)

Ercole Palmeri

Иновациони билтен
Не пропустите најважније вести о иновацијама. Пријавите се да их примате путем е-поште.
Ознаке: питон

Недавни чланци

Предности бојанка за децу - свет магије за све узрасте

Развијање финих моторичких вештина кроз бојење припрема децу за сложеније вештине попут писања. Боји…

КСНУМКС Мај КСНУМКС

Будућност је ту: Како бродарска индустрија револуционише глобалну економију

Поморски сектор је права глобална економска сила, која је кренула ка тржишту од 150 милијарди...

КСНУМКС Мај КСНУМКС

Издавачи и ОпенАИ потписују уговоре за регулисање протока информација које обрађује вештачка интелигенција

Прошлог понедељка, Финанциал Тимес је објавио договор са ОпенАИ. ФТ лиценцира своје новинарство светске класе…

КСНУМКС април КСНУМКС

Онлине плаћања: Ево како вас услуге стримовања чине да плаћате заувек

Милиони људи плаћају услуге стриминга, плаћајући месечне претплате. Увријежено је мишљење да сте…

КСНУМКС април КСНУМКС

Прочитајте Иновације на свом језику

Иновациони билтен
Не пропустите најважније вести о иновацијама. Пријавите се да их примате путем е-поште.

Пратите нас