ເນື່ອງຈາກປະລິມານຂໍ້ມູນທີ່ບໍ່ມີໂຄງສ້າງຍັງສືບຕໍ່ຂະຫຍາຍຕົວ, ຄວາມຕ້ອງການສໍາລັບເຄື່ອງມືການວິເຄາະຂໍ້ຄວາມທີ່ຖືກຕ້ອງແລະມີປະສິດທິພາບໄດ້ກາຍເປັນຄວາມສໍາຄັນເພີ່ມຂຶ້ນໃນທົ່ວອຸດສາຫະກໍາຕ່າງໆເຊັ່ນການຕະຫຼາດ, ການເງິນ, ການດູແລສຸຂະພາບ, ແລະວິທະຍາສາດສັງຄົມ.
ຕາມປະເພນີ, ການວິເຄາະຂໍ້ຄວາມໄດ້ຖືກປະຕິບັດໂດຍໃຊ້ວິທີການທີ່ອີງໃສ່ກົດລະບຽບແລະເຕັກນິກການຮຽນຮູ້ເຄື່ອງຈັກເຊັ່ນ SpaCY ແລະເຕັກນິກການຫັນປ່ຽນ. ໃນຂະນະທີ່ວິທີການເຫຼົ່ານີ້ໄດ້ພິສູດປະສິດທິພາບ, ພວກເຂົາເຈົ້າຮຽກຮ້ອງໃຫ້ມີຄວາມພະຍາຍາມຢ່າງຫຼວງຫຼາຍແລະຄວາມຊໍານານທີ່ຈະສົມບູນແບບ.
ກັບການມາເຖິງຂອງຮູບແບບພາສາຂະຫນາດໃຫຍ່ (LLM) ເຊັ່ນ: ສົນທະນາ GPT di OpenAI. ມັນໄດ້ສະແດງໃຫ້ເຫັນຄວາມສາມາດທີ່ໂດດເດັ່ນໃນການສ້າງຂໍ້ຄວາມທີ່ຄ້າຍຄືກັບມະນຸດແລະຄວາມເຂົ້າໃຈໃນສະພາບການ, ເຮັດໃຫ້ມັນເປັນເຄື່ອງມືທີ່ໂດດເດັ່ນສໍາລັບວຽກງານການວິເຄາະຂໍ້ຄວາມເຊັ່ນ: entity recognition
, sentiment analysis
, e topic modeling
.
ຕອນນີ້ເຮົາມາເບິ່ງວິທີທີ່ພວກເຮົາສາມາດປະຕິບັດການແຍກຂໍ້ຄວາມໂດຍໃຊ້ ChatGPT.
ໃນໄລຍະຜ່ານມາ, ພວກເຮົາເຄີຍໃຊ້ແບບຈໍາລອງທີ່ແຕກຕ່າງກັນສໍາລັບວຽກງານທີ່ແຕກຕ່າງກັນໃນການຮຽນຮູ້ເຄື່ອງຈັກ. ຕົວຢ່າງ, ຖ້າຂ້ອຍຕ້ອງການສະກັດຄວາມຮູ້ຈາກຂໍ້ຄວາມ, ຂ້ອຍຈະຕ້ອງໃຊ້ຕົວແບບການຮັບຮູ້ຫນ່ວຍງານທີ່ມີຊື່ (NER – Named Entity Recognition
), ຖ້າຂ້ອຍຕ້ອງການຈັດປະເພດຂໍ້ຄວາມຂອງຂ້ອຍເປັນຫ້ອງຮຽນແຍກຕ່າງຫາກ, ຂ້ອຍຈໍາເປັນຕ້ອງມີຮູບແບບການຈັດປະເພດ. ແຕ່ລະກິດຈະກໍາທີ່ແຕກຕ່າງກັນຕ້ອງການຕົວແບບທີ່ຈະໄດ້ຮັບການຝຶກອົບຮົມທີ່ແຕກຕ່າງກັນສໍາລັບແຕ່ລະກິດຈະກໍາ, ບໍ່ວ່າຈະເປັນການຖ່າຍທອດການຮຽນຮູ້ຫຼືໂດຍການຝຶກອົບຮົມ.
ດ້ວຍການແນະນໍາຂອງ Large Language Models (LLM), ຮູບແບບ LLM ຈະສາມາດປະຕິບັດວຽກງານ NLP ຫຼາຍດ້ວຍຫຼືບໍ່ມີການຝຶກອົບຮົມ. ທຸກໆກິດຈະກໍາສາມາດເປັນ defiສໍາເລັດພຽງແຕ່ໂດຍການດັດແກ້ຄໍາແນະນໍາໃນ prompts.
ຕອນນີ້ໃຫ້ເບິ່ງວິທີການປະຕິບັດວຽກງານ NLP ແບບດັ້ງເດີມໃນ ສົນທະນາ GPT ແລະປຽບທຽບມັນກັບວິທີການພື້ນເມືອງ. ວຽກງານ NLP ທີ່ຈະປະຕິບັດໂດຍ ສົນທະນາ GPT ໃນບົດຄວາມນີ້ແມ່ນ:
Sentiment analysis
ການຮັບຮູ້ Entity ທີ່ມີຊື່ (NER) ຫມາຍເຖິງວຽກງານຂອງການກໍານົດເງື່ອນໄຂອັດຕະໂນມັດໃນບລັອກທີ່ແຕກຕ່າງກັນຂອງຂໍ້ມູນຂໍ້ຄວາມ. ມັນຖືກນໍາໃຊ້ຕົ້ນຕໍເພື່ອສະກັດເອົາປະເພດນິຕິບຸກຄົນທີ່ສໍາຄັນເຊັ່ນ: ຊື່ຢາຈາກບັນທຶກທາງດ້ານການຊ່ວຍ, ຂໍ້ກໍານົດທີ່ກ່ຽວຂ້ອງກັບອຸປະຕິເຫດຈາກການຮຽກຮ້ອງປະກັນໄພ, ແລະຂໍ້ກໍານົດສະເພາະໂດເມນອື່ນໆຈາກບັນທຶກ.
ໃຫ້ສັງເກດວ່າກິດຈະກໍານີ້ແມ່ນສະເພາະກັບໂດເມນທາງການແພດ. ມັນເຄີຍຮຽກຮ້ອງໃຫ້ພວກເຮົາອະທິບາຍແລະຝຶກອົບຮົມຂໍ້ມູນຫຼາຍກວ່າ 10.000 ແຖວສໍາລັບຕົວແບບດຽວເພື່ອໃຫ້ຮູ້ເຖິງຊັ້ນຮຽນແລະຄໍາສັບສະເພາະໃນຂໍ້ຄວາມ. ChatGPT ສາມາດລະບຸຄໍາສັບໄດ້ຢ່າງຖືກຕ້ອງໂດຍບໍ່ມີຂໍ້ຄວາມທີ່ຜ່ານການຝຶກອົບຮົມຫຼືການປັບຕົວ, ເຊິ່ງເປັນຜົນດີທີ່ຂ້ອນຂ້າງ!
ການຈັດປະເພດຂໍ້ຄວາມຫມາຍເຖິງຂະບວນການອັດຕະໂນມັດຂອງການຊອກຫາແລະການຈັດປະເພດຂໍ້ຄວາມເຂົ້າໄປໃນຫມວດຫມູ່ຈາກຂໍ້ມູນຂະຫນາດໃຫຍ່, ມັນມີບົດບາດສໍາຄັນໃນການຄົ້ນຫາແລະການສະກັດເອົາຂໍ້ມູນຂໍ້ຄວາມ. ຕົວຢ່າງຂອງຄໍາຮ້ອງສະຫມັກການຈັດປະເພດຂໍ້ຄວາມປະກອບມີການແຈ້ງເຕືອນທາງດ້ານຄລີນິກຫຼືການຈັດປະເພດປັດໃຈຄວາມສ່ຽງ, ການຈັດປະເພດການວິນິດໄສອັດຕະໂນມັດແລະການກວດສອບ spam.
Sentiment analysis
Sentiment analysis
ກ່ຽວຂ້ອງກັບການກຳນົດຄວາມຮູ້ສຶກ ຫຼືຄວາມຮູ້ສຶກທີ່ສະແດງອອກໃນຂໍ້ຄວາມໃດໜຶ່ງ. ມັນມີຈຸດປະສົງເພື່ອຈັດປະເພດຂໍ້ຄວາມເຂົ້າໄປໃນປະເພດກ່ອນdefinite, ເຊັ່ນ: ບວກ, ລົບຫຼືເປັນກາງ, ອີງໃສ່ຄວາມຮູ້ສຶກທີ່ຕິດພັນໂດຍຜູ້ຂຽນ.
ການນໍາໃຊ້ການວິເຄາະຄວາມຮູ້ສຶກປະກອບມີ:
ການສະຫຼຸບອັດຕະໂນມັດຫມາຍເຖິງຂະບວນການທີ່ຫົວຂໍ້ຕົ້ນຕໍຂອງເອກະສານຫນຶ່ງຫຼືຫຼາຍກວ່ານັ້ນຖືກລະບຸແລະນໍາສະເຫນີໃນລັກສະນະທີ່ຊັດເຈນແລະຖືກຕ້ອງ. ອັນນີ້ເຮັດໃຫ້ຜູ້ໃຊ້ສາມາດເບິ່ງຂໍ້ມູນຈໍານວນຫຼວງຫຼາຍໃນເວລາສັ້ນໆ. ຄໍາຮ້ອງສະຫມັກຕົວຢ່າງປະກອບມີລະບົບການສະຫຼຸບທີ່ອະນຸຍາດໃຫ້ການຜະລິດອັດຕະໂນມັດຂອງບົດຄັດຫຍໍ້ຈາກບົດຄວາມຂ່າວແລະການສະຫຼຸບຂອງຂໍ້ມູນໂດຍການສະກັດປະໂຫຍກຈາກບົດຄັດຫຍໍ້ຂອງການຄົ້ນຄວ້າ.
ChatGPT ເປັນເຄື່ອງມືສະຫຼຸບທີ່ດີເລີດ, ໂດຍສະເພາະສໍາລັບບົດຄວາມຍາວແລະການທົບທວນທີ່ສັບສົນ. ໂດຍການວາງບົດວິຈານໃນ ChatGPT, ພວກເຮົາສາມາດຮູ້ບົດສະຫຼຸບການທົບທວນຜະລິດຕະພັນໄດ້ຢ່າງງ່າຍດາຍໃນທັນທີ.
ເນື່ອງຈາກຈຸດປະສົງຂອງບົດຄວາມນີ້ແມ່ນເພື່ອຄົ້ນຫາຄວາມສາມາດຂອງ LLMs ໃນການປະຕິບັດວຽກງານການວິເຄາະຂໍ້ຄວາມ, ມັນເປັນສິ່ງຈໍາເປັນທີ່ຈະຮັບຮູ້ຂໍ້ຈໍາກັດຂອງເຂົາເຈົ້າ. ບາງຂໍ້ຈໍາກັດທີ່ສໍາຄັນຂອງ LLMs ປະກອບມີ:
Ercole Palmeri
ວັນຈັນທີ່ຜ່ານມາ, Financial Times ໄດ້ປະກາດຂໍ້ຕົກລົງກັບ OpenAI. FT ອະນຸຍາດໃຫ້ນັກຂ່າວລະດັບໂລກຂອງຕົນ…
ຫລາຍລ້ານຄົນຈ່າຍຄ່າບໍລິການສະຕີມ, ຈ່າຍຄ່າທໍານຽມການສະຫມັກປະຈໍາເດືອນ. ມັນເປັນຄວາມຄິດເຫັນທົ່ວໄປທີ່ທ່ານ…
Coveware ໂດຍ Veeam ຈະສືບຕໍ່ໃຫ້ບໍລິການຕອບໂຕ້ເຫດການ extortion cyber. Coveware ຈະສະ ເໜີ ຄວາມສາມາດດ້ານນິຕິສາດແລະການແກ້ໄຂ…
ການຮັກສາການຄາດເດົາແມ່ນການປະຕິວັດຂະແໜງນ້ຳມັນ ແລະ ອາຍແກັສ, ດ້ວຍແນວທາງນະວັດຕະກໍາ ແລະ ຕັ້ງໜ້າໃນການຄຸ້ມຄອງພືດ.…