جیسا کہ غیر ساختہ ڈیٹا کا حجم تیزی سے بڑھ رہا ہے، درست اور موثر ٹیکسٹ اینالیٹکس ٹولز کی ضرورت مارکیٹنگ، فنانس، ہیلتھ کیئر، اور سوشل سائنسز جیسی متنوع صنعتوں میں تیزی سے اہم ہو گئی ہے۔
روایتی طور پر، متن کا تجزیہ اصول پر مبنی طریقوں اور مشین لرننگ تکنیک جیسے SpaCY اور ٹرانسفارمر تکنیک کا استعمال کرتے ہوئے کیا جاتا ہے۔ اگرچہ یہ طریقے کارآمد ثابت ہوئے ہیں، لیکن انہیں مکمل کرنے کے لیے کافی محنت اور مہارت درکار ہوتی ہے۔
بڑے لینگویج ماڈل (LLM) کی آمد کے ساتھ جیسے چیٹ جی پی ٹی di اوپنائی. اس نے انسانی جیسا متن پیدا کرنے اور سیاق و سباق کو سمجھنے میں قابل ذکر صلاحیتوں کا مظاہرہ کیا ہے، جس سے اسے متن کے تجزیہ کے کاموں کے لیے ایک امید افزا ٹول بنایا گیا ہے جیسے entity recognition
, sentiment analysis
اور topic modeling
.
آئیے اب دیکھتے ہیں کہ ہم ChatGPT کا استعمال کرتے ہوئے ٹیکسٹ پارسنگ کیسے کر سکتے ہیں۔
ماضی میں، ہم نے ہمیشہ مشین لرننگ میں مختلف کاموں کے لیے مختلف ماڈلز کا استعمال کیا ہے۔ مثال کے طور پر، اگر میں کسی متن سے علم نکالنا چاہتا ہوں، تو مجھے ایک نامزد ہستی کی شناخت کا ماڈل استعمال کرنے کی ضرورت ہوگی (NER – Named Entity Recognition
)، اگر مجھے اپنے متن کو الگ الگ کلاسوں میں درجہ بندی کرنے کی ضرورت ہے، تو مجھے درجہ بندی کے ماڈل کی ضرورت ہوگی۔ ہر مختلف سرگرمی کے لیے ماڈلز کو ہر سرگرمی کے لیے مختلف طریقے سے تربیت دینے کی ضرورت ہوتی ہے، یا تو منتقلی سیکھنے کے ذریعے یا تربیت کے ذریعے۔
کے تعارف کے ساتھ Large Language Models (LLM)، ایک LLM ماڈل تربیت کے ساتھ یا اس کے بغیر متعدد NLP کام انجام دینے کے قابل ہو گا۔ کوئی بھی سرگرمی ہو سکتی ہے۔ defiصرف اشارے میں ہدایات کو تبدیل کرکے nished.
اب دیکھتے ہیں کہ روایتی این ایل پی ٹاسک کو کیسے کرنا ہے۔ چیٹ جی پی ٹی اور اس کا روایتی انداز سے موازنہ کریں۔ NLP کے وہ کام جو انجام دیں گے۔ چیٹ جی پی ٹی اس مضمون میں ہیں:
Sentiment analysis
نام شدہ ہستی کی شناخت (NER) سے مراد متنی ڈیٹا کے مختلف بلاکس میں اصطلاحات کی خود بخود شناخت کا کام ہے۔ یہ بنیادی طور پر ہستی کے اہم زمروں کو نکالنے کے لیے استعمال کیا جاتا ہے جیسے طبی نوٹوں سے دوائیوں کے نام، انشورنس کے دعووں سے حادثے سے متعلق شرائط، اور ریکارڈز سے ڈومین سے متعلق دیگر اصطلاحات۔
نوٹ کریں کہ یہ سرگرمی میڈیکل ڈومین کے لیے مخصوص ہے۔ اس کے لیے ہمیں متن میں مخصوص کلاس اور اصطلاح کو جاننے کے لیے ایک ماڈل کے لیے ڈیٹا کی 10.000 سے زیادہ قطاروں کی تشریح اور تربیت کی ضرورت ہوتی تھی۔ چیٹ جی پی ٹی کسی بھی پہلے سے تربیت یافتہ متن یا فائن ٹیوننگ کے بغیر اصطلاح کی صحیح شناخت کر سکتا ہے، جو کہ نسبتاً اچھا نتیجہ ہے!
متن کی درجہ بندی سے مراد بڑے ڈیٹا سے متن کو تلاش کرنے اور ان کی درجہ بندی کرنے کا خودکار عمل ہے، یہ ٹیکسٹ ڈیٹا کی بازیافت اور نکالنے میں ایک اہم کردار ادا کرتا ہے۔ متن کی درجہ بندی کی ایپلی کیشنز کی مثالوں میں طبی انتباہات یا خطرے کے عنصر کی درجہ بندی، خودکار تشخیصی درجہ بندی، اور اسپام کا پتہ لگانا شامل ہیں۔
Sentiment analysis
Sentiment analysis
متن کے ایک ٹکڑے میں بیان کردہ احساس یا جذبات کا تعین کرنا شامل ہے۔ اس کا مقصد متن کو پہلے زمروں میں درجہ بندی کرنا ہے۔defiنائٹ، بطور مثبت، منفی، یا غیر جانبدار، مصنف کے ذریعے بیان کردہ بنیادی جذبات کی بنیاد پر۔
جذباتی تجزیہ کے اطلاقات میں شامل ہیں:
خودکار خلاصے اس عمل کا حوالہ دیتے ہیں جس کے ذریعے ایک یا زیادہ دستاویزات کے اہم عنوانات کی نشاندہی کی جاتی ہے اور ایک جامع اور درست انداز میں پیش کیا جاتا ہے۔ یہ صارف کو مختصر وقت میں ڈیٹا کے بڑے حصوں پر ایک نظر ڈالنے کی اجازت دیتا ہے۔ مثالی ایپلی کیشنز میں ایک سمری سسٹم شامل ہے جو خبروں کے مضامین سے خلاصہ کی خودکار تخلیق اور تحقیقی مقالے کے خلاصوں سے جملے نکال کر معلومات کا خلاصہ کرنے کی اجازت دیتا ہے۔
ChatGPT ایک بہترین سمری ٹول ہے، خاص طور پر طویل مضامین اور پیچیدہ جائزوں کے لیے۔ ChatGPT میں جائزے چسپاں کرنے سے، ہم آسانی سے ایک نظر میں پروڈکٹ کے جائزے کا خلاصہ جان سکتے ہیں۔
چونکہ اس مضمون کا مقصد متن کے تجزیہ کے کاموں کو انجام دینے کے لیے LLMs کی صلاحیت کو تلاش کرنا ہے، اس لیے ان کی حدود کو بھی پہچاننا ضروری ہے۔ LLMs کی کچھ اہم حدود میں شامل ہیں:
Ercole Palmeri
گوگل ڈیپ مائنڈ اپنے مصنوعی ذہانت کے ماڈل کا ایک بہتر ورژن متعارف کروا رہا ہے۔ نیا بہتر ماڈل نہ صرف فراہم کرتا ہے…
Laravel، جو اپنے خوبصورت نحو اور طاقتور خصوصیات کے لیے مشہور ہے، ماڈیولر فن تعمیر کے لیے بھی ایک ٹھوس بنیاد فراہم کرتا ہے۔ وہاں…
Cisco اور Splunk صارفین کو مستقبل کے سیکیورٹی آپریشن سینٹر (SOC) تک اپنے سفر کو تیز کرنے میں مدد کر رہے ہیں…
Ransomware پچھلے دو سالوں سے خبروں پر حاوی ہے۔ زیادہ تر لوگ اچھی طرح جانتے ہیں کہ حملے…
ایپل ویژن پرو کمرشل ویور کا استعمال کرتے ہوئے ایک آنکھ کا آپریشن کیٹینیا پولی کلینک میں کیا گیا…
رنگ کاری کے ذریعے موٹر کی عمدہ مہارتوں کو تیار کرنا بچوں کو لکھنے جیسی پیچیدہ مہارتوں کے لیے تیار کرتا ہے۔ رنگنے کے لیے…
بحری شعبہ ایک حقیقی عالمی اقتصادی طاقت ہے، جس نے 150 بلین کی مارکیٹ کی طرف گامزن کیا ہے۔
گزشتہ پیر کو، Financial Times نے OpenAI کے ساتھ ایک معاہدے کا اعلان کیا۔ FT نے اپنی عالمی سطح کی صحافت کا لائسنس…