Gwybodeg

Mathau o Ddysgu Peiriannau

Mae'r term Dysgu Peiriant (dysgu awtomatig) yn cyfeirio at set o fecanweithiau sy'n perthyn i fyd deallusrwydd artiffisial. Mae tri math o ddysgu peirianyddol: dysgu dan oruchwyliaeth, dysgu heb oruchwyliaeth, a dysgu atgyfnerthu.

Mae'r mecanweithiau hyn yn caniatáu i beiriant deallus wella ei alluoedd a'i berfformiad dros amser, gan ddysgu'n awtomatig gyda phrofiad i gyflawni rhai tasgau, gan wella ei berfformiad fwy a mwy dros amser. 

Enghraifft yw AlphaGo, Meddalwedd Dysgu Peiriant ar gyfer y gêm Go a ddatblygwyd gan DeepMind. AlpaGo oedd y meddalwedd cyntaf a oedd yn gallu trechu meistr dynol yn y gêm ar awyren goban maint safonol (19 × 19). Addysgwyd meddalwedd AlphaGo trwy arsylwi ar filiynau o symudiadau a wnaed gan chwaraewyr Go yn ystod gwahanol gemau, a chael y peiriant yn chwarae yn ei erbyn ei hun, gyda'r canlyniad ei fod yn gallu curo'r hyn y credwyd oedd y chwaraewr gorau ym myd y gêm hon.

Gadewch i ni nawr fynd i mewn i'r tri phrif gategori o ddysgu peiriant.

Dysgu dan oruchwyliaeth

Mae'r system yn derbyn enghreifftiau wedi'u labelu yn ôl yr allbwn a ddymunir. Hynny yw, mae'r setiau data sy'n ddefnyddiol ar gyfer cyfarwyddo'r peiriant yn cynnwys elfennau sy'n cynrychioli sefyllfaoedd go iawn sy'n cynnwys data mewnbwn"Nodweddion"Ac o ddata allbwn"targed" . Gan gyfeirio at enghraifft yr erthygl Beth yw Machine Learning, beth mae'n ei olygu a'i nodau, roedd y gwaith o baratoi'r hyfforddiant o'r math dan oruchwyliaeth gan fod gennym achosion unigol o lwybrau, a nodwyd nodweddion (cerbyd, llwybr) a tharged (amser teithio) ar gyfer pob un ohonynt. Mae setiau data fel arfer yn llawer mwy cymhleth, roedd yr enghraifft yn hynod gyfyngedig a didactig, gyda'r nod o symleiddio'r ddealltwriaeth o Ddysgu Peiriannau dan Oruchwyliaeth.

Mae achos o'r math hwn yn caniatáu i'r algorithm astudio sail y math o lwybr a cherbyd, beth allai'r amser teithio fod. Mae dau fath o broblem mewn dysgu peiriannau dan oruchwyliaeth:

  1. atchweliad: pan fo'r targed yn cynnwys newidyn di-dor, hynny yw maint, rhif;
  2. dosbarthiad: pryd y gall y targed gael ei gynrychioli gan ddosbarth neu gategori.

Wrth ailystyried yr enghraifft o lwybrau traffyrdd, gallwn ddweud ei fod yn atchweliad. Os oedd y targed yn cynnwys asesiad fel: cyflym os llai nag awr, arafwch rhwng 1 a dwy awr, araf iawn os dros ddwy awr. Yn yr achos hwn byddai wedi bod yn broblem dosbarthu.

Dysgu heb oruchwyliaeth

Nid oes unrhyw ddata wedi'i labelu, y system, gan ddechrau o'r mewnbynnau, sy'n gorfod dod o hyd i strwythur yn y data. Yn ymarferol nid oes gennym unrhyw dargedau, ond dim ond mewnbynnu data. Fel pe yn yr enghraifft dim ond y data llwybrau a cherbydau oedd gennym, ond nid y data amser teithio.

Yn y dull hwn, rhaid i'r algorithmau nodi categorïau trwy chwilio am strwythurau cudd yn y data. Y prif offer y gellir eu defnyddio yn y dull gweithredu heb oruchwyliaeth yw'r clystyru a'r rheolau cymdeithasu.

Cylchlythyr arloesi
Peidiwch â cholli'r newyddion pwysicaf am arloesi. Cofrestrwch i'w derbyn trwy e-bost.

Dysgu atgyfnerthu

Mae'r system yn derbyn mewnbwn gan yr amgylchedd ac yn cymryd camau gweithredu. Mae'r system yn ceisio cymryd camau gweithredu er mwyn derbyn gwobrau. Bydd y system yn ceisio gweithredu camau gweithredu sy'n gwneud y gorau o'r wobr yn dibynnu ar gyflwr yr amgylchedd cyfagos. 

Mae'r system wobrwyo yn cael ei gweithredu trwy gydran, o'r enw asiant. Mae'r asiant yn penderfynu gweithredu ar yr amgylchedd ac o hyn mae'n derbyn un Gwobr ac o bosibl gwybodaeth am gyflwr yr amgylchedd, o ganlyniad i'r gweithredu a gychwynnwyd.

Er enghraifft, os ydym yn meddwl am system sy'n ymroddedig i gêm gwyddbwyll, yr asiant yw'r gydran sy'n penderfynu ar y symudiad, yr amgylchedd yw'r gêm ei hun. O ganlyniad i bob symudiad unigol a wneir gan yr asiant, mae cyflwr y gêm yn newid (yn cael ei ddeall fel y sefyllfa bresennol, lleoliad yr holl ddarnau, hefyd o ganlyniad i symudiad y gwrthwynebydd), derbyn adborth fel darn gwrthwynebydd wedi'i fwyta, felly wedi'i fwriadu fel gwobr i'r symudiad. Fel hyn mae'r asiant yn dysgu, ac yn addysgu ei hun.

casgliadau

Mae'n amlwg felly bod y dewis rhwng y mathau o ddysgu peirianyddol yn dibynnu ar y cyd-destun. Hynny yw, dewisir y math o ddull gweithredu ar sail y data sydd ar gael a'r posibilrwydd o gael hanes sy'n cynnwys disgrifiad o amgylchiadau pob achos unigol (mewnbwn), a hefyd canlyniad (allbwn). Felly gyda set ddata o'r math hwn, gallwch symud ymlaen i ddefnyddio dull dan oruchwyliaeth.

Ar y llaw arall, os nad oes gennych y posibilrwydd o wybod y data allbwn (targed) a priori, neu os ydych am ddarganfod targedau newydd, yna mae angen nodi cysylltiadau rhwng y data mewnbwn i ddarganfod amgylchiadau na phrofwyd erioed yn y hanes, neu i wynebu dysg tuag at amgylchedd sy'n esblygu ac yn ymateb. Yn yr achos hwn mae angen dewis technegau heb oruchwyliaeth neu atgyfnerthu.

Ercole Palmeri: Arloesedd yn gaeth


Cylchlythyr arloesi
Peidiwch â cholli'r newyddion pwysicaf am arloesi. Cofrestrwch i'w derbyn trwy e-bost.

Erthyglau Diweddar

Mae cyhoeddwyr ac OpenAI yn llofnodi cytundebau i reoleiddio'r llif gwybodaeth a brosesir gan Ddeallusrwydd Artiffisial

Ddydd Llun diwethaf, cyhoeddodd y Financial Times gytundeb ag OpenAI. Mae FT yn trwyddedu ei newyddiaduraeth o safon fyd-eang…

30 2024 Ebrill

Taliadau Ar-lein: Dyma Sut Mae Gwasanaethau Ffrydio yn Gwneud ichi Dalu Am Byth

Mae miliynau o bobl yn talu am wasanaethau ffrydio, gan dalu ffioedd tanysgrifio misol. Mae’n farn gyffredin eich bod chi…

29 2024 Ebrill

Mae Veeam yn cynnwys y gefnogaeth fwyaf cynhwysfawr ar gyfer ransomware, o amddiffyniad i ymateb ac adferiad

Bydd Coveware gan Veeam yn parhau i ddarparu gwasanaethau ymateb i ddigwyddiadau cribddeiliaeth seiber. Bydd Coveware yn cynnig galluoedd fforensig ac adfer…

23 2024 Ebrill

Chwyldro Gwyrdd a Digidol: Sut Mae Cynnal a Chadw Rhagfynegol yn Trawsnewid y Diwydiant Olew a Nwy

Mae gwaith cynnal a chadw rhagfynegol yn chwyldroi'r sector olew a nwy, gyda dull arloesol a rhagweithiol o reoli planhigion.…

22 2024 Ebrill