Kushughulikia masuala yenye miiba yanayohusisha haki za watu na data ya kibinafsi kunahitaji umakini, umahiri na majadiliano ya lazima kati ya wasomi na wataalamu wa wakati wetu. Tunagundua kuwa hatuna wepesi wa kutosha katika kurekebisha sheria za kijamii kwa changamoto ambazo uvumbuzi wa kiteknolojia hutuletea. Teknolojia zinazoibuka zinazidi kujikuta zikifanya kazi katika uwanja wa wazi, kwa kutokuwepo kabisa kwa kanuni zinazopunguza matumizi yao, bure kusababisha uharibifu na kwa hivyo kufanya hivyo kwa kutokujali kabisa.
Je, inawezekana kufikiria udhibiti unaorudi nyuma hadi mlolongo wa maendeleo ya kiteknolojia kwa utafiti wa kisayansi na malengo yake ya kimkakati?
Je, inawezekana kutawala mageuzi ya aina zetu huku tukidumisha heshima thabiti kwa uhuru wa mtu binafsi?
"Kadiri unavyojaribu kujificha, ndivyo unavyovutia umakini zaidi. Kwa nini ni muhimu sana kwamba hakuna mtu anayejua kuhusu wewe?" - kutoka kwa filamu "Anon" iliyoandikwa na kuongozwa na Andrew Niccol - 2018
Katika filamu "Anon” ya 2018, jamii ya siku zijazo ni mahali pa giza, chini ya udhibiti wa moja kwa moja wa mfumo mkubwa wa kompyuta unaoitwa Ether, wenye uwezo wa kufuatilia kila kona ya taifa kwa kuiangalia kupitia macho ya watu wale wale wanaoijaza. Kila mwanadamu ni mwangalizi kwa niaba ya Etheri na wajibu wao wa kwanza ni, bila shaka, kujifuatilia wenyewe na tabia zao.
Etha ni mshirika bora wa vikosi vya polisi: kupitia Etha, maajenti wanaweza kufuatilia uzoefu wa mtu yeyote kwa kuyahuisha kwa macho yao wenyewe na kutatua aina yoyote ya uhalifu.
Afisa wa polisi Sal anashangaa kwa nini unapaswa kupigana kulinda faragha yako: kuna faida gani wakati huna sababu ya kujificha? Kwani, katika zama ambazo teknolojia tunazojenga kuongeza usalama wa nyumba zetu na mitaa yetu zinahitaji kurekodi, ufuatiliaji na uhakiki wa taarifa hizo kwa maslahi ya wananchi wenyewe wanaoomba ulinzi, tutarajieje kudhamini. faragha yao?
Ili kuonyesha jinsi ilivyo hatari kupata maisha ya wengine, mdukuzi atachukua udhibiti wa Etheri na jinamizi la kutisha litaangukia maisha ya mamilioni ya watu: tishio la kutazama kama watazamaji wasiojiweza picha za watu wengi zaidi. wakati wa mateso ya maisha yao, matangazo moja kwa moja kwenye retinas zao.
Le mitandao ya neva bandia ambayo huweka msingi wa utendakazi wa akili za kisasa za bandia, huzunguka vipengele vitatu kuu: habari za msingi zinazoitwa vinginevyo. corpus, algorithm kwa assimilation ya habari na moja kumbukumbu kwa kukariri kwao.
Algorithm haizuiliwi na upakiaji wa banal wa habari kwenye kumbukumbu, inakagua katika kutafuta vitu vinavyohusiana. Mchanganyiko wa data na uhusiano utahamishiwa kwenye kumbukumbu ambayo itaunda a aina.
Ndani ya modeli, data na mahusiano hayatofautishwi kabisa, ndiyo maana kuunda upya mkusanyiko wa maelezo ya awali ya mafunzo kutoka kwa mtandao wa neva uliofunzwa karibu haiwezekani.
Hii ni kweli hasa wakati maiti zina kiasi kikubwa cha data. Hii ndio hali ya mifumo mikubwa ya kiisimu inayojulikana kama Large Language Models (LLM kwa kifupi) ikijumuisha ChatGpt maarufu. Wanadaiwa ufanisi wao kwa kiasi kikubwa cha taarifa zinazotumiwa katika mafunzo: kwa sasa mafunzo mazuri yanahitaji angalau terabytes chache za data na kutokana na kwamba terabyte moja inalingana na wahusika bilioni 90, takriban kurasa milioni 75 za maandishi, ni rahisi kuelewa kwamba kuna. habari nyingi zinazohitajika.
Lakini ikiwa miundo haiwezi kubadilishwa, kwa nini tujiulize tatizo la ukiukaji wa faragha?
"Yeyote aliye na kichaa anaweza kuuliza kutoshiriki misheni ya kukimbia, lakini yeyote anayeomba kusamehewa kutoka kwa misheni ya kukimbia sio kichaa." - kulingana na riwaya "Catch 22" na Joseph Heller.
Mkusanyiko wa data ya ukubwa kama vile kuruhusu uundaji wa miradi kama vile ChatGpt au mingine kama hiyo leo ni haki ya kampuni kubwa za kimataifa ambazo, kwa shughuli zao za kidijitali, zimeweza kupata hifadhi kubwa zaidi ya habari. katika ulimwengu: Mtandao.
Google na Microsoft, ambazo kwa miaka mingi zimesimamia injini za utaftaji ambazo huchanganua Wavuti na kutoa habari nyingi sana, ndio wagombea wa kwanza wa kuunda LLM, miundo pekee ya AI inayoweza kuchimba habari nyingi kama zile zilizoelezewa hapo juu.
Ni vigumu kuamini kwamba Google au Microsoft wataweza kuficha taarifa za kibinafsi katika data zao kabla ya kuzitumia kama shirika katika kutoa mafunzo kwa mtandao wa neva. Kuficha utambulisho wa habari katika kesi ya mifumo ya lugha hutafsiri kuwa utambulisho wa data ya kibinafsi ndani ya shirika na uingizwaji wake na data bandia. Wacha tufikirie jumla ya saizi ya terabytes chache ambayo tunataka kufunza mfano na wacha tujaribu kufikiria ni kazi ngapi ingehitajika kuficha data iliyomo: itakuwa haiwezekani. Lakini ikiwa tungetaka kutegemea algoriti kuifanya kiotomatiki, mfumo pekee wenye uwezo wa kufanya kazi hii ungekuwa mfano mwingine mkubwa na wa kisasa.
Tunakabiliwa na tatizo la kawaida la Catch-22: "ili kutoa mafunzo kwa LLM yenye data isiyojulikana tunahitaji LLM yenye uwezo wa kuificha, lakini ikiwa tuna LLM yenye uwezo wa kuficha data, mafunzo yake hayakufanywa kwa data isiyojulikana. .”
GDPR ambayo huamuru (karibu) kimataifa sheria za kuheshimu faragha ya watu, kwa kuzingatia mada hizi tayari ni habari za zamani na ulinzi wa data ya kibinafsi inayohusika katika seti ya mafunzo hauzingatiwi.
Katika GDPR, kuchakata data ya kibinafsi kwa madhumuni ya kujifunza uunganisho wa jumla na miunganisho kunadhibitiwa tu na Kifungu cha 22 kinachosema: "Mhusika wa data ana haki ya kutochukuliwa uamuzi unaotegemea usindikaji wa kiotomatiki, pamoja na uwekaji wasifu, ambao inaleta athari za kisheria juu yake au ambayo inamuathiri kwa njia sawa na muhimu."
Makala haya yanatanguliza marufuku kwa vidhibiti vya data kutumia data ya kibinafsi ya somo kama sehemu ya mchakato wa kufanya maamuzi otomatiki ambao una athari za moja kwa moja za kisheria kwa mada. Lakini mitandao ya kiakili, inayofanana kwa urahisi na michakato ya kiotomatiki ya kufanya maamuzi, ikishapata mafunzo hupata uwezo wa kufanya maamuzi ya kiotomatiki ambayo yanaweza kuathiri maisha ya watu. Lakini maamuzi haya sio "mantiki" kila wakati. Wakati wa mafunzo, kwa kweli, kila mtandao wa neva hujifunza kuhusisha habari na kila mmoja, mara nyingi huhusiana kwa kila mmoja kwa njia isiyo ya mstari kabisa. Na kukosekana kwa "logic" hakumfanyi kazi rahisi mbunge anayetaka kuinua ngao ya kutetea faragha za watu.
Ikiwa mtu pia atachagua kutumia sera yenye vikwazo vingi, kwa mfano kupiga marufuku matumizi ya data yoyote nyeti isipokuwa kama imeidhinishwa wazi na mmiliki, matumizi ya kisheria ya mitandao ya neural hayatawezekana. Na kuachana na teknolojia za mtandao wa neva itakuwa hasara kubwa, fikiria tu mifano ya uchanganuzi iliyofunzwa na data ya kimatibabu ya masomo ya idadi ya watu ambayo imeathiriwa kwa sehemu na ugonjwa fulani. Miundo hii husaidia kuboresha sera za uzuiaji kwa kutambua uwiano kati ya vipengele vilivyopo kwenye data na ugonjwa wenyewe, uwiano usiotarajiwa ambao machoni pa matabibu unaweza kuonekana kuwa usio na mantiki kabisa.
Kuweka tatizo la kuheshimu faragha ya watu baada ya kuidhinisha ovyo ukusanyaji wake kwa miaka mingi ni unafiki kusema kidogo. GDPR yenyewe pamoja na uchangamano wake inawajibika kwa ghiliba nyingi zinazoruhusu kupata idhini ya kuchakata data ya kibinafsi kwa kutumia utata wa vifungu na ugumu wa kuelewa.
Kwa hakika tunahitaji kurahisisha sheria ambayo inaruhusu kutumika kwake na elimu halisi katika utumiaji wa taarifa za kibinafsi.
Pendekezo langu si kuruhusu makampuni kujua data ya kibinafsi ya watumiaji wanaojiandikisha kwa huduma zao, hata kama wanalipwa huduma. Matumizi ya data ghushi ya kibinafsi na watu binafsi inapaswa kutokea kiotomatiki wanapotumia mifumo ya mtandaoni. Utumiaji wa data halisi unapaswa kufungiwa kwa mchakato wa ununuzi pekee, kuhakikisha kuwa daima ni tofauti kabisa na hifadhidata ya huduma.
Kujua ladha na mapendeleo ya mhusika bila kuruhusu jina au uso kuhusishwa na wasifu huu kunaweza kufanya kazi kama njia ya kutokutambulisha ambayo ingeruhusu kiotomati ukusanyaji wa data na matumizi yake ndani ya mifumo ya kiotomatiki kama vile akili bandia.
Artikolo di Gianfranco Fedele
Sekta ya majini ni nguvu ya kweli ya kiuchumi duniani, ambayo imepitia kwenye soko la bilioni 150 ...
Jumatatu iliyopita, Financial Times ilitangaza makubaliano na OpenAI. FT inatoa leseni kwa uandishi wake wa habari wa kiwango cha kimataifa…
Mamilioni ya watu hulipia huduma za utiririshaji, kulipa ada za usajili za kila mwezi. Ni maoni ya kawaida kwamba wewe…
Coveware by Veeam itaendelea kutoa huduma za kukabiliana na matukio ya ulaghai mtandaoni. Coveware itatoa uwezo wa uchunguzi na urekebishaji…