Artikel

Lingkaran Privasi: kecerdasan buatan dalam labirin Privasi dan Hak Cipta

Ini adalah artikel pertama dari dua artikel yang membahas hubungan rumit antara Privasi dan Hak Cipta di satu sisi, dan Kecerdasan Buatan di sisi lain.

Hubungan yang problematis di mana evolusi teknologi terbukti begitu cepat sehingga membuat penyesuaian peraturan apa pun menjadi usang sejak penerapan pertama kali.

Mengatasi permasalahan pelik yang melibatkan hak-hak masyarakat dan data pribadi memerlukan perhatian, kompetensi, dan diskusi yang sangat diperlukan antara para intelektual dan spesialis di zaman kita. Kita menyadari bahwa kita tidak cukup cepat dalam mengadaptasi aturan-aturan sosial terhadap tantangan-tantangan yang ditimbulkan oleh inovasi teknologi. Teknologi-teknologi baru semakin banyak yang beroperasi di lapangan terbuka, tanpa adanya peraturan yang membatasi penerapannya, bebas menyebabkan kerusakan dan oleh karena itu melakukannya dengan impunitas total.

Mungkinkah membayangkan suatu kendali yang mengembalikan rantai perkembangan teknologi ke penelitian ilmiah dan tujuan strategisnya?

Apakah mungkin untuk mengatur evolusi spesies kita sambil tetap menjaga rasa hormat terhadap kebebasan individu?

Pribadi?

“Semakin Anda mencoba bersembunyi, semakin Anda menarik perhatian. Mengapa begitu penting agar tidak seorang pun mengetahui tentang Anda?” – dari film “Anon” yang ditulis dan disutradarai oleh Andrew Niccol – 2018

Di dalam film "Segera” Pada tahun 2018, masyarakat masa depan adalah tempat yang gelap, di bawah kendali langsung sistem komputer raksasa bernama Ether, yang mampu memantau setiap sudut negara dengan mengamatinya melalui mata orang yang sama yang menghuninya. Setiap manusia adalah pengawas atas nama Ether dan tanggung jawab pertama mereka, tentu saja, adalah memantau diri mereka sendiri dan perilaku mereka.

Ether adalah sekutu terbaik kepolisian: melalui Ether, agen dapat melacak pengalaman siapa pun dengan menghidupkannya kembali dengan mata kepala mereka sendiri dan menyelesaikan segala jenis kejahatan.

Petugas polisi Sal bertanya-tanya mengapa Anda harus berjuang untuk melindungi privasi Anda: apa gunanya jika Anda tidak punya alasan untuk bersembunyi? Lagi pula, di era di mana teknologi yang kita bangun untuk meningkatkan keamanan rumah dan jalan kita memerlukan pencatatan, pemantauan, dan verifikasi informasi tersebut demi kepentingan orang-orang yang meminta perlindungan, bagaimana kita bisa menjaminnya? privasi mereka?

Untuk menunjukkan betapa berbahayanya memiliki akses terhadap kehidupan orang lain, seorang peretas akan mengambil kendali atas Ether dan mimpi buruk yang mengerikan akan menimpa kehidupan jutaan orang: ancaman harus menyaksikan gambar-gambar orang yang paling tidak berdaya sebagai penonton. saat-saat tersiksa dalam hidup mereka, disiarkan langsung ke retina mereka.

Loop

Le jaringan saraf tiruan yang mendasari berfungsinya kecerdasan buatan modern, berkisar pada tiga elemen utama: informasi dasar disebut juga badansebuah algoritma untuk asimilasi informasi dan satu memori untuk hafalan mereka.

Algoritme ini tidak terbatas pada memuat informasi secara dangkal ke dalam memori, tetapi juga memindainya untuk mencari elemen yang menghubungkannya satu sama lain. Campuran data dan hubungan akan ditransfer ke memori yang akan membentuk a model.

Dalam suatu model, data dan hubungan sama sekali tidak dapat dibedakan, itulah sebabnya hampir mustahil untuk merekonstruksi kumpulan informasi pelatihan asli dari jaringan saraf terlatih.

Hal ini terutama berlaku ketika korpus berisi data dalam jumlah besar. Ini adalah kasus sistem linguistik besar yang dikenal sebagai Large Language Models (disingkat LLM) termasuk ChatGpt yang terkenal. Keefektifannya disebabkan oleh banyaknya informasi yang digunakan dalam pelatihan: saat ini pelatihan yang baik memerlukan setidaknya beberapa terabyte data dan mengingat bahwa satu terabyte setara dengan 90 miliar karakter, sekitar 75 juta halaman teks, maka mudah dipahami bahwa ada begitu banyak informasi yang dibutuhkan.

Namun jika model tidak dapat dihilangkan rekayasanya, mengapa kita harus mempertanyakan masalah pelanggaran privasi?

Dominasi data

“Siapa pun yang gila bisa meminta pengecualian dari misi penerbangan, tapi siapa pun yang meminta pengecualian dari misi penerbangan bukanlah orang gila.” – berdasarkan novel “Catch 22” oleh Joseph Heller.

Buletin inovasi
Jangan lewatkan berita terpenting tentang inovasi. Daftar untuk menerimanya melalui email.

Pengumpulan data dengan ukuran sedemikian rupa sehingga memungkinkan terciptanya proyek seperti ChatGpt atau proyek serupa lainnya saat ini merupakan hak prerogatif perusahaan multinasional besar yang, dengan aktivitas digitalnya, telah mampu mendapatkan gudang informasi terbesar. di dunia: Web.

Google dan Microsoft, yang selama bertahun-tahun mengelola mesin pencari yang memindai Web dan mengekstrapolasi informasi dalam jumlah besar, merupakan kandidat pertama yang menciptakan LLM, satu-satunya model AI yang mampu mencerna informasi dalam jumlah besar seperti yang dijelaskan di atas.

Sulit dipercaya bahwa Google atau Microsoft dapat mengaburkan informasi pribadi dalam data mereka sebelum menggunakannya sebagai korpus dalam pelatihan jaringan saraf. Menganonimkan informasi dalam kasus sistem linguistik berarti mengidentifikasi data pribadi dalam korpus dan menggantinya dengan data palsu. Mari kita bayangkan sebuah korpus berukuran beberapa terabyte yang ingin kita gunakan untuk melatih model dan coba bayangkan berapa banyak pekerjaan yang diperlukan untuk menganonimkan data di dalamnya secara manual: hal ini secara praktis tidak mungkin. Namun jika kita ingin mengandalkan algoritma untuk melakukannya secara otomatis, satu-satunya sistem yang mampu melakukan pekerjaan ini adalah model lain yang sama besar dan canggihnya.

Kita dihadapkan pada masalah klasik Catch-22: “untuk melatih LLM dengan data yang dianonimkan, kita memerlukan LLM yang mampu menganonimkannya, namun jika kita memiliki LLM yang mampu menganonimkan data, maka pelatihannya tidak dilakukan dengan data yang dianonimkan. . ”

GDPR sudah usang

GDPR yang menentukan (hampir) secara global aturan untuk menghormati privasi masyarakat, mengingat topik ini sudah menjadi berita lama dan perlindungan data pribadi yang terlibat dalam rangkaian pelatihan tidak dipertimbangkan.

Dalam GDPR, pemrosesan data pribadi untuk tujuan mempelajari korelasi dan koneksi umum hanya diatur sebagian oleh Pasal 22 yang menyatakan: “Subjek data berhak untuk tidak mengambil keputusan hanya berdasarkan pemrosesan otomatis, termasuk pembuatan profil, yang mana menimbulkan akibat hukum terhadapnya atau yang mempunyai akibat yang sama dan penting”.

Artikel ini memperkenalkan larangan bagi pengontrol data untuk menggunakan data pribadi suatu subjek sebagai bagian dari proses pengambilan keputusan yang sepenuhnya otomatis yang memiliki dampak hukum langsung terhadap subjek tersebut. Namun jaringan saraf, yang mudah diasimilasikan dengan proses pengambilan keputusan otomatis, setelah dilatih memperoleh kemampuan untuk membuat keputusan otomatis yang dapat memengaruhi kehidupan manusia. Namun keputusan ini tidak selalu “logis”. Faktanya, selama pelatihan, setiap jaringan saraf belajar mengasosiasikan informasi satu sama lain, sering kali menghubungkannya satu sama lain dalam cara yang benar-benar non-linier. Dan ketiadaan “logika” tidak membuat pekerjaan menjadi lebih mudah bagi pembuat undang-undang yang ingin memasang tameng untuk membela privasi masyarakat.

Jika seseorang juga memilih untuk menerapkan kebijakan yang sangat ketat, misalnya melarang penggunaan data sensitif apa pun kecuali secara eksplisit diizinkan oleh pemiliknya, penggunaan jaringan saraf secara legal akan menjadi tidak praktis. Dan melepaskan teknologi jaringan saraf akan menjadi kerugian besar, bayangkan saja model analisis yang dilatih dengan data klinis dari subjek suatu populasi yang sebagian terkena dampak penyakit tertentu. Model-model ini membantu meningkatkan kebijakan pencegahan dengan mengidentifikasi korelasi antara unsur-unsur yang ada dalam data dan penyakit itu sendiri, korelasi tak terduga yang di mata dokter mungkin tampak tidak logis.

Mengelola kebutuhan

Mengajukan masalah dalam menghormati privasi orang setelah tanpa pandang bulu mengizinkan pengumpulannya selama bertahun-tahun adalah tindakan yang munafik. GDPR sendiri dengan kompleksitasnya bertanggung jawab atas berbagai manipulasi yang memungkinkan diperolehnya otorisasi untuk memproses data pribadi dengan memanfaatkan ambiguitas klausul dan kesulitan pemahaman.

Kita tentu memerlukan penyederhanaan undang-undang yang memungkinkan penerapannya dan pendidikan nyata dalam penggunaan informasi pribadi secara sadar.

Usulan saya adalah untuk tidak mengizinkan perusahaan mengetahui data pribadi pengguna yang mendaftar untuk layanan mereka, meskipun itu adalah layanan berbayar. Penggunaan data pribadi palsu oleh perorangan seharusnya terjadi secara otomatis ketika mereka menggunakan sistem online. Penggunaan data nyata harus dibatasi pada proses pembelian saja, memastikan bahwa data tersebut selalu benar-benar terpisah dari database layanan.

Mengetahui selera dan preferensi subjek tanpa mengizinkan nama atau wajah dikaitkan dengan profil ini akan berfungsi sebagai bentuk anonimisasi yang dilakukan di bagian hulu yang secara otomatis memungkinkan pengumpulan data dan penggunaannya dalam sistem otomasi seperti kecerdasan buatan.

Artikel dari Gianfranco Fedele

Buletin inovasi
Jangan lewatkan berita terpenting tentang inovasi. Daftar untuk menerimanya melalui email.

Artikel Terbaru

Intervensi inovatif dalam Augmented Reality, dengan penampil Apple di Poliklinik Catania

Operasi oftalmoplasti menggunakan penampil komersial Apple Vision Pro dilakukan di Poliklinik Catania…

3 Mei 2024

Manfaat Halaman Mewarnai untuk Anak - dunia keajaiban untuk segala usia

Mengembangkan keterampilan motorik halus melalui mewarnai mempersiapkan anak untuk keterampilan yang lebih kompleks seperti menulis. Mewarnai…

2 Mei 2024

Masa Depan Ada di Sini: Bagaimana Industri Perkapalan Merevolusi Perekonomian Global

Sektor angkatan laut adalah kekuatan ekonomi global sejati, yang telah menuju pasar 150 miliar...

1 Mei 2024

Penerbit dan OpenAI menandatangani perjanjian untuk mengatur aliran informasi yang diproses oleh Kecerdasan Buatan

Senin lalu, Financial Times mengumumkan kesepakatan dengan OpenAI. FT melisensikan jurnalisme kelas dunianya…

April 30 2024