グッズ

プライバシー ループ: プライバシーと著作権の迷宮における人工知能

これは、一方ではプライバシーと著作権、もう一方では人工知能の間の微妙な関係について取り上げた XNUMX つの記事のうちの最初の記事です。

技術の進化があまりにも速いため、最初の適用からあらゆる規制調整が時代遅れになることが判明している問題のある関係。

人々の権利と個人データに関わる厄介な問題に対処するには、注意力、能力、そして現代の知識人や専門家の間で不可欠な議論が必要です。 私たちは、技術革新が私たちにもたらす課題に社会ルールを適応させるのに十分な速さがないことに気づき始めています。 新興技術は、その用途を制限する規制がまったく存在しないオープンフィールドで運用されることが多くなり、自由に損害を引き起こし、したがってまったく罰せられることなく運用されるようになってきています。

技術開発の連鎖を遡って科学研究とその戦略目標にまで遡る管理を想像することは可能でしょうか?

個人の自由をしっかりと尊重しながら、私たちの種の進化を統治することは考えられるでしょうか?

プライバシー?

「隠そうとすればするほど、注目を集めてしまいます。 誰もあなたのことを知らないことがなぜそんなに重要なのですか?」 – アンドリュー・ニコル脚本・監督の映画「アノン」より – 2018

映画の中で "Anon」 2018 年の未来の社会は、イーサと呼ばれる巨大なコンピュータ システムの直接制御下にある暗い場所であり、そこに住む人々の目を通して観察することで国の隅々まで監視することができます。 すべての人間はエーテルを代表する監視者であり、彼らの最初の責任は、もちろん、自分自身とその行動を監視することです。

Ether は警察の最良の味方です。Ether を通じて、捜査官はあらゆる人の経験を自分の目で追体験することで追跡し、あらゆる種類の犯罪を解決できます。

警察官のサルは、なぜ自分のプライバシーを守るために戦わなければならないのかと疑問に思います。隠す理由がないのに何の意味があるのでしょうか? 結局のところ、家や街路の安全性を高めるために私たちが構築するテクノロジーが、保護を求める人々自身の利益のためにそのような情報の記録、監視、検証を必要とする時代に、私たちはどうやって安全を保証できると期待できるでしょうか。彼らのプライバシーは?

他人の生活にアクセスすることがいかに危険であるかを示すために、ハッカーがイーサを制御し、何百万もの人々の命に恐ろしい悪夢が降りかかるでしょう。それは、最も多くの人々の映像を無力な観客として見なければならないという脅威です。彼らの人生の苦悩の瞬間が網膜に直接伝えられる。

ループ

Le 人工ニューラル ネットワーク 現代の人工知能の機能の基礎となるものは、次の XNUMX つの主要な要素を中心に展開します。 コー​​パス、 アルゴリズム 情報の同化と メモリ 彼らの記憶のために。

このアルゴリズムは、メモリへの情報の平凡なロードに限定されず、情報をスキャンして、それらを相互に関連付ける要素を探します。 データと関係性の組み合わせがメモリに転送され、 モデル.

モデル内では、データと関係はまったく区別できないため、トレーニングされたニューラル ネットワークから元のトレーニング情報のコーパスを再構築することはほぼ不可能です。

これは、コーパスに大量のデータが含まれている場合に特に当てはまります。 これは、として知られる大規模な言語システムの場合です。 Large Language Models (略して LLM) には、悪名高い ChatGpt が含まれます。 その有効性は、トレーニングで使用される大量の情報のおかげです。現在、優れたトレーニングには少なくとも数テラバイトのデータが必要であり、90 テラバイトが 75 億文字、約 XNUMX 万ページのテキストに相当すると考えると、次のようなことが容易に理解できます。とても多くの情報が必要です。

しかし、モデルをディエンジニアリングできないのであれば、なぜプライバシー侵害の問題を自問する必要があるのでしょうか?

データの優位性

「狂っている人は誰でも飛行任務の免除を求めることができますが、飛行任務の免除を求める人は狂っているわけではありません。」 – ジョセフ・ヘラーの小説「Catch 22」を原作としています。

イノベーションニュースレター
イノベーションに関する最も重要なニュースをお見逃しなく。 メールで受け取るにはサインアップしてください。

ChatGpt や他の同様のプロジェクトの作成を可能にするようなサイズのデータ​​の収集は、今日、デジタル活動により最大の情報リポジトリを手に入れることができた大規模な多国籍企業の特権です。世界ではウェブ。

Web をスキャンして膨大な量の情報を推定する検索エンジンを長年管理してきた Google と Microsoft は、LLM 作成の最初の候補です。LLM は、上記のような大量の情報を消化できる唯一の AI モデルです。

Google や Microsoft が、ニューラル ネットワークのトレーニングにコーパスとして使用する前に、データ内の個人情報を隠蔽できるとは信じがたいです。 言語システムの場合、情報を匿名化すると、コーパス内の個人データが特定され、偽のデータに置き換えられます。 モデルのトレーニングに使用する数テラバイトのサイズのコーパスを想像して、それに含まれるデータを手動で匿名化するためにどのくらいの作業が必要になるかを想像してみましょう。それは事実上不可能です。 しかし、アルゴリズムに依存してそれを自動的に実行したい場合、この仕事を実行できる唯一のシステムは、同様に大規模で洗練された別のモデルになります。

私たちは古典的な Catch-22 問題に直面しています。「匿名化されたデータで LLM をトレーニングするには、それを匿名化できる LLM が必要ですが、データを匿名化できる LLM がある場合、そのトレーニングは匿名化されたデータで行われていません。」 。」

GDPRは時代遅れです

これらのトピックを考慮すると、人々のプライバシーを尊重するためのルールを(ほぼ)世界的に規定する GDPR はすでに古いニュースであり、トレーニング セットに含まれる個人データの保護は考慮されていません。

GDPR では、一般的な相関関係やつながりを知る目的で個人データを処理することは、第 22 条によって部分的にのみ規制されており、次のように規定されています。彼に法的効果をもたらす、または同様の重大な影響を与えるもの。」

この記事では、対象者に直接法的影響を与える完全に自動化された意思決定プロセスの一環として、データ管理者が対象者の個人データを使用することの禁止について紹介します。 しかし、ニューラル ネットワークは、自動化された意思決定プロセスに簡単に同化でき、一度訓練されると、人々の生活に影響を与える可能性のある自動的な意思決定を行う能力を獲得します。 しかし、これらの決定は必ずしも「論理的」であるとは限りません。 実際、トレーニング中に、各ニューラル ネットワークは情報を相互に関連付けることを学習し、多くの場合完全に非線形な方法で情報を相互に関連付けます。 そして、人々のプライバシーを守るために盾を掲げたい議員にとって、「論理」が欠如しているからといって仕事が楽になるわけではない。

また、所有者によって明示的に許可されない限り機密データの使用を禁止するなど、非常に制限的なポリシーを適用することを選択した場合、ニューラル ネットワークの合法的な使用は現実的ではなくなります。 そして、ニューラル ネットワーク テクノロジーを放棄することは大きな損失です。特定の病気に部分的に影響されている集団の被験者の臨床データを使用してトレーニングされた分析モデルを考えてみてください。 これらのモデルは、データに存在する要素と病気自体の間の相関関係、つまり臨床医の目には完全に非論理的に見える可能性のある予期せぬ相関関係を特定することにより、予防政策の改善に役立ちます。

ニーズの管理

何年にもわたって無差別に収集を許可してきたにもかかわらず、人々のプライバシーの尊重という問題を提起することは、控えめに言っても偽善的です。 GDPR 自体は複雑であり、条項の曖昧さと理解の難しさを利用して個人データを処理する許可を取得できるようにする多数の操作を行っています。

確かに、法律の適用を可能にする法律の簡素化と、個人情報の意識的な使用に関する真の教育が必要です。

私の提案は、たとえ有料サービスであっても、企業がサービスに登録するユーザーの個人データを知ることを認めないことです。 個人による偽の個人データの使用は、オンライン システムを使用するときに自動的に行われるべきです。 実際のデータの使用は購入プロセスのみに限定し、サービス データベースから常に完全に分離されるようにする必要があります。

このプロファイルに名前や顔を関連付けることなく対象者の趣味や好みを知ることは、上流で実行される匿名化の一形態として機能し、データの収集と人工知能などの自動化システム内でのそれらの使用を自動的に許可します。

アルティコロ・ディ Gianfranco Fedele

イノベーションニュースレター
イノベーションに関する最も重要なニュースをお見逃しなく。 メールで受け取るにはサインアップしてください。

最近の記事

子供のためのぬり絵の利点 - すべての年齢層のための魔法の世界

ぬり絵を通じて細かい運動能力を発達させることで、子供たちは書くなどのより複雑なスキルを習得できるようになります。色…

2月2024

未来はここにあります: 海運業界が世界経済をどのように変革しているか

海軍部門は真の世界経済大国であり、150 億市場に向けて舵を切り続けています...

1月2024

パブリッシャーと OpenAI が人工知能によって処理される情報の流れを規制する契約に署名

先週の月曜日、フィナンシャル・タイムズ紙はOpenAIとの契約を発表した。 FT は世界クラスのジャーナリズムにライセンスを供与しています…

4月30 2024

オンライン支払い: ストリーミング サービスで永久に支払いができる仕組みをご紹介します

何百万人もの人々がストリーミング サービスに月額料金を払っています。あなたは…というのが一般的な意見です。

4月29 2024

あなたの言語でイノベーションを読む

イノベーションニュースレター
イノベーションに関する最も重要なニュースをお見逃しなく。 メールで受け取るにはサインアップしてください。

Seguici