非エンジニア向けの自動運転車に関するすべての説明

これを読んでいる間、Googleまたは辞書を使用する必要がないことを約束します。この投稿では、「ディープラーニング」から「コンピュータービジョン」までのすべてに関するコアコンセプトを紹介します。死んだ単純な英語を使用します。

おそらく、自動運転車とは何か、そして最近ではそれらがドープのたわごとと見なされていることをすでにご存知でしょう。 :)

しかし、私は自分の紹介をスキップしていません。こんにちは、アマンです。私はエンジニアであり、不必要に「洗練された」話に対する許容度が低いです。難しいことを簡単にするために、Mediumにエッセイを書きます。シンプルさは過小評価されています。

自動運転車はどのように機能しますか?

自動運転車とも呼ばれ、3つのクールな技術分野の組み合わせに取り組んでいます。それぞれについて簡単に紹介した後、詳細に説明します。このエッセイの終わりまでに、これらの分野のエンジニアや投資家とインテリジェントな会話を行うことができるように、これらすべてのテクノロジーについて十分に理解できます。 「人工ニューラルネットワーク」のようなものは、もはや魔法の呪文やSF映画の言葉のようには聞こえません。

ところで、私はいくつかのものをおおよそ別の「システム」に分類しましたが、もちろん実際には、これらのシステムはすべて明確に定義された境界なしに高度に相互接続されています。

コンピュータービジョン(ooooooohhhhhはとてもクールに聞こえます):車が周囲を「見る」ことを可能にする技術。これらは車の目と耳です。このシステム全体は、知覚と呼ばれます。基本的には次を使用します。
1.最も重要な古き良きカメラ(シンプルな2メガピクセルのカメラでも問題なく動作します)、
2.レーダー。2番目に重要です。彼らは電波を投げかけ、超音波のように物体から跳ね返って戻ってくる波を検出し、
3.レーザーは持っているのはクールですが、最近ではかなり高価であり、雨や霧のときは動作しません。 「ライダー」とも呼ばれます。レーダーに似ていると言えますが、画質は少し向上し、レーザーはかなり遠くまで届くので、視界が広がります。レーザーは通常、車の上部にある回転ホイールに配置されているため、周囲の環境を見ながら非常に高速で回転します。ここでは、Googleの車の上に置かれたLidarを見ることができます。

上部のLidarセンサーを確認してください。回転するレーザービームです。

ディープラーニング:これは、上記のコンピュータービジョンを通じて収集した情報に基づいて、自動車が独自に運転決定を行うことを可能にする技術です。これが車の「脳」を訓練するものです。これについては後ほど詳しく説明します。

基本レベルでもこの​​2つを組み合わせると、いくつかの興味深いことができます。これは、カメラフィードのみを使用して、車線や道路上の他の車を検出するプロジェクトです。

ロボット工学:あなたはすべてを見ることができ、あなたは考え、決定を下すことができます。しかし、脳の決定(左足を持ち上げるなど)が足の筋肉に届かない場合、足は動きませんし、歩くこともできません。同様に、車に「脳」(=ディープラーニングソフトウェアを搭載したコンピューター)がある場合、コンピューターは車を制御できるように車の部品に接続する必要があります。簡単に言えば、これらの接続と関連機能は「ロボット」を構成します。これにより、ソフトウェアの脳の判断を下し、機械を使用して実際にステアリングを回したり、スロットルやブレーキなどを押したり放したりすることができます。

ナビゲーション:上記のすべてを与えられた後でも、最終的にあなたはまだあなたが惑星のどこにいるのか、そしてどこに行きたいのかを把握する必要があります。これには、GPS(衛星から位置情報を取得する古き良きナビゲーションデバイス)や保存された地図など、いくつかの側面があります。また、コンピュータービジョンデータを混在させます。

そのため、車は脳で行われた決定に基づいてステアリングやブレーキなどを制御します。これらの決定は、カメラ、レーダー、レーザーで受信した情報と、ナビゲーションプログラムから受信した方向に基づいています。これにより、自動運転車のシステム全体が完成します。

Tidbit(自由にスキップしてください)
自動運転車は、車がどれだけ独立しているか、運転中に必要な人間の援助がどれだけ少ないかに基づいて、レベル1からレベル5まで、多くの「レベル」で提供されます。ああ、レベル0もあります。これは古き良き手動操作車です。

レベル5は、車が100%自動運転することを意味します。人々が運転するためのものではないため、ステアリングやブレーキはありません。これらの車はまだ存在せず、最先端の車はまだレベル3、最大でレベル4です。

自分のようなチンパンジーのディープラーニングの説明

あなたが野生生物のサファリ愛好家であり、私があなたの大馬鹿な友人だったとしましょう。来週、アフリカのサファリに行きます。そして、あなたは私にいくつかのアドバイスを与えます:「アマン、クソゾウから近づかないで。」

「ゾウとは何ですか?」

「あなたは愚かなジャーク、ゾウは...気にしないでください、ここに象の写真があります。これは見た目です。それらから離れてください。」

それからサファリに行きます。

来週、あなたは私がまだ象にぶつかり、踏みにじられそうになっていることを知ります。何が起こったのかと聞かれます。

「わからない、この巨大な動物は見たけど、あなたが見せてくれた写真のようには見えなかったので、遊ぶのは安全だと思ったので、先に進んで小さな手を振った。これがその前に撮った動物の写真です…」

君は: ………。

あなた:「わかりました、アマン。すみません、悪いです。あなたの脳に期待しすぎました。次回サファリに行くときに従う必要がある「チートコード」を教えてください。あらゆる角度から茶色っぽいものを見ると、柱、大きな羽ばたき耳、大きなチューブのように顔から出ている太い長い鼻のような4本の革のような脚があり、太くてあなたよりも大きいようです、それは象であり、あなたは離れておく必要があります。」

来月、私は再びサファリに戻ります(これは私の仮説の話で、何度でもサファリに行くことができます)。今回は、あなたの「チートコード」がうまく機能するので、象に遭遇しません。

どうやって「チートコード」を思いついたのですか?これは、すでにすべての異なる側面から象を見ており、象をどの角度から見るかに関係なく、象の特徴をいくつか選んだためです。ゾウに関する多くのデータがあり、ゾウの最も明らかな兆候の精神像を形成するのに役立ち、チートコードとして私にそれらを与えました。象が何であるかを正確に「知る」必要はなく、象を認識するのに役立つチートコードがあります。しかし、そのチートコードは、ゾウが何であるかを知るのとほぼ同じように機能します!

しかし、1枚の写真(前に示した写真)だけを見せて、アイデアを得るのに十分だと思うのはなぜですか?私(もちろんばかである)がその写真を「神聖な真実」としてとったので、私はすべての象がその写真と*まったく*同じに見え、ほぼ完全に一致すると仮定した。

ディープラーニングは非常に似た方法で機能します。

ディープラーニングの基礎は次のとおりです。人工ニューラルネットワークについて説明します。ディープニューラルネットワークとも呼ばれます。

まず、高校の数学を少し知っていると思います。マトリックスとは何ですか?そして、マトリックスを他のマトリックスと掛けることができますか?これは文字通り、このエッセイで知っておくべき唯一の数学です。復習です:

マトリックスとは何かを思い出してください。

人工ニューラルネットワーク(ANN)はいくつかの本当に素晴らしいものですが、私はあなたを小さな一歩で旅に連れて行きます。ご覧のとおり、人間の脳は「ニューロン」と呼ばれる多くの細胞のネットワークで構成されています。これは、ANNのインスピレーションです。これは、紙の上では次のようになります。

ANNはマジックボックスであり、入力を受け取り、出力を提供します。たとえば、写真を取り込んで、その写真が象のものかどうかを判断できる魔法のANNが必要だとします。写真を箱に入れると、「はい」または「いいえ」という答えが出ます。

または、前方の道路の写真を入れて、ANNに減速するか加速するかを知らせてほしい。そして答えが出てきます、「スピードアップ!」

どうして起こるの?このANNをどのように作成できますか?

簡単に言えば、ANNは人間の脳の単純なバージョンのようなものです。まず、データでトレーニングします。 ANNにデータを渡すと、次回の意思決定に役立つ「チートコード」が作成されます。 (詳細な例をすぐに説明します)この「チートコード」は、ANNの「ウェイト」と呼ばれます。その「マトリックス」は以前に見ましたか?最初の行列[x y]行列は入力であり、2番目の行列[u w]行列は重みまたはチートコードのセットであると言えます。入力に重みを掛けると、答えが得られます。

ANNにはさまざまな種類があり、設計方法に基づいて、「はい」または「いいえ」の答えを出すことができます。たとえば、特定の番号や異なる番号のリストなどを提供できます。提供する出力の種類と受信する入力の種類、およびそのサイズと複雑さを選択できるため、非常に用途が広がります。入力、音声サンプル、画像、またはテキスト段落などとしてビデオを受け取るニューラルネットワークを構築できます。もちろん、これらはすべてコンピューターで自動的に数値に変換され、「重み」の巨大なマトリックスが作成されます。その入力に乗算して、答えである出力を生成します。

しかし、あなたはまだ完全に理解していないと確信しています。 ANNをどのように「トレーニング」して、意味のある出力を提供しますか?

象を認識するためにANNを訓練したいとしましょう。

したがって、特定のタイプの入力を受け取り、特定のタイプの出力を提供する新しいANNを作成します。最初は、このANNは解決しようとしている問題については何も知りません。象の最初の例の私と同じです。象の最初の写真を見せてくれる前は、象が何であるかさえ分かりませんでした。すぐに私に尋ねて、写真で象を探すなら、私はたぶんランダムに何かを選んだでしょう。だから、最初に、私はいくつかのでたらめなチートコードが正しいと言ったことができますか?しかし、1頭のゾウを見せて、ゾウだと言った瞬間、突然ランダムチートコードを調整し、ゾウが何であるかがわかりました。私のチートコードはランダムではなくなりました。正面から象を見たら、おそらく正しい答えを選ぶでしょう!そのため、詳細情報が提供されたときにチートコードを更新しました。そして、私が持っている象の写真が多ければ多いほど、正しいチートコードがより良い答えを与えるようになります。象が何であるかはまだわかりませんが、さまざまな写真で、象の最も特別な特徴を認識してそれらから遠ざけるのに十分な相関関係を見てきました。

同様に、ANNを初めて作成するときは、最初にランダムな重みセット(=チートコード)を指定することから始めます。次に、入力画像(象の写真)を表示し、期待する出力を伝えます(「はい」と答えます)。 ANNの優れた点は、サンプル入力とそれに対応する出力を与えると、チートコードを調整して、次回その正解を繰り返すことができることです。より多くのデータを与えると、重みのマトリックス内の数値が変更され、答えを一致させることができます。これが、ランダムな重みのセットから始めて、ANNがそれらを調整してチートコードとしてうまく機能するようにすることができる理由です!かっこいい?それが、ANNが「学習する」方法です。より多くのデータを与えるほど、重みを調整し、より正確になります。

既に説明したように、これがどのように起こるかは行列の乗算によるものです。このANNの重みのマトリックスには、入力イメージと乗算する(イメージが数値に変換される)場合に答えが得られるような値があります。通常、重みのマトリックスは1つだけではなく、次々に乗算する一連のマトリックスがあります。しかし、コンセプトは下の画像に見られるものと同じです。

大まかなマトリックス表現(この図は自分で作成しました):)

しかし、それだけでは十分ではありません。 ANNはスマートではないことを忘れないでください-結局、チートコードで動作します。象の写真だけを見て、すべての写真で「はい」と言い続けたら、どうなると思いますか?

怠け者であり、すべての写真が象だと仮定します!写真に関係なく、常に「yes」を出力するように、重み(チートコード)を調整します。これは「アンダーフィット」と呼ばれます。これは、基本的には、あなたのバカの友達が賢いと考える間違いを犯したことを意味します。あなたのANNは特定の答えに偏っています。これを防ぐには、「いいえ」と答える反例にもフィードする必要があります。象ではなく、ライオン、牛、人間、リス、ピカチュウやフシギダネ、タツノオトシゴなどの写真もたくさん混ぜてしまいました。チートコードをより慎重に調整してください。これで精度が向上し、信頼性が向上しました!または、ANNのチートコードはまだ怠けているが、非常にスマートになったため、与えたトレーニングデータ全体を記憶し始める「オーバーフィット」も可能です。これは多くの場合、ANNが非常に大きく深い場合に発生するため、ANNが提供するすべての情報を格納するようになります。トレーニングデータの回答は非常に上手くなりますが、これまでに経験したことのない新しい例を挙げると失敗します。チートコードのように機能しなくなりましたが、画像の辞書のようになりました。これを防ぐには、モデルのサイズを減らす(ランダムにいくつかの重みを落とす)か、データの種類を増やします。前者は「ドロップアウト」と呼ばれ(非常に単純ですが非常にクレイジーなアイデア)、後者は「データセットのバランス」と呼ばれます。

また、サファリの例からも教訓を学びました。今度は、バカの友人が犯したのと同じ間違いをしないように、さまざまな角度から象の他の写真を見せるように注意します。そのため、研究者/エンジニアは、トレーニングデータセットを「増強」して、同じ画像の鏡面反射や明るい/暗いバージョンなどを含め、データの多様性を高めます。これにより、ANNができる限り正確になります。チートコードを非常に「堅牢」にして、実際の人間と同じかそれ以上に機能するようにします。

トレーニングの終わりまでに、十分なバランスのとれたデータと増強などにより、合理的な精度で画像内のゾウを認識することができ、ゾウを認識しないタイミングを知ることができるトレーニング済みANN(トレーニングモデルとも呼ばれます)が得られます。

2段落前に出会った「過剰適合」という言葉(=ネットワークがあまりにもスマートになり、データを記憶しているように振る舞う)は、ディープラーニングの専門用語で非常に一般的な用語であり、その意味がわかりました。 (診断するのはかなり明白であり、取り組むのは簡単なので、アンダーフィットはそれほど面倒な問題ではありません。)「誰かが私のモデルが新しいデータでうまく機能していないので、オーバーフィットだと思います」と言うかもしれません。 「トレーニングデータを増強しようとしましたか?」そして、あなたは即座にその夜を所有します。他の人はあなたがあなた自身をディープラーニングエンジニアだと思っているかもしれません! (もしそうなら、「ああ、いや、私はただ中にいるアマンに従う」と言ってください。彼らが私を尋ねるとき、ふりをして、「あなたは知らない?彼はこの空間で最もクールな男です!」と言ってください)

重みを調整するプロセス(データに基づいてチートコードを更新する)には、逆伝播と呼ばれるものが含まれます。トレーニング中に、ANNにサンプル入力(子猫と言ってみましょう)を表示し、それから答え(「象じゃない!」)を言うたびに、最初に現在のチートコードを使用して独自のコードを考えます。回答。答えが正しい場合、チートコードを調整する必要はありませんよね?怠zyなANNは、間違えた場合にのみチートコードを更新します。したがって、ANNの答えが間違っていた場合にのみ、重み(チートコード)を少し調整して、重みを再度テストする必要があります。この調整アルゴリズムはBACKPROPAGATIONと呼ばれます。 ANNによって作成された「ミス」は、重みのマトリックスに波紋を送り、その値の多くを変更します。そのため、エラーはネットワークを介して伝播すると言うことができます。繰り返しますが、これが最初にランダムな重みで常にANNを作成できる理由であり、時間の経過とともに自動的に調整されます。

簡単に言えば、試験にチートコードを使用し、いくつかの回答が間違っている場合、その対象の次の試験のチートコードをアップグレードして、より高い精度を得る可能性があります。成績に基づいてすべての試験の後にチートコードを編集/書き換えるプロセスは、逆伝播法と呼ばれます。

ここで、上に貼り付けた「ニューラルネットワーク」のグラフ画像までスクロールします。 「隠しレイヤー」と呼ばれるものが見えますか?さて、ANNはニューロンの層で構成され、これらのニューロンは値として重みを持ちます。ネットワーク内の正確な重みを知る必要がないため、「隠しレイヤー」と呼ばれます!確かに値を印刷することはできますが、数百万または数十億の小さな数に達する可能性のあるマトリックスを見るのは無意味です。それはチートコードであり、あなたがそれを与える入力に基づいてそれ自身を更新します、そしてそれはあなたが知る必要があるすべてです。

これが、ディープラーニングがしばしば「ブラックボックス」システムと見なされる理由です。以前に任意の言語でプログラミングしたことがある場合、すべてのプログラムの明示的な指示を書き留めるのに慣れています。しかし、ここでは、コンピューターが作成されたアルゴリズムの代わりに使用するために作成された、基礎となる「チートコード」を見ることができません。

自動運転車に戻って、特定のミリ秒で車の周りのさまざまなカメラから写真を撮り、レーダーとライダー(=レーザー)から収集したすべてのデータを取り、それらをリストにまとめたとします。そのリストを車のANNの入力として使用しました。そして、ネットワークから期待される出力は、ステアリング角度、スロットル/ブレーキ値、ヘッドライトを点灯するかどうか、クラクションするかどうかなどの長いリストです。これらは予測される「ラベル」ですANN。

人間が収集した特定のデータを使用してANNを明示的にトレーニングするような深層学習は、「教師あり学習」と呼ばれます。データサンプルごとに、データとラベルがあります。

車の脳を「訓練」する方法の例を次に示します。まず、自分で普通に車を運転しますが、センサーやカメラなどから入力データを収集し続けます。データのミリ秒ごとに、運転中に行ったステアリング角度やスロットル圧力などを測定する装置もあります。その後、帰宅したら、運転中に収集したすべてのデータについてANNの「トレーニング」を開始できます。 ANNは、チートコードを更新してコンピュータービジョンの入力を取得し、運転の決定を可能な限り模倣しようとします。これは行動クローンとして知られ、ほとんどの自動車会社が最近行っていることです。運転データを収集し、車を「練習」します。トレーニング旅行のたびに、車はどんどん良くなっていきます。行動クローニングは、運転プロセスのごく一部にのみ使用されます。

他のすべてが類似しているので、運転データは自動運転車を開発するレースで最大の勝利要因です。

これで、「ディープラーニング」とは何か、そしてそれが何をするのかがわかりました。ディープニューラルネットワークとは(= ANN)、およびその仕組み(重み=チートコード、逆伝播=与えられたサンプルテストに基づいて重みを調整)を知っています。また、ネットワークが過負荷にならないように、大規模でバランスの取れたデータセットを用意する必要があることも知っています(チートコードの設定が怠けたり、賢すぎたりします)。

おめでとうございます!私はあなたが子供ではない、これはあなたが考えるよりも成果の多くです!

コンピュータビジョン

ターミネーターのこのシーンを覚えていますか?

シュワルツェネッガーは裸でバーに入り、服を奪う人を探します。これは、「コンピュータービジョン」を考えるときに頭に浮かぶものでなければならず、部分的に正しいです。

自動運転車もそのような世界を見ることができますが、それらはあなたがそこに見ることができる洗練にまだどこにも近づいていません。コンピュータービジョン技術の主な目的は、カメラ画像を処理して車線を検出し、他の車両や歩行者を追跡し、道路の凹凸を探し、車と他の物体との距離を測定することなどです。

コンピュータービジョンを実現するための技術や基盤となる技術はありません。むしろ、多くの場合、単純な画像処理になります。あなたの想像力と複雑なアルゴリズムを設計する能力によって、そしてあなたが幾何学がもう一つのプラスであるかどうかによってのみ制限されます。たとえば、カメラ画像を処理する一般的な方法では、色が水平方向と垂直方向にどれだけ速く変化するかを調べる必要があります。これは「勾配」と呼ばれ、エッジを見つけるために使用できます。以下に例を示します。

これらはすべて、OpenCVと呼ばれる一般的なコンピュータービジョン関数ライブラリを使用した簡単な手法を使用して作成されます。 OpenCVは、この目的で最も人気のあるライブラリであるため、知っておく必要があります。すべてのロボット工学やディープラーニングの男はそれについて知っています。

上記の例をさらに見ると、表示される画像は、長方形上の1と0の単なる表現です。ものは白で、ゼロは黒です!画像の任意の領域でピクセルを選択し、それをいじることができます。これが、このブログ投稿の冒頭に見られるように、車線を検出し、プロジェクトの出力を思いついた方法です。

オブジェクトを検出するためにコンピュータービジョンで使用される別の一般的な手法は、ステレオビジョンと呼ばれます。一見複雑な名前に惑わされないでください。ステレオビジョンとは、単に複数の目で何かを見ることを意味します(常にそれを行います)。何かを2つの目で見ると、それがどれだけ遠くにあり、どのような形になっているかをより正確に推定できます。同様に、車は両側に複数のカメラを使用し、画像を組み合わせて世界をよりリアルに表示します。

道路が見えにくいときに雪や雨などの悪条件はどうでしょうか?さて、他の2つのセンサー(レーダーとレーザー)を忘れないでください。 2つのセンサーがそれほどうまく機能しない場合でも、システムは3番目のセンサーがまだ非常に信頼できるように設計されています(ただし、現在進行中の研究分野であり、まだ完全ではありません)。さらに、車のニューラルネットワークが既にそのような状態で運転するように訓練されている場合、車は意思決定の方法についてある程度のアイデアを持っている必要があります。繰り返しますが、前述したように、最優先事項は十分なデータを収集することです。トレーニングすればするほど、車は良くなります。期間。

コンピュータービジョンは非常に広範な分野であるため、これ以上詳しく説明しません。サイエンスフィクションではなく、「魔法」というものは何もないことを知ってください。想像力を駆使して画像を操作するだけです。この非常に短くて簡単なページで読むことができる他のテクニックがあります:

ロボティクスとナビゲーション

実際、私はここであまり時間を費やすつもりはありません。ロボット工学は非常に単純です(何が起こるかを理解するのに派手な想像力は必要ありません)。基本的に、アクチュエーターと呼ばれるものについて知る必要があります。

アクチュエータは、入力として電気信号を受け取り、それを物理的動作に変換するデバイスです。それほど複雑ではありません。多くの場合、受信した信号の値に基づいて特定の角度だけ回転するモーターが内部にあります。アクチュエータにはあらゆる形状とサイズがあり、ステアリングホイールに1つ、スロットル、ブレーキ、ギア、エンジンなどに1つあります。

ナビゲーションについては、GPS /マップ/コンピュータービジョンテクノロジーとは別に、「推測航法」と呼ばれる本当にクールな手法についても知っておく必要があります。移動した速度と距離に基づいて現在位置を計算し、現在までの間に行ったすべてのターンの履歴などを把握する必要があります。ロバート・ダウニーJrの不機嫌なシャーロックホームズの映画を覚えていますか?彼が誘carriageされ、馬車に乗って目隠しされた場面がありますが、目的地に到着した後、彼は自分がどこにいるかを魔法のように知っています。このシーンの最初の数分を見ると、「推測航法」が何であるかを理解できます。このシステムは、シャーロックホームズとほとんど同じように機能します。

よし!これで、自動運転車がどのように機能するかについて非常に良いアイデアを持っているはずです。これが私たちが学んだことです。

  1. ディープラーニング—チートコード、トレーニングデータのバランス、過剰適合などの問題、ディープラーニングが「ブラックボックス」である理由など。
  2. コンピュータービジョン—カメラ、レーダー、ライダーセンサー、ステレオビジョン、画像を創造的に処理してさまざまな種類の情報を抽出する方法、OpenCVと呼ばれる人気のあるプログラミングライブラリがあります。
  3. ロボット工学—アクチュエータとは。
  4. ナビゲーション— GPSや保存された地図などとは別に、車は「推測航法」と呼ばれるシャーロックホームズスタイルの技術を使用していることを学びました。
それで…20分前よりも今より危険で素晴らしいと感じていますか? :)

最後に、「AIが私たちの仕事を取り、それから私たちを殺す」議論に関するいくつかの考え

あなたが今学んだことについて興味深いことに気づいてほしい。すべてのニューラルネットワークは、特定の種類の入力を受け取り、特定の種類の出力を提供するように設計およびトレーニングされていることを学びました。

1つの巨大なニューラルネットワークを使用し、それを自動運転車の頭脳として使用する場合でも、それを車の周囲のすべてのセンサーとカメラ、GPSと地図、およびGPSからの入力に接続する必要があります。ニューラルネットワークの出力を、車を動かすすべてのハードウェアとアクチュエータに接続します。既に学習したように、ニューラルネットワークは、互いに乗算または加算された行列のシーケンスです。入力または出力に接続しない場合、それは他のすべてのように死んだ数式です。

しかし、訓練されていないニューラルネットワークを無責任に使用し、それを使用して眼科手術ロボットのような危険なマシンを実行するとします。それは、医師もニューラルネットワークも検出する訓練を受けていない非常にまれな状態の目で動作しています。ロボットはエラーを起こし、目を永久に損傷します。さて、この仮想的なシナリオでは、世界中の新聞がAIがどのように目覚め、人を殺すことを決定したかについて話すと確信しています。しかし、あなたは上記のエッセイ全体を読んだので、なぜこれがでたらめなのかお分かりいただけると思います。

あなたは議論をすることができます-宇宙全体、人間の脳でさえ、本質的に最も深いレベルの数学的な表現で構成されているため、いくつかのマトリックスは他のものよりも邪悪です。そのため、ニューラルネットワークは潜在的に悪である可能性があります。ニューラルネットワークのトレーニング中に、その重みが悪になるような方法で再配置したのかもしれません。

これが真実だとしても、それはまだ良い議論ではありません。仮にそれがうまく作られていなかったとしても(または新聞がそれを「悪」と呼ぶ)、AIソフトウェアが実際のロボットにインストールされたことはなかったとしても、間違いを犯すことはなかったでしょう。

個人的には、人に害を与えないように、現実世界でのAIの使用を規制すべきだと感じています。それは医療産業に似ているはずです-人々は、試験管内の研究室で新薬を自由に開発する必要があります。しかし、動物や人間で新薬をテストしたい場合は、政府に許可を求め、テストの準備ができていることを証明する必要があります。

ソフトウェアをどのように使用するかがすべてです。エンジニアは、ソフトウェアを適切に構築し、ソフトウェアを現実の世界で使用する準備ができているかどうかを判断する責任があります。

以上です!これが役立つと思ったら、コメントで教えてください。気分が良くなります。

ああ、もしあなたが科学者やテクノロジー企業であり、マーケティング、PR、トレーニングなどのためにあなたの科学を非技術者に説明するのに助けが必要なら、私はあなたを助けることができます。 Twitterでメッセージを送ってください:@mngrwl