拡張現実の未来はつまらない

最近、多くの人がAR(拡張現実)と呼ばれるものに興奮しているようです。 Twitterにはたくさんのクールなデモが流れています。 Facebookはカメラエフェクトプラットフォームを開始しました。 AppleはAugmented Reality開発者キットを持ち、iPhone Xイベントのステージで派手なARゲームをデモしました。 GoogleはARcoreと一連の実験を開始しました。 Magic Leapはまだ密かに動いており、デモのようなティーザーをリリースしています。ダンスホットドッグは、明らかに「世界初の拡張現実スーパースター」です。

私自身の正気のために、ここからは「AR」または「拡張現実」を使って、写真や動画を撮る以外にスマートフォンのカメラでできることを意味します。

今日見られるクールなARデモのほとんどは、オブジェクト、キャラクター、フィルター、または他のエフェクトを周囲の世界に重ね合わせるように見えます。彼らはこれを(ほとんど)スマートフォンのカメラフィード、または場合によってはヘッドセット(ホロレンズ、魔法の飛躍)に描くことで行います。

コンピューター上のホットドッグ。

これらの「スーパーインポーズデモ」は、不可能なものを示しているため、非常に優れており、非常に共有可能です。 「実生活」では、マリオカートが通りを走ったり、机の上でブレイクダンスするホットドッグを見たりすることはできません。

このタイプの拡張現実は、「Additive AR」と呼ばれることもありますが、写真と映画の伝統に根ざしています。ほとんどの人がARを消費する方法は、記録されたデモのビデオを見ることだけではなく、カメラは1世紀前と同じ方法で撮影しました。カメラはまだメディアを記録する方法だと考えています。最初のカメラは、化学物質を光にさらして写真を撮りました。それから映画。そして、彼らはビデオを記録しました。その後、デジタル写真やビデオがどんどん良くなります。彼らの機能は、周囲の世界を記録することでした。

Additive ARは、写真とビデオを強化する系統の論理的な次のステップです。この系統は、色付きレンズフィルター、実用的な効果、偏光子、字幕、デジタルCGI、さらに最近ではスナップチャットフィルターにまで遡ります。基本的に、指でタップするだけで、CGIパイプライン全体をリアルタイムで発生するものに圧縮します。お使いの携帯電話は、あなたの視点から、カメラを通してすべてのARを行っています。これは、加算型ARが直感的に見える1つの理由です。最短のフィードバックループです。カメラは物を見て、見ているものに物を追加し、それをあなたに見せます。

これに加えて、写真またはビデオであるすべてのメディアの割合は、過去10年間で劇的に増加しています。犯人は、Facebook、Instagram、Snapchat、YouTubeなど、写真/ビデオコンテンツのホストと消費をめちゃくちゃ簡単にするプラットフォームです。これらはすべて、画面とカメラの生産が継続的に安価であるという事実によって実現されています。当然のことながら、人々は年々写真を撮り続けています。「ビデオへのピボット」は、複数のメディア幹部が確信していることです。

これはすべて言うことです。近い将来、写真やビデオを撮影することはかなり安全です。既存のすべての動作(Instagramフィルター、スナップチャットステッカーなど)にARフィルター、キャラクター、ステッカーなどを追加することは、ARコンテンツを表示して使用するための最も摩擦のない方法です。写真とビデオをよりクールにする新しい方法は、ARの最も明確で最も近いユースケースです。 (さらに、このアプローチは、すでに使用しているプラ​​ットフォームに直接プラグインします。)

私は、エキサイティングではなく、退屈ではありますが、実際には日常生活に役立つかもしれない拡張現実のアプリケーションがあると思います。 ARは、写真の伝統における次のステップであるだけでなく、ARを計算プラットフォームの次のステップと考えるかもしれません。 ARは、私たちの周りの世界とその中のオブジェクトに計算の伝統と実践をもたらす最速の方法かもしれません。 (ここでの計算は、父が計算についてどのように考えているかを指します:技術とインターネットを使って素晴らしいことをすることができますあなたのタイプミス。)

カメラは最終的に、自分が見ているものを知るのに十分なほどスマートになったため、Additive ARが可能になりました。最も基本的なレベルでは、彼らは床を見て、壁と角がどこにあるかを知っています。他のカメラアプリでも、見ている本、靴、車を把握できます。また、ほとんどの製品、場所、さらには状況を知っている未来を想像することは難しくありません。

それでは、エキサイティングで不可能な付加的なARをざっと見て、物を見るだけのカメラに焦点を合わせたらどうなるでしょうか? 「テーブルを見て、その上にMinecraftマップを追加するのではなく、テーブルパーツを見るだけです。

テーブルがテーブルであることを伝えるために拡張現実は必要ありません。しかし、テーブルが何であるかをカメラが知っているのは、カメラとはほとんど関係がないかもしれません。最大のチャンスは、テーブルが計算とネットワークにアクセスできるようになることです。カメラには「テーブル」が表示され、電話にはインターネット接続があります。エルゴ、そのテーブルは現在インターネットに接続されています。カメラは、アプリ/インターネットコンプレックスとそのテーブル(またはその本、ソファなど)の仲介役として機能します。テーブルで撮った写真またはビデオは、プロセスの成果物です。あなたがしていることは、写真を撮るよりもテーブルをクリックすることに近い。

では、テーブル、本、または居間が計算にアクセスするとどうなりますか?なぜこれがエキサイティングなのですか?カメラ(または将来、誰が知っている魔法の杖)をオブジェクト、場所、または状況に向けるとどうなりますか?私はそれを予測するほど頭が良くありませんが、ある時点でネットワークにアクセスした他のカテゴリのオブジェクトを見ることができました。スピーカーがネットワークにアクセスできるようになると、彼らは私たちに話し始め、私たちの話を聞いて、仕事に出るときを告げ始めました。車がネットワーク(uber / lyft)にアクセスできるようになったとき、運輸業界全体が数年で変容しました。家がネットワーク(airbnb)にアクセスできるようになると、世界中のどこにでも旅行でき、滞在する場所ができます。友人がネットワーク(facebook、instagram)にアクセスできるようになったとき、私たちのコミュニケーション方法は一夜で大きく変わりました(10代はもう外に出ませんよね?)。

テーブルがネットワークにアクセスできる場合、おそらくそれをポイントすると夕食が注文されます。多分それは他のテーブルと自分自身を比較します。多分それはそれ自体を売る。電話をオーブンやランプに向けると、その状況で必要なすべてのアクションと情報にアクセスできます。このレシピはオーブンに合いますか?それらの電球を切り替えた場合、どのくらい節約できますか?拡張現実は、私たちの周りの世界に計算の有用な側面(そして、それ以外の場合はどこが楽しいのか?)をもたらすことができる、想像できる最も近いテクノロジーです。

「オブジェクトの認識-計算の実行-結果の表示」モデルを既に実験している人がいます。 Brad DwyerのMagic Sudokuは、数独パズルを指していることを認識し、コンテキストでそれを解決するアプリです。ジュディスアモーレスとアンナファステのペーパーキューブは、特定のオブジェクトを認識し、カメラの周りを走っている小さな人々のインタラクティブなアンカーとして使用します。

大規模な「認識-計算-表示」モデルに到達するには、1つの大きな課題があります。ほとんどの場合、コンピュータープログラムの作成方法は、計算できるもののすべての新しいカテゴリ(単語/文字、歌、写真、友達)に対して、すべてのアクションと情報、およびそれでできることを手動で作成することでした。コンピューターで写真を使用できるようになったときに、写真編集アプリを作成しました。スマートフォンがGPSを使用している場所を知ると、マッピングアプリを作成しました。

しかし、カメラが物事の認識を改善し続けている場合、コンピューターを使って根本的に迅速に対応できる新しいものを追加します。電話を向けることができるオブジェクトのすべてのカテゴリに対してアプリをプログラムすることは可能ですか?たとえそうであっても、あなたがあなたの電話を向けることができるあらゆる可能なオブジェクトのために異なるアプリをダウンロードするつもりはありません。

ARが幅広いコンピューティング(読む:気の利いた便利な)プラットフォームとして機能するためには、単にクールな個々のアプリの束ではなく、整列する必要のあるものがたくさんあります。ほとんどの場合、文脈と発見は乗り越えなければならない最大の障害のようです。何千もの存在するため、あなたがいるあらゆるコンテキストやオブジェクトごとに異なるARアプリを探しに行きたくはありません。また、ARアプリが何のためにあり、何のためではないのかも知りません。必要なのは、電話を何かに向けて、あなたが指しているものとその状況でできることについて文脈的な提案を受け取る能力です。それで、それを可能にするためにあなたの電話は何を知る必要がありますか?

  1. オブジェクト認識。スマートフォンは、見ているものを知る必要があります。過去数年間、これには大きな進歩があり、大企業は常にそれを改善しようとしています。
  2. グローバルコンテキスト。あなたの電話はあなたが世界のどこにいるかを知る必要があります。 (幸いなことに、GPSはしばらく使用されてきました。)故郷では、休暇中とは異なる情報を世界中から入手したい場合があります。
  3. ローカルコンテキスト。あなたの携帯電話は、あなたがローカル空間のどこにいるかを知る必要があります。それにより、それと対話するすべての人にローカルコンテンツが一貫して表示されます。
  4. 個人的な信号。私の携帯電話はアパートを移動したばかりだということを知っている必要があるので、私はTargetでカメラをたくさんのソファに向けています。パーソナルシグナルにより、電話機は「可能なものは何でも欲しい」から「どこでも自転車に乗れるので、おそらくここの自転車に興味がある」に意図を絞り込むことができます。

(私はまた、これらすべてのことを一緒に知っている1つのデバイスまたは会社が、列車の難破船のプライバシーディストピアのレシピであることを認めます。それについてもう一度話しましょう。)

技術的なハードルを乗り越えなければ、コンピューティングプラットフォームとしてのARも有用でしょうか?人々が周囲の世界を計算できるようにすることで得られるものは何ですか?私は知らないよ。しかし、あらゆるカテゴリーの計算にアクセスするためには、潜在的なアプリケーションと接続は指数関数的です。

同じデバイスでGPSとカメラを組み合わせることで、本当に良い出会い系アプリができることに気付くのに5年かかりました。お使いの携帯電話があなたの周りの世界を知っている場合、私たちがまだ想像できないアプリケーションは何ですか?コーヒーカップの火口は何ですか?冷蔵庫や魚をクリックするとどうなりますか?拡張現実がコンピューターを使用するもう1つの退屈な方法になったとき、どうなりますか?よくわかりませんが、踊るホットドッグを写真に追加するよりも根本的に刺激的です。

素晴らしいフィードバックをいただいたPrit Patel、Amit Pitaru、Heather Luipold、Ryan Harms、Teo Soaresに感謝します。