ロボティクスはAIと非常に似ています。



運用するには大量の高品質データが必要ですが、ロボティクスデータをインターネットから取得することはできません。なぜなら、実世界の経験と変数が必要だからです。

「ロボットの行動のインターネット」は存在しません。

多くのチームが働いており、ヒューマノイドに無駄なお金を投げ入れています。なぜなら、彼らが労働力を非常に効率的に変えるため、デカトリリオンドル産業として最も明白だからです。(インドの平均賃金である50,000ドルよりも)効率的です。

しかし、AIのような最大のレースは:

1. 質の高いデータを取得する
2. トレーニングタスク

ファウンデーションモデルはAIにおけるLLMのようなものですが、テキストを生成する代わりに、ロボットのためにアクションを生成します。

タスクトレーニングにおいて、チームが採用しているアプローチはいくつかあります。いくつかのチームは、Figureのようなラベリングが施された小さな高忠実度データセットを使用し、他のチームは大規模なモデルを使ってスプレーアンドプライのアプローチを取っています。

目標は、ロボットに広範で事前に訓練された常識と、タスクや環境を越えて一般化する能力を与えることです。

各タスクのためにロボットをプログラムする代わりに、多様なデータ(人間の動画、シミュレーション、実際のロボットデモ、タスクのテキスト説明付き画像など)に対して巨大なモデルを訓練し、そのモデルは物理的世界の具体的な理解を学習します。

その後、コマンドや例を通じてロボットに何かを指示することができます(、そして基盤モデルの「知識」が働いてそれを処理します。まるでChatGPTに何でも尋ねることができるように。

多くの企業にとって大きな断絶は、タスクトレーニングの領域にあります。彼らは現在、データ側)の世界シミュレーション、合成データ、ロボットの軌跡、人間の動画などに深く焦点を当てています。これは、ロボットが現実世界と完璧に相互作用するために必要ですが、ロボットやヒューマノイドが実際に何ができるかに関しては、あまり開発が進んでいません。

Nvidiaは、(Issac GR00T)という重要な基盤モデルの一つをリードしています。彼らはこれを完全にオープンソース化しました。すでに3rdパーティのチームがこれを基に構築し、効率を大幅に向上させています。(基本的には、最小限の基盤モデルのデータ変更で、人間の形をしたロボットが部屋を掃除するプログラムを作成しました。)

したがって、暗号 x AI x ロボティクスとの大きな重なりは、おそらくこのタスクトレーニングセクター(にあり、ロボティクスアプリストア)のようになるでしょう。既に主要な基盤モデルがオープンソース化されているため、インディ開発者が貢献し、ヒューマノイド向けのクールなプログラム/タスクを構築するための大規模なインセンティブモデルが存在する可能性が高いです。

年末から来年初めにかけて、ロボティクスが「チャットGPT」の瞬間を迎えると思います。(エロンが彼の新しいヒューマノイドモデルをしっかりと宣伝し、ヒューマノイドが現実のタスクをこなすバイラルビデオ、直感的な資金が流れ込み、労働者が解雇されるなどの進展や主流の開発がたくさんあります。)

私はこのアイデアについて間違っていないと約束できます。2023年のAIと同じように感じます。問題はいつか、ではなく、もしかということです。

私たちの人生の中で起こる最も革新的な技術の進展の一つを無視しないでください、そしてこのトレンドの重なりにある唯一のプレイである$CODECを無視しないでください。
TON2.23%
LL0.71%
MORE2.15%
IN1.48%
原文表示
post-image
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)