#ナイアンティックがポケモン囲碁プレイヤーデータで鍛えた「大地理空間モデル(LGM)」を発表 #士21
https://nianticlabs.com/news/largegeospatialmodel Nianticでは、大規模な機械学習を活用して、世界中のシーンを理解し接続するための大規模地理空間モデル(LGM)の開発を進めています。人間は空間を理解する能力を持っていますが、機械にとっては難しい課題です。最先端のAIモデルでも、視覚情報の欠落部分を推測するのが困難です。これに対抗する形で、空間インテリジェンスは次の技術的フロンティアとされています。 Nianticのビジュアルポジショニングシステム(VPS)を活用し、5,000万以上のニューラルネットワークをトレーニングし、150兆を超えるパラメータを持つLGMを実現しています。このモデルは、ローカルネットワークが地球規模のモデルに貢献し、他の場所の理解を深めます。LGMは物理空間を認識し、ロボティクスやAR技術などに活用され、将来的には空間知能がオペレーティングシステムの核になると見込まれています。 大規模地理空間モデルは、数十億の位置指定された画像データを使用して物理世界を理解するためのもので、3Dエンティティをキャプチャし、メトリック品質を維持します。これにより、地理空間モデルは、空間的関係を理解し、知識を新たな場所に伝達する能力を持ちます。また、AR技術との統合により、ユーザーは現実世界のインタラクションを強化し、個別の推奨を受けることが可能になります。 過去5年間、NianticはVPSを構築し、携帯電話からの画像を利用して3Dマップを作成してきました。VPSにより、ユーザーはセンチメートル単位での位置決めが可能となり、デジタルコンテンツを物理環境に正確に配置できます。このデータは、独自の視点から収集され、ユーザーがスキャンした世界の詳細な理解を提供します。 現在、1,000万か所以上のスキャン地点が存在し、毎週約100万件の新しいスキャンを受け取っています。これにより、VPSは非常に詳細な地理空間情報を提供します。また、古典的な3Dビジョンマップを利用しながら新しいタイプのニューラルマップも開発されており、より効率的な位置表現が可能です。 LGMは、ローカルモデルの限界を克服するために、さまざまな情報を統合し、地球規模の理解を実現します。これにより、地理空間データの外挿が可能になり、視点を超えて物理空