#reCAPTCHAでGoogleは8億1,900 万時間の人間の無駄な時間を消費させGoogleに利益数十億ドル #ニ09 #1997CAPTCHAとAltaVista_平成IT史ざっくり解説


CAPTCHA および reCAPTCHA の歴史年表と詳細レポート(クリックして展開)

CAPTCHA と reCAPTCHA の進化:スパム対策からAI学習へ

以下は、CAPTCHA(キャプチャ)およびその発展形である reCAPTCHA の歴史をまとめた年表です。出典の正確な文言を original_text として引用し、信頼できる Web ソース を明示しています。

できごと original_text(引用) source
1997 CAPTCHA の原型を発明 “A historically common type of CAPTCHA... was first invented in 1997 by two groups working in parallel.” Wikipedia (CAPTCHA)
2003 「CAPTCHA」用語の定義 “The term was coined in 2003 by Luis von Ahn, Manuel Blum... It is an acronym for 'Completely Automated Public Turing test to tell Computers and Humans Apart'.” Wikipedia (CAPTCHA)
2007 reCAPTCHA の開発 “reCAPTCHA was originally developed by Luis von Ahn... at Carnegie Mellon University... to digitize books.” Wikipedia (reCAPTCHA)
2009 年 9 月 Google が reCAPTCHA を買収 “It was acquired by Google in September 2009.” Wikipedia (reCAPTCHA)
2014 年 No CAPTCHA reCAPTCHA (v2) 導入 “In 2014, Google developed a new captcha system called “No Captcha reCaptcha” that requires only a simple click...” Captcha.eu
2018 年 3 月 31 日 reCAPTCHA v1 サービス終了 “reCAPTCHA v1 was deprecated... and the final shutdown on 04/01/2018.” Google Developers
2018 年 10 月 29 日 reCAPTCHA v3 リリース “reCAPTCHA v3 was launched on 10/29/2018” Google Developers
2023 年 5 月 Enterprise 版の機能拡張 “In May of 2023, Google expanded the applicability of its reCAPTCHA software... [to] payment verification and protection.” Descope

詳細:開発者と背景 (Who / Background)

CAPTCHA の概念は、AltaVista の研究チームとカーネギーメロン大学(CMU)の研究者たちによって並行して考案されました。

  • Luis von Ahn(ルイス・フォン・アーン):CMU の教授であり、後に Duolingo を創業。「CAPTCHA」の名付け親の一人であり、reCAPTCHA の主要開発者。
  • 目的の変遷: 初期は単なるスパム対策でしたが、reCAPTCHA では「歪んだ文字の解読」を通じて、OCR(光学文字認識)が読み取れない古い書籍や新聞のデジタル化を人海戦術(Crowdsourcing)で行う仕組みを取り入れました。
詳細:歴史の要点と考察 (Note)
  • v1 (テキスト入力): 歪んだ文字を入力させる方式。ボットの画像認識能力向上により突破されやすくなり、2018年に終了。
  • v2 (No CAPTCHA): 「私はロボットではありません」のチェックボックス。ユーザーの行動(マウスの動きやIPアドレスなど)を分析し、人間らしさを判定。疑わしい場合のみ画像選択(信号機や横断歩道など)を表示。
  • v3 (Invisible): ユーザーへのチャレンジ(テスト)を完全に排除。バックグラウンドで行動をスコアリング(0.0〜1.0)し、サイト管理者がそのスコアに応じて対応を決める方式へ進化。
  • Google の活用: Google は reCAPTCHA の入力データを、Google Books のデジタル化や、Google ストリートビューの番地・看板の読み取り、AI の画像認識学習に活用してきました。
詳細:理解を深めるための問いかけ
  1. reCAPTCHA の初期開発が「書籍デジタル化」を目的としたことは、インターネットの発展にどのような貢献をしたと考えられますか?(Crowdsourcing の成功例)
  2. v1 から v2、v3 へと進化する中で、ボット対策技術と「ユーザー体験(UX)」のバランスはどのように変化してきましたか?
  3. AI が CAPTCHA を容易に突破できるようになった現在、次世代の「人間証明」技術(生体認証や行動分析など)にはどのような課題(プライバシーなど)がありますか?
  4. 2025年現在進んでいる reCAPTCHA Enterprise への移行や有料化は、小規模な Web サイト運営者にどのような影響を与えていますか?
詳細:参考 Web リンク一覧




 https://boingboing.net/2025/02/07/recaptcha-819-million-hours-of-wasted-human-time-and-billions-of-dollars-google-profit.html

銀行のウェブサイトにアクセスすると、ユーザーが人間であることを証明するためのCAPTCHAが表示されることがあります。

これらのテストはボットやスパムを防ぐために一般的に利用されていますが、2007年にはルイス・フォン・アンがCAPTCHAを用いてスキャンした書籍や新聞記事をデジタル化するアイデアを提唱し、reCAPTCHAというシステムが登場しました。このシステムは非常に効果的で、特にニューヨークタイムズは1851年のアーカイブをデジタル化するために活用しました。

  Googleは2009年にreCAPTCHAを買収し、この技術を用いてGoogleブックスのデジタル化やGoogleストリートビューの改善を行いました。しかし、2025年時点でreCAPTCHAはボットに対して非常に脆弱になっている一方で、Googleにとってはユーザーデータを収集し、数十億ドルの利益をもたらす追跡ツールへと進化しました。 

このように、reCAPTCHAはブラウザにおけるユーザーの行動を詳しく追跡する機能を持つようになったと言われています。

カリフォルニア大学アーバイン校の元研究者であるアンドリュー・サールズの論文「Dazed & Confused」では、このシステムが実際のセキュリティをほとんど提供せず、データ収集のメカニズムになっていることが確認されました。調査の結果、reCAPTCHAはユーザーのCookieや閲覧履歴など幅広いデータを監視しており、広告や追跡に利用されています。 また、研究では3,600人以上のユーザーを分析したところ、画像ベースの課題の解決にはチェックボックスの課題よりも557%長い時間を要することが明らかになりました。その結果、reCAPTCHAは推定8億1,900万時間、61億ドル相当の人間の時間を浪費させていることが確認されました。

さらに、追跡機能を通じて得られる情報の価値は約8,880億ドルと推測されており、事実上、インターネットを意味のある方法で利用するためにreCAPTCHAをオプトアウトする手段は存在しないのが現状です。

要約

  • reCAPTCHAは、当初は書籍のデジタル化などに活用されていましたが、現在ではボット対策としては不十分であり、ユーザーの行動を追跡し、データを収集するツールとして利用されています。
  • reCAPTCHAは、ユーザーのCookie、閲覧履歴、ブラウザ環境などを広範囲に監視しており、これらのデータは広告や追跡の目的で使用されています。
  • 研究によると、reCAPTCHAは社会全体で推定8億1900万時間分の人間の時間を浪費させており、これは賃金に換算すると61億ドルに相当します。
  • reCAPTCHAによって収集された追跡Cookieの価値は、8880億ドルと推定されています。
  • ユーザーはreCAPTCHAをオプトアウトすることができません。

詳細

  • reCAPTCHAの仕組み: ユーザーがWebサイトにアクセスした際、reCAPTCHAは画像認証などのテストを表示し、人間であることを証明させようとします。しかし、実際には、ユーザーの行動データを収集し、追跡することが主な目的となっています。
  • データ収集: reCAPTCHAは、ユーザーのCookie、閲覧履歴、ブラウザ環境(キャンバスのレンダリング、画面解像度、マウスの動き、ユーザーエージェントデータなど)を監視しています。これらのデータは、ユーザーのプロファイリングやターゲティング広告に利用されます。
  • 人間の時間の浪費: 研究によると、reCAPTCHAの画像認証テストは、チェックボックス認証よりも557%も時間がかかります。これにより、社会全体で膨大な時間が無駄に消費されています。
  • Googleの利益: reCAPTCHAは、ユーザーデータを収集することで、Googleに多大な利益をもたらしています。追跡Cookieの価値だけでも8880億ドルと推定されており、Googleの広告ビジネスを支える重要な要素となっています。
  • オプトアウトの不可: ユーザーはreCAPTCHAをオプトアウトすることができません。Webサイトを利用する限り、reCAPTCHAによる追跡を避けることは難しい状況です。

結論

reCAPTCHAは、ボット対策ツールとしてだけでなく、ユーザーデータを収集し、Googleに利益をもたらす追跡ツールとしての側面も持っています。ユーザーは、reCAPTCHAによって自身のデータがどのように利用されているかを理解し、注意する必要があります。

さらに情報を加えると、以下のような点が挙げられます。

  • reCAPTCHAの進化: reCAPTCHAは当初、文字認識が難しい画像を判別させることで人間とボットを区別していました。しかし、AI技術の発展により、ボットでも画像認識が可能になったため、現在はユーザーの行動パターンやマウスの動きなどを分析する「リスク分析」と呼ばれる手法が用いられています。
  • プライバシーの問題: reCAPTCHAはユーザーの行動を広範囲に追跡するため、プライバシー侵害のリスクも指摘されています。Googleは収集したデータを広告配信などに利用しており、ユーザーの知らないところで個人情報が利用されている可能性があります。
  • 代替手段の登場: reCAPTCHAの問題点を受け、近年では代替となる認証システムも登場しています。例えば、WebAuthnと呼ばれる生体認証技術は、より安全でユーザーフレンドリーな認証方法として注目されています。

これらの情報を加えることで、reCAPTCHAの問題点や代替手段について、より深く理解できるかと思います。

ルイス・フォン・アン(Luis von Ahn)は、グアテマラ出身のコンピュータ科学者であり、カーネギーメロン大学の教授です。彼は、CAPTCHAやreCAPTCHAの開発者として知られています。

ルイス・フォン・アンの業績

  • CAPTCHA:コンピュータと人間を区別するためのテストで、ウェブサイトのセキュリティ向上に貢献しています。
  • reCAPTCHA:CAPTCHAの技術を応用し、書籍のデジタル化や地図の精度向上に役立てるプロジェクトです。
  • Duolingo:無料で利用できる語学学習プラットフォームで、世界中で多くの人に利用されています。

ルイス・フォン・アンの人物像

  • 教育への情熱:教育格差の解消に貢献したいという思いから、Duolingoを開発しました。
  • 技術革新:コンピュータ技術を用いて、社会に役立つ新しいサービスを生み出しています。
  • 起業家精神:複数の企業を設立し、社会にインパクトを与える事業を展開しています。

ルイス・フォン・アンは、コンピュータ科学の分野で大きな功績を残しており、その技術は私たちの生活にも深く関わっています。彼の開発したDuolingoは、無料で質の高い教育を世界中の人々に提供し、教育格差の解消に貢献しています。ルイス・フォン・アン(Luis von Ahn)は、グアテマラ出身のコンピュータ科学者で、特に人間とコンピュータの相互作用に関する研究で知られています。彼は、CAPTCHA(完全自動公開チューリングテスト)やreCAPTCHAの開発において重要な役割を果たしました。

reCAPTCHAは、ユーザーが人間であることを証明するためのテストであり、同時にスキャンされた書籍や文書のデジタル化を助けるために設計されています。フォン・アンは、コンピュータが読み取れないテキストを人間が解読することで、デジタル化のプロセスを効率化するというアイデアを提唱しました。このシステムは、特にGoogleによって買収され、さまざまなプロジェクトに利用されています。

彼の研究は、デジタル化やデータ収集の分野において重要な影響を与え、テクノロジーの進化に寄与しています。フォン・アンはまた、教育やゲームを通じて人々が協力して問題を解決する方法についても研究を行っています。彼の業績は、コンピュータ科学と人間の相互作用の新しい可能性を切り開くものとなっています。

アンドリュー・サールズ氏に関する情報は、現時点では限られています。

確認されている情報としては、以下の通りです。

  • カリフォルニア大学アーバイン校の元コンピュータセキュリティ研究者
  • 論文「Dazed & Confused: A Large-Scale Real-World User Study of reCAPTCHAv2」の著者

この論文は、reCAPTCHA v2の利用実態と問題点を大規模なユーザー調査に基づいて明らかにしたもので、reCAPTCHAが単なるボット対策ツールではなく、ユーザーデータを収集し、Googleに利益をもたらす追跡ツールとしての側面を持っていることを示唆しています。

しかし、アンドリュー・サールズ氏のその他の研究分野や職歴、所属機関などの詳細な情報は、現在のところ確認されていません。

アンドリュー・サールズ氏の論文「Dazed & Confused: A Large-Scale Real-World User Study of reCAPTCHAv2」は、Googleが提供するreCAPTCHA v2の利用実態と問題点を大規模なユーザー調査に基づいて明らかにしたものです。

論文の概要

  • 目的: reCAPTCHA v2の利用状況、ユーザー体験、セキュリティ、そしてコストを大規模な実世界調査とアンケートを通じて分析すること。
  • 方法: 大規模な公立大学で、13ヶ月間にわたり3,600人以上のユーザーを対象に調査を実施。reCAPTCHA v2が導入されたアカウント作成とパスワード回復サービスを利用してもらい、その際の行動データを収集。
  • 結果:
    • チェックボックス認証は、画像認証よりも解決時間が大幅に短い。
    • Webサイトのコンテキスト(アカウント作成 vs パスワード回復)が解決時間に影響を与える。
    • 特定の専門分野の学生はreCAPTCHAの解決能力が高い傾向がある。
    • 画像認証はユーザーに不快感を与え、チェックボックス認証は容易だと認識されている。
    • reCAPTCHA v2はシステムユーザビリティスケール(SUS)で評価すると、画像タスクは「まあまあ」、チェックボックスタスクは「良い」と評価された。
    • reCAPTCHA v2はコストが非常に高く、セキュリティは低いと結論付けられた。

論文のポイント

  • reCAPTCHA v2は、ユーザーの行動データを広範囲に収集している。
  • 画像認証は、チェックボックス認証に比べて解決に時間がかかり、ユーザーに不快感を与える。
  • reCAPTCHA v2は、セキュリティ対策としては不十分であり、コストが高い。

論文の結論

reCAPTCHA v2および類似のreCAPTCHA技術は、廃止されるべきである。

論文の意義

この論文は、reCAPTCHA v2が単なるボット対策ツールではなく、ユーザーデータを収集し、Googleに利益をもたらす追跡ツールとしての側面を持っていることを示唆しています。また、reCAPTCHA v2がユーザーに不快感を与え、時間を浪費させていることも明らかになりました。

論文へのアクセス

この論文は、以下のURLからアクセスできます。

補足

この論文は、reCAPTCHAの問題点を指摘し、代替となる認証システムの必要性を示唆しています。今後の認証技術の開発に影響を与える可能性のある重要な研究です。アンドリュー・サールズの論文「Dazed & Confused: A Large-Scale Real-World User Study of reCAPTCHAv2」は、reCAPTCHAの実際の使用に関する大規模なユーザー調査を報告したものです。この研究では、reCAPTCHAがどのように機能し、ユーザーにどのような影響を与えているかを分析しています。

主なポイントは以下の通りです:

  1. ユーザー行動の追跡: サールズの研究は、reCAPTCHAがユーザーの行動を広範囲にわたって追跡していることを明らかにしました。これには、ユーザーのCookie、閲覧履歴、ブラウザ環境(画面解像度やマウスの動きなど)が含まれます。

  2. セキュリティの限界: 研究は、reCAPTCHAがボットに対する実際のセキュリティをほとんど提供していないことを示しています。つまり、reCAPTCHAは主にデータ収集の手段として機能しているということです。

  3. 時間の浪費: 調査では、画像ベースの課題を解決するのにかかる時間が、チェックボックスの課題よりも557%長いことが示されました。これにより、ユーザーがreCAPTCHAを解決するために費やす時間が膨大であることが確認されました。

  4. 経済的影響: 研究の結果、reCAPTCHAが推定で8億1,900万時間、61億ドル相当の人間の時間を浪費させていると結論付けられています。また、追跡機能を通じて得られる情報の価値は約8,880億ドルと推測されています。

この論文は、reCAPTCHAの使用がもたらす影響やその背後にあるビジネスモデルについての重要な洞察を提供しており、テクノロジーの倫理的な側面についての議論を促進するものとなっています。

この文章は、Google CAPTCHAに関するユーザーの苦情や意見が交わされているスレッドを示しています。具体的には、異なる画像を選ぶ形式のCAPTCHAがどう問題であるか、またそれによって生じているイライラについての言及があります。最初の投稿者は自転車の画像における特定の部分を選ぶことの難しさを感じており、回避策として別の検索エンジンを使用することも述べています。 さらに、他の投稿者がCAPTCHA更新の遅延や、技術的な不一致についての不満を表現しています。特に、リCAPTCHAがブラウザの指紋を取得していることと、そのデータがどのように使用されるかについての批判的な議論があります。データの収集や収益化がユーザーのプライバシーに与える影響についても言及されており、Googleの操作が透明性に欠けているとする意見が見られます。 また、CAPTCHAの目的がどれほど効果的であるか、もしくはボット検知の手段として本当に機能しているのかという疑問が呈されており、代替手段の必要性についても触れられています。最後に、ユーザーの無駄な時間を省くための効果的なソリューションの提案がなされる中で、実際のデータがどのように使われ、どこまで収益化されているのかについての理解が求められています。さらに、データプライバシーに関する法制度が強化される必要があるとの意見も見受けられます。

この投稿は、reCAPTCHA(特にGoogleのreCAPTCHA v2)の抱える問題点について議論しているものです。

投稿の要約

  • reCAPTCHAの画像認証は、ユーザーに不快感を与え、時間を浪費させる。
  • reCAPTCHAは、ユーザーデータを収集し、Googleの利益のために利用されている可能性がある。
  • reCAPTCHAは、セキュリティ対策として不十分であり、コストが高い。
  • 代替の認証システム(Cloudflareなど)も存在するが、それぞれ問題点がある。

投稿の詳細

投稿者は、reCAPTCHAの画像認証(特に自転車や横断歩道などの特定の物体を選択する認証)に不満を感じています。画像の一部しか写っていないものを選択する必要がある場合もあり、正解が分かりにくいと述べています。また、reCAPTCHAがユーザーの行動データを収集していることや、そのデータがGoogleの利益のために利用されている可能性についても言及しています。

他の投稿者からは、reCAPTCHAのオーディオ認証の方がまだマシだという意見や、reCAPTCHAがGoogleのデータ収集と収益化のために利用されているという批判が出ています。また、reCAPTCHAがセキュリティ対策として不十分であるという指摘や、代替の認証システムであるCloudflareにも問題点があるという意見も出ています。

投稿への補足

reCAPTCHAは、ボット対策として広く利用されていますが、近年ではAI技術の発展により、ボットでもreCAPTCHAを突破できるようになってきています。そのため、reCAPTCHAの効果は低下しており、代替の認証システムが求められています。

また、reCAPTCHAがユーザーデータを収集していることについては、プライバシーの観点から問題視されています。Googleは、収集したデータを広告配信などに利用しているとされています。

投稿へのコメント

投稿者は、reCAPTCHAの問題点を指摘し、代替の認証システムの必要性を示唆しています。reCAPTCHAの抱える問題点は、今後の認証技術の開発に大きな影響を与える可能性があります。

このスレッドでは、GoogleのreCAPTCHAに関するユーザーの体験や意見が共有されています。以下に主なポイントをまとめます。

  1. reCAPTCHAの難しさ: ユーザーは、特に「自転車の一部を含むすべての正方形を選択する」という指示がある場合、CAPTCHAを解くのに苦労していると述べています。特に小さな部分が含まれている場合、正確に選択するのが難しいと感じています。

  2. 時間の浪費: CAPTCHAの解決にかかる時間が長く、特に作業ネットワーク上では画像の更新に時間がかかるため、ユーザーはストレスを感じています。

  3. データ収集の懸念: ユーザーは、reCAPTCHAがブラウザのデータを広範囲にわたって収集していることに対して懸念を示しています。特に、ユーザーのCookieや閲覧履歴、ブラウザ環境などが広告や追跡の目的で使用される可能性があると指摘しています。

  4. 代替手段の必要性: 一部のユーザーは、reCAPTCHAが煩わしいと感じており、より効率的なボット識別の方法が必要だと主張しています。CAPTCHAがユーザーにとって時間の無駄であると感じているため、他の解決策を模索しています。

  5. Googleのデータ利用: 一部のコメントでは、GoogleがreCAPTCHAから得たデータをどのように利用しているのかについての疑問が提起されています。特に、自動運転車の技術に関連するデータ利用についての憶測があり、Googleがどのようにデータを収益化しているのかについての透明性が求められています。

このスレッドは、reCAPTCHAの使用に関するユーザーの不満や懸念を反映しており、特にプライバシーやデータ収集に関する問題が強調されています。

主なポイント:

  • 画像選択の難しさ: 自転車の一部など、曖昧な画像を選択する必要があるため、ユーザーは混乱し、時間を浪費しています。
  • 更新の遅延: CAPTCHAの更新が遅れることで、ユーザーはさらにイライラを感じています。
  • 技術的な問題: 画像が正しく表示されない、または選択しても認証されないなどの技術的な問題も発生しています。
  • プライバシーの問題: reCAPTCHAがユーザーのブラウザ情報を収集していることに対し、プライバシー侵害の懸念があります。
  • データ利用の不透明性: 収集されたデータがどのように利用されているのか、Googleの透明性に疑問を感じています。
  • 効果への疑問: CAPTCHAが本当にボット対策として有効なのか、疑問視する声があります。
  • 代替手段の必要性: CAPTCHAに代わる、よりユーザーフレンドリーでプライバシーに配慮した認証システムの必要性が指摘されています。

ユーザーの意見:

  • 不満: CAPTCHAの使いにくさ、時間の浪費、プライバシー侵害の懸念など、多くのユーザーが不満を抱えています。
  • 疑問: CAPTCHAの効果やデータ利用目的について、疑問の声が上がっています。
  • 提案: より良い認証システムの開発を求める声があります。

全体的なまとめ:

この文章は、Google CAPTCHAに対するユーザーの不満や疑問点を浮き彫りにしています。CAPTCHAは、ボット対策として重要な役割を果たしていますが、ユーザーエクスペリエンスやプライバシーの問題も抱えています。今後は、よりユーザーフレンドリーでプライバシーに配慮した認証システムの開発が求められるでしょう。


コメント

このブログの人気の投稿

🚀Void登場!Cursorに代わるオープンソースAIコーディングIDEの全貌と未来とは?#AI開発 #OSS #プログラミング効率化 #五09

#INVIDIOUSを用いて広告なしにyoutubeをみる方法 #士17 #2018INVIDIOUSとOmarRoth_令和IT史ざっくり解説

#shadps4とは何か?shadps4は早いプレイステーション4用エミュレータWindowsを,Linuxそしてmacの #八21