#ボット_たくさんのボット



https://wakatime.com/blog/67-bots-so-many-bots より翻訳





ProductHunt には 100 万人を超えるユーザー サインアップがあり、そのうち 60% 以上がボットです。
始まり方

使用しました 製品ハント 2014 年初頭から。その上 ハッカー ニュース, 、tech。の最新製品発表を見るには良い方法だった 製品に関するコメントを使用すると、同様のツールを発見したり、自分の製品に関するフィードバックを収集したりできた しかし、最近、コメントのほとんどがChatGPTによって生成されているように見えることに気づいた。
簡単なテスト

私の理論をテストするために、私は ProductHunt で独自の製品を発売しましたが、製品の説明には単純な LLM プロンプト インジェクションが含まれていました。案の定、ほぼすべてのコメントが自動化されていました。



ボットを見つけられますか?

ProductHuntで起動する人がコメントに返信するのは時間の無駄であることがわかりました ProductHuntで起動する価値さえありますか?これほど多くのボットがコメントしているとしたら、投票も正しいに違いありません?私が受け取ったお金のための投票を提供するすべての電子メールに基づいて、一部の人々は賛成票を購入しているに違いありません。
の データ

賛成票を分析するために ProductHunt ユーザー全員、打ち上げ、賛成票、コメントの公開リストを見つけました ProductHunt ユーザーサインアップは100 万人以上、打ち上げは30 万件以上、コメントは250 万件、賛成票は2000 万件以上、各製品にもデイリーランクがあり、これは新しい打ち上げ日が始まるPDTの深夜から24 時間後のスコアです 1 位はデイリーランクです 1. 。最低ランクはチェックしませんでしたが、いくつかの製品にはあります null rank。多分それらは削除されたか、フラグが立てられたか、起動されなかった。
ボットアカウントの検出

特に公開データだけだとボットの検出は難しいです最初はユーザーのコメントの時間帯を分析して傾向を探してみました例えば677 日前にサインアップしたあるユーザーは2,009 回コメントし4,649 回の起動に投票しました間違いなくパワーユーザーで何らかの自動化を使っていますがおそらくボットではありません(そして1 つに分類されていませんでした)。



今、ボットユーザーのコメントを見てくださいこのユーザーは140 日前にサインアップし、173 回コメントし、246 の起動に投票しました。



ボットが一定の間隔でコメントし、グラフが滑らかではなく箱状に見えることに注目してください?

しかし、これはボットアカウントだけを検出するには十分ではありませんでした 私は、アカウントのアクティビティ期間、時間の経過に伴うアップ投票パターン、他のボットと共有されたアップ投票の数、コメントの内容など、さまざまな基準に基づいて各ユーザーにリスクスコアを割り当てました ChatGPTで生成されたコメントは、次のような単語の頻度が高いことを知っていました game-changer?ボットのコメントには、次のように簡単に入力できない文字も含まれていました em-dash, 、または非常に長い場合やのような文字が含まれている場合でも、製品の名前をそのまま ™ 名前。theyはまた、一般的に実在の人のlinkedinプロフィールから単語のための名前とバイオワードを含んでいたが、それらの人々は、彼らが任意のproducthuntアカウントを作成したことがないと述べた。clusteringは、ある程度動作しますが、多くのボットアカウントは、彼らの多くのランダムな投票のうち1 つの類似した投票を共有するように使用後に捨てられる。iだけいくつかのクラスタリングを実行したが、小さなデータセットにだけなので キューピー そして cudf GPU 上で実行するために必要なメソッドを実装していない 誰かがこれについてより多くの経験を持っている場合、クラスタリングによりボットの検出が改善される可能性があります。

最終的に、ユーザー サインアップの 60% 以上が自動ボット アカウントであることを検出しました。すべてのボットを検出したわけではないため、これは控えめな数字です。ProductHunt 自体にとって、インサイダー データを使用してボットのアクティビティをより正確に検出する方がはるかに簡単です。
時間の経過に伴うボットのアクティビティ
ユーザーのサインアップ

2018 年以降、実際のユーザーよりも多くのボット ユーザーが作成されています。


コメント

2022 年後半、ChatGPT が初めて広く利用可能になったのとほぼ同時期に、ボットのコメントが本格的に始まりました。2024 年の急増は、時間の経過とともにボット アカウントが削除されるためです。ProductHunt によるものなのか、アカウント所有者によるものなのかはわかりません。新しいアカウントは削除されない可能性が高いため、私たちはまだコメントにアクセスできます。


賛成票

2022年にもボットの賛成票が実質票を上回りました。



これらのボットは投票リングを形成し、メーカーは ProductHunt ニュースレターに参加する機会を増やすために賛成票を投じます。
ランキング

ほとんどの起動では、実際の賛成票はわずか数票しか得られません。ボットはランダムに投票して溶け込むため、ボットのトレンドラインは実際のユーザーの賛成票よりもスムーズです。


デイリーランク

1 位のローンチは毎日および毎週の ProductHunt ニュースレターで取り上げられるため、上位のローンチが獲得したボットの投票数を見てみましょう。



15% のボット投票は、製品をその日の1 位にするのに安全な金額であるようです 60% を超えるボット投票は、何らかの理由で1 位になるようには見えません これは、2020 年以降の発売に限定された同じチャートであり、最近トップ投稿でより多くの賛成票をボットが占めていることを示しています。



賛成票の支払いを行うランチはおそらく高品質の製品ではないため、多くの場合、1 位ではなくトップ 5 にランクされます:


価値がある?

ProductHunt での起動にはそれだけの価値がありますか?ほとんどのコメントや賛成票はボットですが、ProductHunt を使用している実際の人間がおそらくまだ何人かいるかもしれません。おそらく、ボットに支払ってニュースレターで紹介されれば、より本物の人間があなたの製品を見ることになると思います。

バックリンク SEO ジュースを提供すると考える人もいますが、そうではありません。Google がバックリンクをカウントするには、 a 製品を指すリンク要素を含めてはなりません nofollow を. 。ProductHunt Web サイトを検査すると、製品へのリンクが表示されます nofollow つまり、検索エンジンはそれをバックリンクとしてカウントしません。製品に 1 つのリンクのみを入力すると、実際には a になります button javascript を使用して製品ページを開く要素。実際のリンクでもありません。おそらく、他のアグリゲーター サイトが起動とリンクを取得しますが、ProductHunt 自体はバックリンクとしてカウントされません。

全体として、私の意見では、ProductHunt で起動する価値はまだありますが、起動の準備に数分以上費やすことはなく、コメントへの返信に間違いなく時間を無駄にすることはありません。
Final Thoughts

ボット投票なしでローンチのリストを作成し、その日のトップローンチがボット投票を削除して変更されるかどうかを確認したいと思いました。しかし、実際には投票に支払われなかったが、たまたまボットからの多くの賛成票があったローンチを呼び出したくありません。いずれにせよ、 すでにこれに時間を費やしすぎているため、将来のブログ投稿を待つ必要があります。

議論に参加してください HN.

これをより良くしようとする私の試みもチェックしてください wonderful。dev, 、 で プロフィール と wonderful。dev/alan.
この記事はオープンソースです。お気軽にオープンしてください github で PR.

コメント

このブログの人気の投稿

nitter.netが2021年1月31日から沈黙。代替インスタンスは?

#INVIDIOUSを用いて広告なしにyoutubeをみる方法 #士17

Libredditとは何か?広告、トラッカー、肥大化なしで、Redditを閲覧するためのより簡単な方法