スパムを防ぐにはhref=の5文字と[/url]の6文字を禁止ワードに!

3日前にコメント欄でhref=を含めてHTMLの説明を書き込む必要がありました。それで禁止ワードから削除したのです。それをやめた途端に連続してスパム行為を許してしまいました。
つまり、href=の5文字は強力なスパムブロックワードなんです。相手は手動で入力しているのです。この推測が正しければ画像認証も突破されるでしょう。

スポンサーリンク


2013年6月20日15時04分、またスパムが1通来ました。今回は昨日の記事に書いた禁止ワード[/url]がありませんが、恐らく同じ人間が手動で書き込んでいます。

参考までに、今回の投稿者のIPアドレスは198.27.68.86です。

スパム投稿

手動入力の根拠

なぜ手動と判断出来るのか?このブログでは「コメントの投稿で禁止されたキーワードを表示する」設定を有効にしているからです。

恐らくこれが表示されたから、それを見て該当個所 [url=http://…]リンク名[/url]の部分を削除して投稿したのでしょう。つまり、相手は手動で入力しているのです。この推測が正しければ画像認証も突破されるでしょう。

かといって、今後この「禁止ワード表示設定」を変えるつもりはありません。邪魔をしているのはスパムであって、スパムのためにユーザビリティを落とすのはポリシーに反します。

スパムでない一般ユーザーが書き込めなかった時に、わかりやすく理由を表示するのはユーザービリティの向上です。それを、スパムのために落とす、つまり、スパムのために一般ユーザーを犠牲にするのはお断りです。

href=という5文字のキーワード

このスパムは3日続けて、同じ記事に書き込んでいます。実は、昨日の記事にも追記してありますが、このブログでは3日前までhref=の5文字を禁止ワードにしていました。

3日前にコメント欄でhref=を含めてHTMLの説明を書き込む必要がありました。それで禁止ワードから削除したのです。それをやめた途端に連続してスパム行為を許してしまいました。

つまり、href=の5文字は強力なスパムブロックワードなんです。

でも、このブログでは、3日前まで[/url]と同じように、href=を入力すれば、それが禁止ワードとして表示されていました。

href=が禁止ワードで表示される

なぜhref=が禁止ワードだった時には、href=の部分を削除して入力しなかったのでしょうか?

href=はリンクを表わすキーワード

<a href=“http://fanblogs.jp/”>リンク名</a>

これはhttp://fanblogs.jp/というURLにリンクする、という意味のHTMLです。

スパムの送信者は、おそらく、こう考えたのではないでしょうか。「href=が使えなければ、aタグが使えない。aタグが使えなければリンクは張れない」

href=がなければ、通常はリンクは張れません。だからスパムを送る側は、それを削除できないのです。

しかし、href=を書き込み禁止にしたら、一般読者の投稿でもリンクが張れなくなるんじゃないか?と、思うかもしれません。でも、以前の記事「たった5文字でスパムを回避する方法」にも書いたとおり、ファンブログでは、その心配はいりません。

ファンブログのオリジナルタグは日本語の<リンク>

なぜなら、ファンブログではコメントの中にある、通常のHTMLのリンクタグ(aタグ)は有効なリンクとして動作しないからです。

ファンブログのコメント投稿ではaタグではなく<リンク>から</リンク>までがリンクになります。独自のタグを使っているのです。

今回スパムが削除した[/url]の5文字はWordPress(ワードプレス)のプラグインが使っている独自タグです。WordPressとは、現在世界でもっとも人気があるブログソフトです。

WordPressのプラグインでは[url=http://fanblogs.jp/]リンク[/url]と入力すると、送信後に<a href=”http://fanblogs.jp/”>リンク</a>に内部処理で変換します。

同じようにファンブログでは<リンク:http://fanblogs.jp/>アンカー</リンク>と入力したものは、送信後に<a href=”http://fanblogs.jp/”>アンカー</a>へ内部変換します。だから、aタグが入力禁止でも問題ありません。

href=がなくてもリンクされる

スパムを送信した人物は、このブログはWordPressではないので、「[/url]が入力禁止なら削除すればいい。どうせこのブログでは[/url]は使っていないタグだから。」と考えたのでしょう。

その相手はこのブログのリンクタグが<リンク>であることを知りません。知っても対処出来ないでしょう。なぜなら日本語は読み書き出来ないだろうから。

タイトルにはhref=の5文字と[/url]の6文字を禁止ワードに!と書いていますが、実質的にはhref=の方だけでスパムはブロックできると思います。ただし、純粋なHTMLのaタグをコメントのリンクタグにしている場合、あるいは[url=http://…]リンク[/url]というリンクタグの場合は、別の対策が必要です。


関連コンテンツ

スポンサーリンク

「スパムを防ぐにはhref=の5文字と[/url]の6文字を禁止ワードに!」への11件のフィードバック

  1. 198.27.68.86=Country:CAのOVH Hostingか~。
    カナダは韓国人多くて大変だからなー、
    …とおもったらやっぱり偽物MCMか、韓国確定。
    阪本幸子、三好さやかの名前でソウルからファンブログに書き込む手動スパマーの人たちの一派だね。

    1. いや、たぶん日本語読み書き出来てないよ、手動コピペだけ。

      何をコピペして貼るかというとこんなの。
      半角英数のスペースだとか、ドットだとかわけのわかんない状態の日本語で、
      だいたいこのページの下に見本を貼ったんだけど、こんな感じの特徴。
      http://fanblogs.jp/andgoods/archive/976/0
      妙な悪知恵はあるみたいで、WwW.hogehoge.coMみたいな大文字小文字混在なんかの小細工はしてくる。

  2. こんばんは。
    私も画像認証をやめて、Tomさんの方法をやってみようと思ったのですが、
    ファンブログにログインできず、今日はあきらめることにしました

    ブラックハット(スパム)を見つけたら、検索会社へ報告しよう
    ↑こういう記事を見つけたんですが、どうでしょうか。

    ちょっとは、スパム送信者をこらしめることになるかなと、
    思ったのですが、逆に、火に油を注ぐようなことになっても
    いけないので、躊躇しています。

  3. スパム送信者をこらしめるんじゃなくて、特徴を解析して、それを次世代のアルゴリズムに組み入れていくんだよ。
    今のアルゴリズムでで見落とされるものは検索エンジン会社が目視で確認、削除してるけど、ゆくゆくは進歩させていく計画は止まる道理がないし。
    Googleは見本の晒しあげもやってるじゃない。
    通報したって火に油なんて注がないし、ただ粛々と消されていくだけ。
    毎日数百万件に及ぶ無用なスパムページが作成され、毎日消し去られてます。
    http://www.google.com/insidesearch/howsearchworks/fighting-spam.html

    1. 通報により火に油を注ぐことになるかもと考えたのは、
      仕返し的な考えで、ファンブログ全体として、スパムを
      増やされたりしないかと、心配したからです。
      根拠もなにもないのですが

      ファンブログに送られてくるスパムを通報することで、
      検索会社の目視削除が早く行われて、スパマーたちが
      ファンブログにスパムを送るとヤバイと判断してくれる
      ような状態が作れないものかと、思いました。

      でもまあ、正直な気持ちは、「こらしめてやりたい」です

      今日はログインできたので、Tomさんの方法をやってみます。

    2. ブラックハットを見つけたら~、なんて記事のタイトルだから語弊があるのかもしれない。
      要するに、通報フォームってのは、検索エンジン会社のガイドライン違反のサイトだけど、検索エンジンのアルゴリズムが現状それを見逃している悪質なスパムサイトを直接チームに通報する仕組み。
      でも、どこの誰がどのスパムサイトを通報したかなんて、それはスパマーにはわかんないんだよ。
      それがわかるのは検索エンジンの会社だけ。

    3. 完全にスパムだと言う根拠を確認できたら、通報した方がいいんだよ。
      そうじゃないと、検索の邪魔だし、スパムしてまで表示させたい物なんてのは、そもそも普通には表示できない程度の情報しかないでしょ、だから検索エンジンスパムをやるわけで。

      たとえば、鬱病や糖尿病患者のいる家族が鬱病や糖尿病について調べたい時、ドクターの書いた物じゃなくて、「糖尿病克服研究会」とかいう情報商材のとんでもない内容のくだらないものばかり出てきたら困るでしょ、あとまるで無責任なサプリメントのアフィリエイトばっかでて来ても困るでしょ。
      探している情報にたどり着けない原因になったり、~が治る!なんて医療関係者でもないやつの戯言やらとんでもないアホバカ情報を信じちゃうような人がもしいたら、それでうっかり二次被害もでるかもしれない。
      スパマーや、スパミーなアフィリエイターって平気で&#22099;も書くしね。
      &#22099;書いて揖保乃糸のアフィリエイトしてるのとかもあるよ、検索者にとってすごく邪魔だと思うんだよね。

    4. ちょっと解ってきたかもしれません。

      検索サイトに通報することよって、仕返し的にファンブログのスパムが増えることはないということですね。
      でも、inaliさんが教えてくれた「毎日数百万件に及ぶ無用なスパムページが作成され・・・」ということを考えると、通報=こらしめということには、なりそうにない気がしてきます。
      ヤツらは、検索エンジンから削除されようが、されまいが、お構いなしに、スパムをただ量産するのみというやり方でしょうか。

      ちょっと、通報してやろうという気持ちが、くじけてしまいましたが、機会があったら通報も挑戦してみます(^^ゞ

      結局のところ、検索エンジン会社は解析アルゴリズムを進化させていくとして、我々ブロガーはキッチリ防御することが最善の方法で、キッチリ防御できればヤツらもお手上げ(=こらしめ)って感じですかね。

      inaliさん、勉強になりました。ありがとうございます。

      ひとつ、inaliさんのコメントの「&#22099;」は、禁止単語のかわり?

  4. ありがとうございます。

    早速、試してみます。

    コメントも楽に出来る様に工夫されているのですね!

    凄い!

コメントを残す

メールアドレスが公開されることはありません。

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください