つい先日、うちの会社が運営しているアフィリエイトサイトの記事が丸パクリされるという事件が起きました。
タイトルをちょっと変えた程度で、本文から見出し構成、画像などすべてがパクられました。
丸パクリされたのは、いわゆるブログ型のサイトで、サイト運営者のキャラを立たせて日々記事を更新しているサイトです。
このサイトは外注を入れ、1日に3記事くらい更新しているんですが、パクっているサイトを詳しく見てみると、直近の記事すべてが丸パクリ。
はじめは1記事だけがパクられてるのかと思いましたが、調べると直近の100記事くらいが全て盗用されていることに気が付きました。
今回たまたま気付いたんですが、このまま放置していたらSEO的にも大きな問題が発生していた可能性があります。
久しぶりに良い経験をしたので、同じ悩みを持っている方の参考になればと思い、今回した対策をまとめておきます。
目次
記事の丸パクリに気付いたきっかけ
このブログ型サイトの戦略は、『今までの経験から、ある程度検索ボリュームがある(と思われる)のに全然ライバルがいない』というキーワードを狙ってひたすら記事を書いていくというものです。
ですので、基本的には書いた瞬間に上位表示され、1位にはならなくても1ページ目に入るものがほとんどなんです。
普段はいちいちしないのですが、当日にアップした記事が狙っているキーワードで何位を付けているのか?というのを久しぶりに確認していました。
すると、4位にいる僕のサイトの真下(5位)に、タイトルが超似てるサイトがいたんです。
一瞬『どういうこと?』って思いましたが、すぐに状況を把握。
実際にそのページを見てみると、テキストからなにまですべて同じ。
違うところと言えばテンプレートくらいです。
パクる方法が悪質だった
他の記事を見てみると、直近の記事すべてがパクられていました。
僕のサイトの記事ではないものもいくつかあったので、『一応オリジナル記事は書いているのだろう』と思っていましたが、詳しく調べてみると他の記事もすべてがパクリ記事であることがわかりました。
どうやら、僕のサイトを含め3~4サイトをベンチマークし、そのサイトの記事をすべてパクってきている模様。
しかも、そのパクり方がかなり悪質でした。
はじめは単純にソースなどをコピペして手動でパクっているのかと思っていたんですが、試しに適当な記事を更新してみると、すぐさまそのパクリサイトにも同じ記事が反映。
そう。自動的に記事をパクッていたんです。
これを知って、怒り爆発w
徹底的にやってやろうと決意しました。笑
【本題】パクリ被害を食い止めるために実際にやったこと
ここから実際に僕がやったことをまとめていきます。
同じような被害を受けて悩んでいる方は、是非参考にしてみてください。
サイト管理者へ問い合わせ
とにもかくにも、まずはサイト管理者に問い合わせ。
パクリサイトにはお問い合わせフォームが設けられていたので、そこからメールを送りました。
タイトルには『Webページ盗作に関する著作権侵害』と記載し、本文には以下のような内容を記載しました。
・本日15時までにただちに削除すること
・時間までに削除しなかった場合には法的手段を取ること
・該当記事を削除した段階でメールにて連絡すること
メールを送ったのが朝の8時くらい。
15時までに削除をし、連絡をよこせというのは、パクっている記事数からしてもなかなかタイトなスケジュールですが、悪党に情けなんていらないということで、強めに主張しました(笑)
DMCAデジタルミレニアム著作権法に被害報告
知らない人も意外と多いですが、実はGoogleに対して誰でもインデックスの削除を申請することができます。
これはDMCAデジタルミレニアム著作権法という法律に基づいて、Google側で著作権侵害が認められると判断した場合にはインデックス削除を行ってくれるものです。
デジタルミレニアム著作権法(通称DMCA)は、1998年10月にアメリカで成立した法律です。その名の通り、ネット上などにアップされているデジタルコンテンツに適用される法律です。
通常、著作権侵害を主張し、そのコンテンツを削除させるためには結構な手間がかかります。訴訟をするとなれば発信者情報開示請求などを行う必要があり、手間もお金もかかります。
しかし、これがあると簡単な申請をするだけで、Googleはこの法律に基づいて検索結果からインデックスの削除を行うことができるわけです。
Googleに著作権侵害によるインデックス削除を申請する場合は以下から可能です。
https://www.google.com/webmasters/tools/dmca-notice?pli=1&hl=ja
僕も今回、この削除申請フォームを通して、著作権侵害を訴えました。
どんな方法でパクられているのか?を分析
上でも書きましたが、今回のパクリサイトは記事を自動的に反映させる仕組みを使っていました。
自動的に記事をパクるって、一見するとすごいシステムのように感じますが、実はそんな難しいことではありません。
WordPressを使っている場合には、『FeedWordPress』というプラグインを使うと、いとも簡単にサイトの丸パクリが出来てしまいます。
これはブログやサイトなどが記事を更新したときに発信されるフィードという仕組みを使ってパクるプラグインで、アンテナサイト構築に使われているようです。
ただ、なかにはこのプラグインを悪用するやつがいて、今回僕が受けた被害も同じような輩だったわけです。
プラグインは利用されていなかった
記事内容が自動的に反映されるのを見た瞬間、『FeedWordPress』によるパクリを思い浮かべました。
実際、このプラグインを使ったパクリ被害ってかなり多いようなので、どうせ今回もこの手の輩だと思っていたんです。
そこで調査をしてみました。
もし仮に『FeedWordPress』を使っているのであれば、サーバーのアクセスログにその痕跡が残ります。
しかもその痕跡がわかりやすく、『FeedWordPress』とそのまま表記されるのが特徴です。
そこで、実際にサーバーからログをダウンロードし、直近の解析結果を見てみました。
その結果、なんとプラグインを使っていないことが判明。
いくら探しても、『FeedWordPress』の記述は見当たりません。
プラグインを使わずに、この仕組みを構築するって手が込んでるなぁと思うと同時に、さらに怒りがこみ上げてきましたw
アクセスログからIPアドレスを見つけ出す
ここまでで、プラグインを使わずに、独自のシステムでFeed情報をパクっているということが判明しました。
ただ、残念なことに実力不足でこのシステムの仕組を解析し、そのシステムのみを弾くというような技術力が僕にありません。
FeedWordPressというプラグインのみを弾くような仕組みを構築することはできますが、独自のシステムをどのように弾いたらいいのか?わかりませんでした。
周りの人間に相談すれば答えは見つかったのかもしれませんが、正直ネット上に自分が運営するサイトのページと全く同じページが存在することが気持ち悪くて仕方なかったので、一刻も早くネット上から抹殺したかったんです。笑
ということで、一番簡単にできるIPアドレスでのアクセス拒否を行うことにしました。
(※サンプルのアクセスログデータ)
アクセスしてきた相手のIPアドレスは、アクセスログの先頭に書かれています。
サイトでシステムを動かして、Feed情報を抜いてくるような仕組みを構築している場合には、そのサーバーのIPアドレスが記載されます。
ちなみに、こういう仕組みでパクっている場合、アクセスログには相手方サイトのURLが記載されます。
そのため、『Ctr+F』で検索ボックスを開き、そこにパクりを働いているサイトのドメインを入力して検索を掛けましょう。
そのドメインが記載されているログの先頭にあるのが相手方のIPアドレスです。
IPアドレスでのアクセス拒否設定
IPアドレスが分かれば、アクセス拒否をするのは簡単です。
ほとんどのレンタルサーバーでは、管理画面から簡単にIPアドレスによるアクセス拒否が行えるようになっています。
Xサーバーであれば、サーバーパネルに行き、設定対象のドメインを選択。
『ホームページ』という欄にある『アクセス拒否設定』を開きます。
『アクセス拒否IP追加』というタブをクリックし、拒否IPアドレスの部分に拒否したい相手のIPを入力するだけです。
FeedWordPressが使われている場合
もし仮にFeedWordPressによって記事がパクられているという場合には、.htacsessファイルを編集することで跳ね返すのがいいです。
具体的には、以下のサイトが参考になります。
→https://webllica.com/set-htaccess-to-deny-access-from-feedwordpress/
結論だけを書くと、以下のコードを.htacsessファイルの先頭に追記すればOKです。
RewriteEngine On SetEnvIfNoCase User-Agent "FeedWordPress" ua_key=on RewriteCond %{ENV:ua_key} on RewriteRule ^(.*)$ - [F,L]
ちなみに、Xサーバーの場合であれば.htacsessファイルはサーバーパネルから編集することが可能です。
プラグインが使われている場合でも、IPアドレスによる拒否をしてしまえば簡単に対策することができます。
ただ、IPアドレスで拒否をしてしまうということは、そのIPを共有しているすべてのアクセスを拒否するという意味です。
パクろうとしているサイトのIPを拒否したところで、純粋な訪問者のアクセスに影響は出ないと思いますが、抵抗があるという人は上記のような.htacsessファイルの編集で対応すると良いでしょう。
一応、顧問弁護士にも相談
今回の件については、会社でお願いしている顧問弁護士にも相談しました。
別に弁護士に相談するほどのことでもなかったのですが、連絡をしても返信も返ってこないっていうのが非常に無責任だなぁと感じたので、いざというときに徹底的にできるように念の為相談した感じです。
長年アフィリエイトをやっていますが、ここまであからさまにパクられたのは初めての経験でした。
ネットでは記事をパクられるなんてことは日常茶飯事起きていることだろうくらいにしか考えてなかったんですが、いざ自分が被害にあってみるとなかなかムカつきますね。笑
これでSEO的に何かしらのペナルティを食らって、サイトが飛んだりでもしていたら、本気で訴訟考えるとこでしたw
嫌な気持ちもしたし、いろいろ手間取らされましたが、今となっては良い経験したと思ってます。
皆さんもいつ被害にあってもおかしくないことなので、ぜひ『パクられたときにどうすべきか?』という知識だけでも持っておいてください。