文系プログラマによるTIPSブログ

文系プログラマ脳の私が開発現場で学んだ事やプログラミングのTIPSをまとめています。

安易なhttps化は既存のはてなブックマークを全滅させてしまう件

知らずにやってしまうと大惨事です。


f:id:treeapps:20170818174241p:plain

Google では過去数か月にわたり、Google のランキング アルゴリズムでのシグナルとして、暗号化された安全な接続をサイトで使用しているかを考慮に入れたテストを実施してきました。この実験ではよい結果が得られているため、ユーザーがもっと安全にサイトを閲覧できるよう、すべてのサイト所有者の皆様に HTTP から HTTPS への切り替えをおすすめしたいと考えています。

http://googlewebmastercentral-ja.blogspot.jp/2014/08/https-as-ranking-signal.html

先日ついにgoogleはhttpsのサイトをランキングの要因の一つとする事を発表しました。
そこで早速https化を検討したのですが・・・
ちょっと、いや、大問題がありました。それは・・・



httpとhttpsのURLは別々にはてブされる



という事に気づきました。

はてなブックマークの挙動

はてなブックマークの挙動ですが、httpとhttpsは別々に処理されているようです。

http tree-tips: 主にsolr・MySQLのtipsを掲載しています
https tree-tips: 主にsolr・MySQLのtipsを掲載しています

両者の違いはhttpとhttpsですが、httpの方でブックマークされているので、httpsの方はブックマーク0件になってしまっています。

ではこれが何が問題なのでしょう?

サイトをhttps化すると・・・・?

今までhttpでサイトを運用していたとします。googleがhttpsのサイトのランクをアップすると聞いたので、早速自分のサイトをhttps化するとします。

すると、昨日までトップページはhttpで5ブックマークされていたのに、今日からトップページはhttpsになってしまったので、あなたのサイトのはてなブックマークは0件になってしまいましたとさ。

httpとhttpsのどちらでブックマークされているかは解るのか?

現状、簡単には解りません。
httpとhttpsの両方ではてブ数を取得してみたいと解りません。

実はこのhttpとhttpsの問題ははてブだけではない

実はこの問題ははてなブックマークに限った話ではありません。
twitterのつぶやき数やfacebookのいいね数も、httpとhttpsで別物扱いされるので、安易にhttps化するとそれらが全滅してしまいます。

他にも、URLの末尾に「/」があるかないかでも別のURLと判断されてしまうので、安易にURL末尾に「/」を追加すると、同じ理由で全滅してしまいます。

雑感

正直大変困りました。どうしましょう。

現在私が管理している以下のサイトを、canonicalでhttps化を実行中です。
tree-tips: 主にsolr・MySQLのtipsを掲載しています

全URLのはてなブックマーク数を取得するバッチを実行してキャッシュしているのですが、httpとhttpsのどちらでカウントを取りに行けばいいのか解らなくなってしまいました。

httpとhttpsのブックマークが混在すると、もう大変です。
この問題、どうにかなりませんかね・・・

どなたか良い解決法をご存知でしたら是非教えて下さい!