PetalBot を拒否する
Webalizer の結果を見ていたら petalsearch.com からアクセスがありました。PetalBot です。ファーウェイのボットらしいです。中国からのアクセスは望まないので、拒否します。
robots.txtXML 形式のサイトマップ
HTML 形式のサイトマップは作成しましたが、サーチエンジン用の XML 形式のサイトマップを作成しました。次の Google のページを参考にしました。
サイトマップの作成と送信robots.txt ファイルを作成す ...
アクセスしてくる bot
Web サイトに対する bot に行儀がいい boto と行儀の悪い bot がいるかどうかわかりませんが、
クロールの頻度がそれほど高くない。(web サーバに負荷をかけない)ユーザーエージェントに bot への説明 ...
6 月のアクセスログ
また Webalizer の先月の結果を見てみました。
ninja-xxxxx.webmeup.comwebmeup.com は SEO 対策の企業みたいです。2番めにアクセス数が多いです。邪魔だな。
...
サイトマップのツリーを折り畳めるようにする
サイトマップをツリー形式で作りましたが、ツリーの一部分を折り畳めたほうが使い勝手がいいような気がします。
HTML5 のタグに折り畳みができる details タグがあるので、これをを使うことにしました。ツリーの表現は ...
サイトマップを作る
個人のサイトなのでサイトマップは作らないつもりでしたが、サーチエンジンへの通知に利用したりすることもできるので作ることにしました。
サーチエンジン用は、XML で作るのですが、XML で作成するのは後にして、先に HT ...
puppeteer で対象の特定方法
puppeteer で要素を特定して操作する場合、基本は、id や class などを使うことで特定します。id や class 属性がない場合は、他の属性を使うこともできます。しかし、属性があっても他の要素でも同じ属性を使っていた ...
puppeteer でフルページの画像を取得する
puppeteer でページのスクリーンショットを撮る際に、fullPage オプションを true にすると、ページ全体のスクリーンショットが撮れるはずですが、Raspberry Pi ではビューポートに設定した範囲しか描画されま ...
puppeteer で Web ページを操作する
今回は、簡単な web ページを puppeteer で操作して見ます。
操作対象の html と php次のような html と php を web サイトに準備します。
puppeteer_test.ht ...
ページの日付
昔、旧ホームページを運用していた頃は、google の検索結果に日付が出ていた記憶があります。ところがこのサイトの検索結果には日付が出ていませんでした。(ブログ記事は除きます。)
自分は、検索するときに、検索結果の日付 ...