web サイト | ページ 5 | Sirius のブログ

PetalBot を拒否する

2021年7月9日web サイト

　Webalizer の結果を見ていたら petalsearch.com からアクセスがありました。PetalBot です。ファーウェイのボットらしいです。中国からのアクセスは望まないので、拒否します。

robots.txt

記事を読む PetalBot を拒否する

XML 形式のサイトマップ

2021年7月8日web サイト

　HTML 形式のサイトマップは作成しましたが、サーチエンジン用の XML 形式のサイトマップを作成しました。次の Google のページを参考にしました。

サイトマップの作成と送信
robots.txt ファイルを作成す ...

記事を読む XML 形式のサイトマップ

アクセスしてくる bot

2021年7月5日web サイト

　Web サイトに対する bot に行儀がいい boto と行儀の悪い bot がいるかどうかわかりませんが、

クロールの頻度がそれほど高くない。（web サーバに負荷をかけない）
ユーザーエージェントに bot への説明 ...

記事を読むアクセスしてくる bot

6 月のアクセスログ

2021年7月3日web サイト

　また Webalizer の先月の結果を見てみました。

ninja-xxxxx.webmeup.com
webmeup.com は SEO 対策の企業みたいです。２番めにアクセス数が多いです。邪魔だな。

　 ...

記事を読む 6 月のアクセスログ

サイトマップのツリーを折り畳めるようにする

2021年7月1日web サイト

　サイトマップをツリー形式で作りましたが、ツリーの一部分を折り畳めたほうが使い勝手がいいような気がします。

　HTML5 のタグに折り畳みができる details タグがあるので、これをを使うことにしました。ツリーの表現は ...

記事を読むサイトマップのツ ...

サイトマップを作る

2021年6月30日web サイト

　個人のサイトなのでサイトマップは作らないつもりでしたが、サーチエンジンへの通知に利用したりすることもできるので作ることにしました。

　サーチエンジン用は、XML で作るのですが、XML で作成するのは後にして、先に HT ...

記事を読むサイトマップを作る

puppeteer で対象の特定方法

2021年6月26日pupeeteer,Raspberry Pi

　puppeteer で要素を特定して操作する場合、基本は、id や class などを使うことで特定します。id や class 属性がない場合は、他の属性を使うこともできます。しかし、属性があっても他の要素でも同じ属性を使っていた ...

記事を読む puppeteer で対象 ...

puppeteer でフルページの画像を取得する

2021年6月24日pupeeteer,Raspberry Pi

　puppeteer でページのスクリーンショットを撮る際に、fullPage オプションを true にすると、ページ全体のスクリーンショットが撮れるはずですが、Raspberry Pi ではビューポートに設定した範囲しか描画されま ...

記事を読む puppeteer でフル ...

puppeteer で Web ページを操作する

2021年6月23日pupeeteer,Raspberry Pi

　今回は、簡単な web ページを puppeteer で操作して見ます。

操作対象の html と php

次のような html と php を web サイトに準備します。

puppeteer_test.ht ...

記事を読む puppeteer で Web ...

ページの日付

2021年6月22日web サイト

　昔、旧ホームページを運用していた頃は、google の検索結果に日付が出ていた記憶があります。ところがこのサイトの検索結果には日付が出ていませんでした。(ブログ記事は除きます。)

　自分は、検索するときに、検索結果の日付 ...

記事を読むページの日付

月	火	水	木	金	土	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31