
こんにちは。梶松です。
さて、インフラエンジニアのサーバ監視も今回で最終回です。
と言いましても、たった3回の薄っぺらい内容でしたが(笑)
3回目(最終回)なので、最後にいろいろ書こうかなと思ったのですが、
いざ書こうとすると何も出てこないですね。。。
というわけで、今回はシンプルに簡潔にいきます。
内容は以下の2点です。
- 梶松流のgrafana UIアレンジ
- アラート飛ばし
梶松流のgrafana UIアレンジ
梶末流といっても、ただ梶松がどんな感じでUIを設定して、
この美しいgrafanaのUIをつまみに、酒を飲んでいるかを紹介するだけですw
あまり載せるのもアレなので、ちょこっとずつ紹介します。
上段にはこんな感じでタコメーターみたいなのを並べてます。
見てもらったらわかるように通常時でRAMの使用率が80%超えてますw
微妙な環境(スペック)でギリギリをせめつつ、落ちないように保つ。
これもまた、サーバ側を触る楽しさの一つですね!
次は横二時間軸、縦に使用率を表示した形のグラフです。
aws上でいろいろ作業をしてると負荷もかかってくるわけです。
新しいプロセスを試しに動かしてみたり、多くの作業をいっぺんにしたりと。
これは一日の終わりに見ると、時間軸で使用率を見れるので、
今日のこの時間帯はあの作業したなぁと一日を振り返る事ができるわけです。
寝る前にちらっと見るといいかもしれないですね!
さて、最後はこのグラフですね。
僕達がやっぱり気になるグラフです。
一応負荷がかかるとアラートを飛ばすようにしてるのですが、
今日は〜人も訪れてくれたんだ!と訪問者数を見た後に、このグラフを見れば
どの時間帯に多くの人が訪れてくれたんだな!と思えるわけです。
15時とかに人が多ければ、「もしかして社会人の人が休憩とった際に、スマホを片手にみてくれてるのかなぁ」
など、いろいろ考えるわけです。
基本的に毎回更新する際は、時間を決めて更新するようにしているのですが、
更新する時間も見てくれる方がオオイ時間帯に更新しようかなとも考えれるわけです。
今回はタコメーターと時間軸での使用率が見れるグラフの2種類を載せていますが、
他にもいろいろな種類のグラフで表示する事ができます。
ちなみに、ここには、grafanaで使用できるグラフ等のテンプレートが置いてあります。
もし、どういうグラフにしようかな!とか迷った際は訪れてみてください!
きっと良きテンプレートに出会えるかもしれません。
アラート飛ばし
さて、書いてる途中ですが、ちょっと眠くなってきました(笑)
続いてアラート飛ばしについて紹介します。
アラート飛ばしとは、文字通りアラートが飛んでくる事を指します。
インフラエンジニアの方にとっては、来ないで欲しいもののひとつですね。
せっかくの休みも障害発生してしまえば、対応に追われる事に。。。
なので、サービスが停止したりシステムが止まる前に余裕を持って飛ばしたいアラート。
grafanaでもアラートを飛ばす事ができます。
設定は、grafanaの画面左に下に示すようなアイコンが並んでいると思います。
下から3番めのアイコン。
まさにアラートを連想させるような、このベルのアイコン。
ここから設定ができます。
ベルのアイコンをクリックすると以下の画面になると思います。
梶松は、注意すべきかな?と思われるものを、何点か設定してます。
上の画像のように、飛んだアラートの履歴が残るようにはなってます。
ので、複数アラートが飛んだ際は、どの順番で飛んだかをこの画面から確認できます。
ちょっと梶松のは、お見せする事ができないのですが、
Notification channelsのタブを押せば、どのような手段で通知を出すかを設定する事ができます。
手段としては見て頂ければわかるのですが、LINE, webhook, Email, Hangoutsなどなど複数の方法で通知を出す事ができます。
なので、よく使う連絡手段(LINEなど?)で、通知を出すようにするのもありかもしれませんね!!!
最後に。
今回は薄っぺらい内容でしたが、grafanaのUIについて少しだけ紹介させていただきました。
他の設定もあるのですが、最初の画面(UI)とアラートだけ設定できれば十分かなと思い、とりあえず2つだけ取り上げました。
もし、何か疑問があればお答えしますので、@Kajimatsu3627までDMやらReplyでも頂ければと思います。
また、これを取り上げて欲しい!というのもあれば連絡頂ければ頑張って勉強して紹介します!!(笑)
最後まで、読んで頂きありがとうございました。