2018-11-23

「エンジニアのためのメネジメントキャリアパス」を読んだ

書評

概要

技術系管理者のキャリアパスを大局的な見地に立って紹介している本です。章が進むごとに管理者のランクも上がって行く構成になっています。（メンターからCTOまで) 今回は、自分が興味が3章のテックリード について書いていきたいと思います。

エンジニアのためのマネジメントキャリアパス ―テックリードからCTOまでマネジメントスキル向上ガイド

作者: Camille Fournier,及川卓也(まえがき),武舎広幸,武舎るみ
出版社/メーカー: オライリージャパン
発売日: 2018/09/26
メディア: 単行本（ソフトカバー）
この商品を含むブログ (1件) を見る

概要
内容
- テックリードとは何か
- この本は何をしろと行っているのか
  - 考え方
  - テックリードのコツ
  - 基礎知識
  - プロジェクトの管理
  - プロジェクト管理の指針
  - 優秀なテックリードとは（まとめ）

2018-11-10

Real World HTTPを読んだ (2章のみ)

書評

前回 (Real World HTTPを読んだ (1章のみ) - 将軍の備忘録) に引き続き、個人的に気になったところを書いていきます。

Real World HTTP ―歴史とコードに学ぶインターネットとウェブ技術

作者: 渋川よしき
出版社/メーカー: オライリージャパン
発売日: 2017/06/14
メディア: 単行本（ソフトカバー）
この商品を含むブログ (4件) を見る

コンテントネゴシエーション

サーバとクライアントは、別々に開発されているため、期待している形式が一致するとは限らない
1リクエストの中でサーバとクライアントがお互いのベストな設定を共有する仕組み
ネゴシエーションにはヘッダを使う

以下、表を引用

リクエストヘッダー	レスポンス	ネゴシエーション対象
Accept	Content-Type	MIMEタイプ
Accept-Language	Content-Language/htmlタグ	表示言語
Accept-Charset	Content-Type	文字のキャラクタセット
Accept-Encoding	Content-Encoding	ボディの圧縮

こちらのブログでキャラセットについても改めて確認。

ファイルの種類の決定

以下のようなリクエストヘッダ(Accept)だった場合

image/webp
*/*;q=0.8

qは、品質係数と言われ、0から1まで指定する。デフォは1。
Webサーバは、WebPに対応していれば、WebPを返す
Webサーバが、WebPに対応していなければ、他のフォーマット(優先度0.8)をサーバーに要求

表示言語の決定

以下のようなリクエストヘッダの場合

Accept=Language: en-US,en;q=0.8,ja:q=0.6

en-US,en,jaの優先順位でリクエスト送る。
あまり使われておらず、<html lang="ja"> のようにHTMLタグの中で返しているページが多い

キャラクターセットの決定

以下のようなリクエストヘッダを送信するが、

Accept-Charset: UTF-8,Shift_JIS;q=0.7,*;=0.3

どのモダンブラウザも Accept-Charset を送信していない。
理由はおそらくどのブラウザも全てのキャラクターセットを内包しており、ネゴシエーションする必要がないからと想像される
キャラクターセットは、MIMEタイプと一緒に Content-Type ヘッダーに格納される

圧縮による通信速度の向上

圧縮アルゴリズムを使うとファイルをサイズを1/10程度にできる、結果処理時間が短くなる
コンテンツ圧縮を行うネゴシエーションはヘッダーの中だけ完了
例）deflate,gzipを指定

Accept-Encoding: deflate, gzip

curlコマンドは、--compressedオプション
Googleがgzipより効率が良い圧縮フォーマット Brotli の実装を公開
br を指定してリクエストを送り、サーバが対応していれば Brotli による高速化が行われる
クライアント、もしくはサーバが Brotil に対応していなければ、別のエンコーディング(たぶんgzip)のフォールバックされる

クッキー

クッキーは、ウェブサイトの情報をブラウザ側に保存する仕組み。
サーバ　→　クライアントに「これを保存しといて」という指示を出す
例）最終アクセス日時と時間

Set-Cookie: LAST_ACCESS_DATE=Jul/31/2016
Set-Cookie: LAST_ACCESS_TIME=12:04

クライアントはこれをローカルのストレージに保存しておき、次回同じURLアクセスする時にリクエストヘッダーに加えて送る
HTTPはステートレスだがクッキーを使うことであたかもサーバーが状態を保持したステートレスであるかのように見せる
クッキーの用途
無くなっても問題のない情報
サーバ側の情報から復元できる情報
容量は4キロバイト
secure を付与すればHTTPS通信のみ、HTTPの場合は平文で送受信する。パスワードとか要注意
クッキーには属性がいくつか定義されている
Expires, Max-Age 、Domain属性、Path属性、Secure 属性、HttpOnly 属性、SameSite 属性

認証とセッション

Ruby on Railsのデフォルトセッションストレージは、クッキーを使ったデータ保存。
クライアントには、電子署名済みのデータを送り、クライアントがサーバにクッキーを再送することサーバは署名を確認する。
署名も確認もサーバ側で行うので、クライアント側は一切鍵をもたない
- 今さら聞けないセッションとCookie、ログイン・ログアウト(Rails編) - Qiita

プロキシ

HTTPなどの通信を中継したり、さまざまな付加機能(圧縮したり、キャッシュしたり）をよろしくやってくれる仕組み
プロキシとゲートウェイの違い
プロキシ：通信の内容を理解する。必要におうじてコンテンツを改変したり、サーバに変わって応答する
ゲートウェイ：通信内容をそのまま転送する。内容の改変もやらない

キャッシュ

例えばすでにアクセスしてダウンロード済みのコンテンツの内容に変化がなければ、サーバからのダウンロードを制御し、それによってパフォーマンスをあげる仕組み。
更新日時のよるキャッシュ
例えば以下のようなレスポンスを含めたとする

Last-Modified:  Wed, 08 Jun 2016 15:23:45 GMT

ウェブブラウザがキャッシュ済みURLを再度読み込む際、日時をそのままヘッダーに入れてリクエストする

If-Modified-Since: Web, 08 Jun 2016 15:23:45 GMT

次にWebサーバは、受け取った日時とサーバ上のコンテンツ日時を比較し、変更があれば通常通りレスポンスを返し、変更がなければ 304 Not Modified（ボディはない)を返す。

Expires

更新日時を使ったキャッシュの場合、キャッシュの有効性を確認するための通信が発生してしまう
その通信自体をなくしてしまおうというのが、Expires
例

Expires: Fri, 05 Aug 2016 00:11:22 GMT

クライアントは、この期限内であれば新鮮と判断し、強制的にキャッシュを利用
期限がすぎていれば新鮮ではないと判断
期限内で一切問い合わせされなくなるので、要注意

Pragma: no-cache

クライアントからプロキシサーバに指示を送ることもある
唯一仕様に定義されているのが, no-cache
「リクエストしたコンテンツがキャッシュされていたとしても、オリジンサーバまでリクエストを届けてほしい」という指示

Etag

上述のシーケンシャルな更新日時とは違って、ファイルに関連するハッシュ値を使って比較する
サーバは、レスポンスに Etag ヘッダをつける
2度目以降のダウンロード時にクライアントは IF-None-Match ヘッダに Etag の値をつける
サーバは受け取ったEtagとリクエストされたfairunoEtagを比較する。
Apache2.3.15、Nginx、h2oが付与するEtagの書式は、更新日時 + ファイルサイズ となっている。

Cache-Control

柔軟なキャッシュ制御が可能
Expiresよりも優先される
こちらのqiitaの記事がわかりやすかった

Vary

同じURLでもクライアントによって返す結果が異なることを示すヘッダ
例えば、ブラウザがスマホ用なのかPC用なのかとか
この表示が変わる理由にあたるヘッダを列挙することで、それぞれにあったキャッシュを返すことができる
例）User-Agent, Accept-Languageの設定ごとにキャッシュする

Vary: User-Agent, Accept-Language

リファラー

ユーザがどの経路からウェブサイトに到達したかをクライアントがサーバに送るヘッダ。

検索エンジン向けのコンテンツのアクセス制御

クローラー向けのアクセス制御方法は、主に2つ

robots.txt

クローラーに対してアクセスの許可・不許可を伝えるためのプロトコル
robots.txtにルールを記述する
例）読み込みを禁止するクローラーの名前と場所を指定

User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp

HTMLのメタタグにも記述できる

<meta name="robots" content="noindex" />

サイトマップ

ウェブサイトに含まれるページ一覧とそのメタデータを提供するXMLファイル
robots.txtはブラックリスト的に使うが、サイトマップはホワイトリスト
クローラーはページを辿ってページを発見していく
サイトマップは、robots.txtにも書ける

Sitemap: http://www/example.org/sitemap.xml

おしまい。

2018-11-04

Real World HTTPを読んだ (1章のみ)

書評

なぜ読もうと思ったのか？

web業界に入って3年以上経つが、HTTPプロトコルについてちゃんと勉強したことがなかったので読んでみようとなった。

何を得たいか？

HTTPについて体型形的に学んでみたい
実際にHTTPプロトコルはどのようにやりとりされているかを理解する
HTTPに関連する技術の仕組みを理解する

所感

GO言語のサンプルが手を動かしながらプロトコルのやりとりを見れるのが良い。この書籍なら目的を達成できそうではある。
curlコマンドを動作をシミュレートする。curlの勉強にもなる。
背景も含めてすごく丁寧に解説されているので非常に読みやすいし、理解しやすい。
オススメです
Real World HTTP ―歴史とコードに学ぶインターネットとウェブ技術
- 作者: 渋川よしき
- 出版社/メーカー: オライリージャパン
- 発売日: 2017/06/14
- メディア: 単行本（ソフトカバー）
- この商品を含むブログ (4件) を見る
気になったところだけ、以下のメモに整理してみました。

気になったところだけメモ

1章 HTTP/1.0のシンタックス：基本となる4つの要素

最初のバージョンHTTP/0.9は、HTMLのドキュメントを取得するだけのシンプルなプトコロルだった。
HTTP/0.9でできないこと
- 1つのドキュメントを送る機能しかない
- すべてHTTPである想定であったため、コンテンツフォーマットを伝える手段がなかった
- 検索のリクエストを送る以外のリクエストが送信できなかった
- 文書を送信したり、更新したり、削除することができなかった
HTTP/0.9からのリクエスト変更点
- メソッドが追加された(GET)
- HTTPバージョンが追加された
- ヘッダーが追加された(Host,User-Agent, Accept)
HTTP/0.9からのレスポンス変更点
- HTTPバージョンと3桁のスタータスコードが含まれる
- リクエストと同じヘッダーが含まれる
電子メールで使われていたヘッダーを使うことに
- ヘッダーは、「フィールド名：値」で構成
- ヘッダと本文の間に空行
- クライアントからサーバに送るヘッダ
  - User-Agent、Referer、Authorization等
- サーバからクライアントに送るヘッダ
  - Content-Type、Content-Lentgth,Content-Encoding,Date等
- X- から始めるヘッダは自由に使って良い
MIMEタイプ
- Content-Typeヘッダに含まれいるあれ
- ファイルの種類を区別するためのもの
- ブラウザはファイルの種類ごとにどのような動作をするか管理している
- ファイルの種類にあわせてブザウザの画面に表示したり、保存したりする。
- このファイルの種類を表す識別子がMIMEタイプ
- 拡張子で分かりそうなものだけど？
  - 例）CGIを使ったアクセスカウンターは、数字の入った画像を生成するPerlスリプトだった
  - しかし.cgiにアクセスしても返されるのは、画像なので拡張子による判断は難しい
  - CGIプログラムが image/gifようなヘッダーを生成することで画像が表示されていた
メソッド
- GET、HEAD、POSTがある
- PUTとDELETEは、HTTP1.0の段階では必須でなかった
ステータスコード
- 100番台：処理中の情報の伝達
- 200番台：成功時のレスポンス
- 300番台：サーバからクライアントへの命令。リダイレクトとか
- 400番台：クライアントエラー
- 500番台：サーバ内部のエラー
リダイレクト
- クライアントのLocationヘッダをみて、再度リクエストを行う
- リダイレクトの欠点
  - リダイレクトのたびにTCPセッションの接続、HTTPの送信・受信の2往復が発生する
  - Googleではリダイレクトは5回以下、できれば3回以下というガイドラインを出している
URL
- URIとURLは別物
- URIには、URL(Uniform Resource Name)とう名前の付け方ルールも含まれる
- URLは、ドキュメントのリソースを特定する手段を提供する
- 例）
  - urn:JR:あずさ2号というルールで名前をつけた名前がURN
  - 電車://新宿駅/9番ホーム/あずさ2号がURL。
    - 電車が長野いってしまうとアクセスできない
- 以下の要素で構成される
  - スキーマ：https
  - ホスト名：www.oreilly.co.jp
  - パス：index.shtml
  - スキーマ://ユーザ:パスワード@ホスト名:ポート/パス#フラグメント?クエリー
- これからのスキーマを解釈するのはブラウザの責任
ボディ
- 1回のレスポンスごとに1ファイルを返す
- ボディはContent-Encodingで指定された圧縮アルゴリズムで圧縮できる
- この時、Content-Lengthは、圧縮後のデータサイズとなる

2章のレビューもたぶん書きます。

2016-07-26

HAProxyのお勉強

HAproxyのインストール

HAproxyとは？

L4層(TCP)とL7層(TCP)の負荷分散やプロキシ機能を提供するソフトウェア。

APサーバやDBサーバに負荷分散等に使用される。

主な特徴は？

ハイパフォーマンス
高度なルーティングポリシー
L7通信モード、L4通信モードに対応

だそうです。

こちらのサイトに詳しく記載されています。

www.ossplaza.com