A Philosophy of Software Design (John Ousterhout)

書籍情報

著者:John Ousterhout(著)
発行日:2018-04-06
ISBN:9781732102200
URL:https://web.stanford.edu/~ouster/cgi-bin/aposd.php

書籍目次

Preface
1 Introduction
- 1.1 How to use this book
2 The Nature of Complexity
- 2.1 Complexity defined
- 2.2 Symptoms of complexity
- 2.3 Causes of complexity
- 2.4 Complexity is incremental
- 2.5 Conclusion
3 Working Code Isn't Enough
- 3.1 Tactical programming
- 3.2 Strategic programming
- 3.3 How much to invest?
- 3.4 Startups and investment
- 3.5 Conclusion
4 Modules Should Be Deep
- 4.1 Modular design
- 4.2 What's in an interface?
- 4.3 Abstractions
- 4.4 Deep modules
- 4.5 Shallow modules
- 4.6 Classitis
- 4.7 Examples: Java and Unix I/O
- 4.8 Conclusion
5 Information Hiding (and Leakage)
- 5.1 Information hiding
- 5.2 Information leakage
- 5.3 Temporal decomposition
- 5.4 Example: HTTP server
- 5.5 Example: too many classes
- 5.6 Example: HTTP parameter handling
- 5.7 Example: defaults in HTTP responses
- 5.8 Information hiding within a class
- 5.9 Taking it too far
- 5.10 Conclusion
6 General-Purpose Modules are Deeper
- 6.1 Make classes somewhat general-purpose
- 6.2 Example: storing text for an editor
- 6.3 A more general-purpose API
- 6.4 Generality leads to better information hiding
- 6.5 Questions to ask yourself
- 6.6 Conclusion
7 Different Layer, Different Abstraction
- 7.1 Pass-through methods
- 7.2 When is interface duplication OK?
- 7.3 Decorators
- 7.4 Interface versus implementation
- 7.5 Pass-through variables
- 7.6 Conclusion
8 Pull Complexity Downwards
- 8.1 Example: editor text class
- 8.2 Example: configuration parameters
- 8.3 Taking it too far
9 Better Together Or Better Apart?
- 9.1 Bring together if information is shared
- 9.2 Bring together if it will simplify the interface
- 9.3 Bring together to eliminate duplication
- 9.4 Separate general-purpose and special-purpose code
- 9.5 Example: insertion cursor and selection
- 9.6 Example: separate class for logging
- 9.7 Example: editor undo mechanism
- 9.8 Splitting and joining methods
- 9.9 Conclusion
10 Define Errors Out Of Existence
- 10.1 Why exceptions add complexity
- 10.2 Too many exceptions
- 10.3 Define errors out of existence
- 10.4 Example: file deletion in Windows
- 10.5 Example: Java substring method
- 10.6 Mask exceptions
- 10.7 Exception aggregation
- 10.8 Just crash?
- 10.9 Design special case
11 Design it Twice
12 Why Write Comments? The Four Excuses
- 12.1 Good code is self-documenting
- 12.2 I don't have time to write comments
- 12.3 Comments get out of date and become misleading
- 12.4 All the comments I have seen are worthless
- 12.5 Benefits of well-written comments
13 Comments Should Describe Things that Aren't Obvious from the Code
- 13.1 Pick conventions
- 13.2 Don't repeat the code
- 13.3 Lower-level comments add precision
- 13.4 Higher-level comments enhance intuition
- 13.5 Interface documentation
- 13.6 Implementation comments: what and why, not how
- 13.7 Cross-module design decisions
- 13.8 Conclusion
- 13.9 Answers to questions from Section 13.5
14 Choosing Names
- 14.1 Example: bad names cause bugs
- 14.2 Create an image
- 14.3 Names should be precise
- 14.4 Use names consistently
- 14.5 A different opinion: Go style guide
- 14.6 Conclusion
15 Write The Comments First
- 15.1 Delayed comments are bad comments
- 15.2 Write the comments first
- 15.3 Comments are a design tool
- 15.4 Early comments are fun comments
- 15.5 Are early comments expensive?
- 15.6 Conclusion
16 Modifying Existing Code
- 16.1 Stay strategic
- 16.2 Maintaining comments: keep the comments near the code
- 16.3 Comments belong in the code, not the commit log
- 16.4 Maintaining comments: avoid duplication
- 16.5 Maintaining comments: check the diffs
- 16.6 Higher-level comments are easier to maintain
17 Consistency
- 17.1 Examples of consistency
- 17.2 Ensuring consistency
- 17.3 Taking it too far
- 17.4 Conclusion
18 Code Should be Obvious
- 18.1 Things that make code more obvious
- 18.2 Things that make code less obvious
- 18.3 Conclusion
19 Software Trends
- 19.1 Object-oriented programming and inheritance
- 19.2 Agile development
- 19.3 Unit tests
- 19.4 Test-driven development
- 19.5 Design patterns
- 19.6 Getters and setters
- 19.7 Conclusion
20 Designing for Performance
- 20.1 How to think about performance
- 20.2 Measure before modifying
- 20.3 Design around the critical path
- 20.4 An example: RAMCloud Buffers
- 20.5 Conclusion
21 Conclusion
Index
Summary of Design Principles
Summary of Red Flags

Preface

ソフトウェア設計の現状

電子計算機向けプログラムの歴史は80年以上に及ぶが、ソフトウェア設計の方法論や良いプログラムの要件についての議論は乏しい
開発プロセス（アジャイル開発）、開発ツール（デバッガ、バージョン管理、テストカバレッジ）、プログラミング技法（OOP、関数型）、デザインパターン、アルゴリズムに関する議論は豊富に存在する
ソフトウェア設計の核心的問題は依然として未解決のまま残っている
David Parnas の1971年の論文「モジュール分割の基準について」以降、ソフトウェア設計の技術的水準はほとんど進歩していない

問題分解の重要性と教育の欠如

複雑な問題を独立して解決できる部分に分割する「問題分解」は、コンピュータサイエンスにおける最も根本的な課題である
問題分解はプログラマが日常的に直面する設計の中心的課題であるが、大学の授業ではほとんど取り上げられていない
for ループやオブジェクト指向プログラミングは教えられるが、ソフトウェア設計そのものは教えられない

プログラマの能力差と設計スキルの性質

プログラマ間には品質と生産性において大きな差がある
優れたプログラマの多くは、自分の強みとなる具体的な技術を言語化することが難しい
ソフトウェア設計スキルは先天的な才能であるという認識が広まっている
科学的証拠（Geoff Colvin 著『Talent is Overrated』等）によれば、多くの分野での卓越した成果は先天的能力よりも質の高い練習に関係している

スタンフォード大学 CS 190 の授業スタイル

著者はソフトウェア設計の授業を開設し、その成果として本書を執筆した
授業の形式:
- ソフトウェア設計の原則を提示し、学生がプロジェクトを通じて原則を習得・実践する
- 英語の作文授業に類似した反復プロセスを採用する（ドラフト→フィードバック→修正）
- 大規模なソフトウェアをゼロから開発し、コードレビューで設計上の問題を特定・改善する
設計原則の特徴:
- 高度かつ哲学的な内容を含む（例: 「エラーを存在しないものとして定義する」）
- 抽象的な学習より、コードを書き、ミスをし、修正と原則の関係を見る実践的学習が効果的

著者の背景と経験

著者はソフトウェア設計の正式な教育を受けておらず、個人的な経験から知見を得ている
多様な言語で約25万行のコードを記述した
携わったプロジェクト:
- 3つのオペレーティングシステムの設計
- 複数のファイル・ストレージシステム
- デバッガ、ビルドシステム、GUIツールキット等のインフラツール
- スクリプト言語
- テキスト、図、プレゼンテーション、集積回路向けのインタラクティブエディタ
こうした経験から、避けるべきミスと活用すべき技法の共通パターンを抽出している

本書の位置付けと読者への要請

本書はソフトウェア設計についての意見書であり、最終的な答えを提示するものではない
本書の目的はソフトウェア設計に関する議論を始めることにある
読者へのアドバイス:
- 本書の提案は批判的に受け取ること
- 複雑さの軽減という全体目標が、個々の原則よりも重要である
- 提案が複雑さを実際に軽減しない場合は、採用を強制されない
フィードバックの募集:
- 連絡先: [email protected]
- Google Group「software-design-book」への参加も可能
- 具体的なバグ、改善提案、重要な設計原則を示す簡潔な例を求めている
- 寄せられたフィードバックは将来の版に反映予定

1 Introduction

ソフトウェア開発と複雑性の本質

ソフトウェア開発は人類史上最も純粋な創造的活動の一つであり、プログラマーは物理法則のような実際の制約に縛られない
ソフトウェア開発における最大の制約は、作成するシステムを理解する能力である
プログラムが進化し機能が増えるにつれ、コンポーネント間に微妙な依存関係が生じ複雑性が蓄積される
複雑性の蓄積は開発速度を低下させ、バグを増加させ、コストを押し上げる
プログラムが大規模になり、関与する人数が増えるほど、複雑性の管理は困難になる

複雑性に対処する2つのアプローチ

第1のアプローチ ——複雑性の排除:
- コードをよりシンプルかつ明確にすることで複雑性を取り除く
- 特殊ケースの排除や識別子の一貫した使用などが具体的手段
第2のアプローチ ——複雑性のカプセル化（モジュラー設計）:
- 複雑性を封じ込め、プログラマーがシステム全体の複雑性に一度にさらされないようにする
- ソフトウェアシステムをクラスなどのモジュールに分割する
- モジュールは互いに独立して設計され、他のモジュールの詳細を理解せずに作業できる

ウォーターフォールモデルとその問題点

ウォーターフォールモデルの概要:
- 要件定義・設計・コーディング・テスト・保守という離散したフェーズにプロジェクトを分割する
- 各フェーズは次のフェーズが始まる前に完了し、システム全体の設計を一度に行う
- 設計フェーズの終了時に設計が凍結される
ウォーターフォールモデルがソフトウェアに不適合な理由:
- ソフトウェアシステムは物理システムより本質的に複雑であり、実装前に全設計上の問題を把握できない
- 設計上の問題は実装が進んでから明らかになるが、その時点での大規模設計変更は困難
- 開発者は全体設計を変更せずに問題を修正しようとし、複雑性の爆発的増加を招く

インクリメンタル開発（アジャイル開発）

機能の小さなサブセットから設計・実装・評価を繰り返すアプローチを採用する
各イテレーションで既存設計の問題を発見し、次の機能設計前に修正する
システムがまだ小規模なうちに初期設計の問題を修正できる
後続機能は前の実装で得た経験の恩恵を受け、問題が少なくなる
ソフトウェアの可塑性により、実装途中での大規模設計変更が可能である

ソフトウェア設計の継続的プロセス

インクリメンタル開発により、ソフトウェア設計は決して終わらない継続的プロセスである
初期設計がベストであることはほぼなく、経験を通じてより良い方法が明らかになる
開発者は常に設計の改善機会を探し、一定の時間を設計改善に充てるべきである
複雑性の削減がソフトウェア設計において最も重要な要素であり、設計全体を通じて複雑性を意識すべきである

本書の目的と活用方法

本書の目標:
- 第1目標: ソフトウェア複雑性の本質を説明すること（「複雑性」の定義、重要性、識別方法）
- 第2目標: 開発プロセスにおける複雑性最小化の技法を提示すること
- 単純なレシピではなく、「クラスは深くあるべき」などの上位概念を哲学的に提示する
本書の活用方法:
- コードレビューと組み合わせて使用することが最も効果的
- 他者のコードを読む際に設計上の問題を発見し、改善案を提案する訓練を行う
- レッドフラグ（コードが必要以上に複雑であることを示すサイン）を認識する能力を養う
- レッドフラグを発見した際は立ち止まり、問題を排除する別の設計を探す
適用上の注意:
- すべての規則には例外があり、すべての原則には限界がある
- 設計原則を極端に適用すると悪い結果をもたらす
- 優れた設計は競合するアイデアとアプローチのバランスを反映する
対象言語と適用範囲:
- 例題はJavaおよびC++を使用し、オブジェクト指向言語のクラス設計を主に論じる
- メソッドに関するアイデアはCなどの非オブジェクト指向言語の関数にも適用可能
- サブシステムやネットワークサービスなど、クラス以外のモジュールにも設計思想は適用できる

2 The Nature of Complexity

章の目的と概要

本書はソフトウェアシステムの複雑性を最小化する設計を論じる
本章は複雑性の定義、症状、原因を高レベルで整理する
複雑性を認識する能力は重要な設計スキルであり、問題の早期発見と設計方針の改善に役立つ
本章は以降の章の基礎となる前提を提示する

複雑性の定義

複雑性とは、ソフトウェアシステムの構造においてシステムの理解と変更を困難にするもの全般を指す
コストとベネフィットの観点でも捉えられる:
- 複雑なシステムでは小さな改善にも多大な作業が必要
- シンプルなシステムではより少ない労力で大きな改善が可能
複雑性はシステム全体の規模や機能の多さとは必ずしも一致しない:
- 大規模で高機能なシステムが作業しやすければ複雑ではない
- 小規模・単純なシステムでも複雑になりうる
システムの全体的複雑性は、各パーツの複雑性と開発者がそのパーツに費やす時間の割合によって決まる
複雑性は書き手よりも読み手に明確に現れる:
- 自分には単純に見えても他者が複雑と感じる場合は複雑とみなす
- 開発者の役割は自分が扱いやすいコードだけでなく、他者も扱いやすいコードを作ること

複雑性の症状

変更の増幅 (Change amplification):
- 一見単純な変更が多くの箇所の修正を要する状態
- 例: 各ページにバナーの背景色をハードコードしているWebサイトは、色変更時に全ページの修正が必要
- 良い設計はひとつの設計判断が影響するコード量を最小化する
認知的負荷 (Cognitive load):
- タスクを完了するために開発者が把握すべき情報量の多さ
- 認知的負荷が高いほど習得時間が増加し、見落としによるバグリスクが上昇する
- コード行数の少なさは複雑性の低さを意味しない:
  - 行数が少なくても理解困難なフレームワークは存在する
  - 行数が多くても認知的負荷を下げる実装の方がシンプルな場合がある
未知の未知 (Unknown unknowns):
- どのコードを修正すべきか、またはどの情報が必要かが不明瞭な状態
- 変更後にバグが現れるまで問題に気づけない
- 3つの症状のうち最も深刻:
  - 変更の増幅は修正箇所が明確であれば対処可能
  - 認知的負荷は読む情報が明確であればコストが上がっても正確な変更が可能
  - 未知の未知は何をすべきか、提案した解決策が正しいかすら不明
良い設計の目標はシステムを明白 (obvious) にすること:
- 認知的負荷と未知の未知の反対概念
- 開発者が深く考えなくても正確な推測ができる状態

複雑性の原因

依存関係 (Dependencies):
- あるコードが他のコードを考慮せずに理解・変更できない状態
- 例: ネットワークプロトコルの送信側と受信側のコード、メソッドのシグネチャと呼び出し元
- 依存関係はソフトウェアの本質的な要素で完全な排除は不可能
- 設計目標は依存関係の数を減らし、残存する依存関係をシンプルかつ明白にすること
- 非明白な依存関係をより明白でシンプルな依存関係に置き換えることが有効
曖昧性 (Obscurity):
- 重要な情報が明白でない状態
- 例: 汎用的すぎる変数名、単位が不明なドキュメント、同一変数名を2つの目的に使用する不一致
- 依存関係が存在することが明白でない場合に多く関連する
- ドキュメントの不足だけでなく設計の問題でもある:
  - クリーンで明白な設計はドキュメント量を削減する
  - 大量のドキュメントが必要な場合は設計に問題がある兆候
  - 曖昧性を減らす最善策はシステム設計をシンプルにすること
依存関係と曖昧性が3つの症状を生む:
- 依存関係 → 変更の増幅と高い認知的負荷
- 曖昧性 → 未知の未知と認知的負荷

複雑性の漸進的な蓄積

複雑性は単一の壊滅的なエラーではなく、小さな問題の積み重ねで生じる
数百・数千の小さな依存関係や曖昧性が積み重なり、あらゆる変更に影響する
漸進的な性質ゆえ制御が困難:
- 個々の変更で生じる小さな複雑性は些細に見えるが急速に蓄積する
- 一度蓄積すると単一の依存関係や曖昧性の修正では大きな改善が得られない
複雑性の増大を抑制するには「ゼロ容認」の哲学が必要

結論

複雑性は依存関係と曖昧性の蓄積から生じる
複雑性の増大により変更の増幅、高い認知的負荷、未知の未知が発生する
各機能実装に必要なコード変更量が増加し、安全な変更に必要な情報収集時間も増加する
最悪の場合、必要な情報を全て入手できない事態となる
複雑性は既存コードベースの変更を困難かつリスクの高いものにする

3 Working Code Isn't Enough

戦術的プログラミングの問題点

戦術的プログラミングとは、現在のタスクを迅速に完了させることを最優先とするアプローチ
将来の設計より目先の動作を重視するため、近視眼的な判断を繰り返す
複雑性は「小さな妥協の積み重ね」によって段階的かつ急速に増大する
一度複雑性が蓄積すると、リファクタリングより次の機能実装が優先され続け、コードは悪化の一途を辿る
「戦術的竜巻」と呼ばれる極端な戦術的プログラマーの特徴:
- 他者より圧倒的に速くコードを書き、短期的にはヒーロー扱いされる
- 後続のエンジニアに混乱の後始末を強い、組織全体の見かけ上の生産性を歪める

戦略的プログラミングの原則

「動作するコード」を主目標とせず、優れた設計を生み出すことを第一の目標とする
投資マインドセットを採用し、長期的な設計改善のために短期的な速度を犠牲にする
投資の形態:
- 事前投資: 新しいクラス設計に複数の案を試みて最もシンプルなものを選ぶ、良いドキュメントを作成する
- 事後投資: 設計上の問題を発見したら放置せず修正する、継続的に小さな改善を積み重ねる

適切な投資量

開発時間全体の10〜20%を設計への投資に充てることを推奨する
短期的には初期プロジェクトが10〜20%遅くなるが、数ヶ月後には戦術的アプローチと同等以上の速度を達成する
戦略的アプローチの長期的メリット:
- 過去の投資による利益が将来の投資コストをカバーし、実質的に投資が無償となる
- 複雑性の蓄積を防ぎ、長期的な開発速度を維持する
戦術的アプローチの長期的代償:
- 初期は10〜20%速く進むが、複雑性の蓄積により長期的には10〜20%遅くなる
- 劣化したコードベースは開発速度を少なくとも20%低下させる

スタートアップにおける設計投資

スタートアップが戦術的アプローチを選択しがちな背景:
- 早期リリースへの強いプレッシャーから、10〜20%の設計投資すら余裕がないと判断される
- 成功後に資金を調達してコードを整理できるという誤った合理化が行われる
戦術的アプローチの現実的なリスク:
- コードがスパゲッティ化すると修正はほぼ不可能となり、製品の存続期間を通じて高い開発コストを負い続ける
- コード品質の低さは優秀なエンジニアの採用を困難にし、コスト増大と設計劣化の悪循環を生む
Facebookの事例（戦術的アプローチ）:
- 「速く動いて壊せ」を社訓とし、新入エンジニアが初週から本番コードを書くことを奨励した
- コードは不安定で理解困難な状態に陥り、最終的に「堅固なインフラで速く動く」へ方針転換した
GoogleとVMwareの事例（戦略的アプローチ）:
- 高品質なコードと良い設計を重視し、トップ技術人材を集める強い企業文化を築いた
- 複雑な問題を信頼性の高いシステムで解決し、持続的な成功を収めた

結論

良い設計は継続的な投資なしには実現できず、小さな問題が大きな問題に積み重なる前に対処する必要がある
設計改善の先送りは習慣化しやすく、一度遅延が始まると永続的な遅延となり、戦術的文化へのスリップを招く
問題の先送りは問題をより大きく、解決をより困難にする
最も効果的なアプローチは、あらゆるエンジニアが日々継続的に小さな設計投資を行うこと

4 Modules Should Be Deep

モジュラー設計の基本原則

ソフトウェアの複雑性を管理する重要な手法として、モジュラー設計がある
モジュラー設計では、システムを比較的独立したモジュールの集合に分解する
モジュールはクラス、サブシステム、サービスなど様々な形態をとる
理想的には各モジュールが完全に独立しているべきだが、現実にはモジュール間の依存関係が生じる
依存関係の管理のため、各モジュールはインターフェースと実装の2つの部分に分けて考える:
- インターフェース: モジュールを使用するために他の開発者が知る必要のある情報（「何をするか」）
- 実装: インターフェースが約束した内容を実際に実行するコード（「どのようにするか」）
モジュラー設計の目標は、モジュール間の依存関係を最小化することにある
最良のモジュールは、インターフェースが実装より大幅にシンプルなもの

インターフェースの構成要素

インターフェースは形式的な要素と非形式的な要素の2種類から構成される
形式的な要素:
- コード上で明示的に定義され、プログラミング言語によって検証可能
- メソッドのシグネチャ（パラメータ名・型、戻り値の型、例外情報）
- クラスのすべてのパブリックメソッドのシグネチャおよびパブリック変数
非形式的な要素:
- プログラミング言語では規定・強制できない
- 高レベルの動作（例: 引数で指定されたファイルを削除する関数であること）
- 利用上の制約（例: あるメソッドは別のメソッドより先に呼び出す必要があるなど）
- コメントによってのみ記述でき、記述の完全性や正確性は言語によって保証されない
- 多くのインターフェースにおいて、非形式的な側面は形式的な側面より大きく複雑

抽象化の概念と誤り

抽象化とは、重要でない詳細を省略したエンティティの簡略化されたビューである
モジュールのインターフェースは、そのモジュールの機能の抽象化を提供する
抽象化が陥る2つの誤り:
- 重要でない詳細を含めてしまう: 抽象化が不必要に複雑になり、認知負荷が増加する
- 重要な詳細を省略してしまう: 情報が不足し、開発者がモジュールを正しく使えなくなる（偽の抽象化）
ファイルシステムを例に取ると:
- 省略してよい詳細: ストレージデバイス上のブロック選択メカニズム
- 省略できない詳細: データをセカンダリストレージにフラッシュするルール（データベースなどが必要とするため）
抽象化設計の鍵は「何が重要か」を理解し、重要な情報の量を最小化する設計を探ることにある

深いモジュール

「深いモジュール」とは、強力な機能を持ちながらシンプルなインターフェースを持つモジュールのこと
モジュールの深さはコストと利益の観点で考えられる:
- 利益: モジュールの機能性
- コスト（システム複雑性における）: インターフェース
インターフェースが小さくシンプルであるほど、システムに与える複雑性は少ない
深いモジュールの代表例:
- Unix I/Oインターフェース: open / read / write / lseek / close の5つのシステムコールのみで、背後に数十万行のコードが存在する
- ガベージコレクター（GoやJavaなど）: インターフェースが事実上ゼロで、裏側で自動的に動作し、オブジェクト解放のインターフェースを排除することで全体インターフェースを縮小させる

浅いモジュール

浅いモジュールの発生は危険信号
「浅いモジュール」とは、提供する機能に対してインターフェースが相対的に複雑なモジュールのこと
浅いモジュールは複雑性の管理にほとんど寄与しない
小さいモジュールは浅くなりがちであり、複雑性との戦いにおいて有益でない
浅いメソッドの極端な例:

private void addNullValueForAttribute(String attribute) {
    data.put(attribute, null);
}

問題点:
- メソッドを呼び出すより直接変数を操作した方が簡単
- ドキュメントがコード本体より長くなる可能性がある
- 開発者が習得すべき新たなインターフェースを増やすだけで、相応の利益を提供しない

クラシティス（Classitis）

「クラシティス」とは「クラスは良いものだから、多ければ多いほど良い」という誤った考えから生じる症状
現代のプログラミングでは「クラスは小さくあるべき」という通念が広まっており、クラスを小さく分割することが推奨されがち
クラシティスの問題点:
- 個々のクラスは単純でも、システム全体の複雑性が増大する
- 小さいクラスは機能が乏しいため大量に必要となり、それぞれのインターフェースが積み重なってシステムレベルの複雑性が生じる
- 各クラスのボイラープレートにより、冗長なプログラミングスタイルが生まれる

JavaとUnix I/Oの比較例

Javaにおけるクラシティスの事例:
- ファイルからシリアライズされたオブジェクトを読み込む際、3つの異なるオブジェクトを生成する必要がある（FileInputStream、BufferedInputStream、ObjectInputStream）
- バッファリングが自動で有効化されず、開発者が明示的に BufferedInputStream を生成しなければならない
- この設計はエラーが発生しやすく（バッファリング忘れによるパフォーマンス低下）、利便性が低い
- バッファリングはほぼ全ての利用者に必要なため、デフォルトで提供されるべき
Unix I/Oにおける設計の優位性:
- シーケンシャルI/Oが最も一般的なため、それをデフォルトの動作とした
- ランダムアクセスは lseek で対応可能だが、シーケンシャルアクセスのみを行う開発者はそのメカニズムを知る必要がない
- 一般的なケースをシンプルにするという設計思想を実践している

結論

モジュールのインターフェースと実装を分離することで、実装の複雑性をシステムの残りの部分から隠蔽できる
モジュールやクラスを設計する上で最も重要なことは、「深く」設計すること
深いモジュールとは、一般的なユースケースに対してシンプルなインターフェースを持ちながら、重要な機能を提供するもの
このアプローチにより、隠蔽できる複雑性の量を最大化できる

5 Information Hiding (and Leakage)

情報隠蔽の基本概念

情報隠蔽はDeep Moduleを実現するための最も重要な技法であり、David Parnasが提唱した
各モジュールはいくつかの設計決定をカプセル化し、その詳細を実装内部に埋め込んでインターフェースに露出させない
隠蔽される情報の例:
- B-treeのデータ構造とアクセス方法
- ファイル内の論理ブロックと物理ディスクブロックの対応
- TCPネットワークプロトコルの実装
- マルチコアプロセッサのスレッドスケジューリング
- JSONドキュメントのパース方法
情報隠蔽は複雑性を2つの方法で削減する:
- インターフェースを単純化し、利用者の認知負荷を軽減する
- 外部に依存を持たせないことで、設計変更の影響範囲を単一モジュールに限定する
privateアクセス修飾子による宣言は情報隠蔽と同義ではない（getterやsetterがあれば情報は露出する）
完全な情報隠蔽が最善だが、部分的な情報隠蔽も依存関係の削減に寄与する

情報漏洩とその危険性

情報漏洩は情報隠蔽の対義であり、ある設計決定が複数のモジュールに反映されている状態を指す
情報漏洩はモジュール間に依存関係を生み出し、設計変更が複数モジュールへの修正を要求する
漏洩の形態:
- インターフェースを通じた漏洩（より明示的で発見しやすい）
- バックドア漏洩（例: 同一ファイルフォーマットを複数クラスが把握している状態）
バックドア漏洩はインターフェース経由の漏洩より悪質であり、発見が困難
情報漏洩への対処:
- 影響を受けるクラスが小さく関連が深い場合は単一クラスに統合する
- 影響を受ける全クラスから情報を抽出し、それだけをカプセル化する新クラスを作る（ただし、新クラスが大半の知識をインターフェースに露出する場合は効果が薄い）

時系列分解による情報漏洩

時系列分解とは、システムの構造を処理の実行順序に対応させる設計スタイル
例: ファイルを読み込むクラス、変更するクラス、書き出すクラスに分けると、読み込みと書き出しの両クラスがファイルフォーマットの知識を持ち、情報漏洩が発生する
解決策はファイルの読み書き機能を単一クラスに統合すること
処理の順序ではなく、各タスクを実行するために必要な知識に焦点を当ててモジュールを設計する
順序は時にコード内に反映されるが、それが情報隠蔽と一致する場合のみモジュール構造に反映すべき

HTTPサーバを用いた実例

過剰なクラス分割の問題:
- HTTPリクエストの受信を「ネットワークから文字列へ読み込むクラス」と「文字列をパースするクラス」に分離した例は時系列分解の典型
- Content-Lengthヘッダの解析なしにリクエスト全体を読み込めないため、両クラスがHTTP構造の知識を持つことになり情報漏洩が発生
- 呼び出し元は特定の順序で2つのメソッドを呼ぶ必要があり、複雑性が増加
- 読み込みとパースを単一クラスに統合することで情報隠蔽が改善し、インターフェースも単純化される
クラスをやや大きくすることで情報隠蔽が向上する2つの理由:
- 特定の機能に関連するコードを集約できる
- インターフェースの抽象レベルを引き上げ、複数ステップを1つのメソッドに集約できる
HTTPパラメータ処理の良い例:
- パラメータの所在（ヘッダ行かボディか）を呼び出し元から隠蔽した
- URLエンコーディングをデコードしてから値を返すことで、エンコーディング知識を隠蔽した
HTTPパラメータ処理の悪い例:
- getParams() でMap全体を返すとパラメータの内部表現が露出する
- 内部表現が変更されるとインターフェースも変更され、全呼び出し元の修正が必要になる
- 呼び出し元がMapを変更しないよう注意する責任を負わせることになる
HTTPパラメータ処理の改善例:
- getParameter(String name) で単一パラメータをstring型で返す
- getIntParameter(String name) でstring型から整数型への変換も内部で行う
- 内部表現を隠蔽し、型変換も呼び出し元から隠蔽できる
HTTPレスポンスのデフォルト値:
- レスポンスのHTTPバージョンは呼び出し元が明示指定するのではなく、HTTPクラスが自動的に付与すべき
- DateヘッダなどもHTTPライブラリが適切なデフォルト値を提供すべき
- デフォルト値は「最も一般的なケースを可能な限り単純にする」原則を体現する
- 稀に上書きが必要な場合のみ、呼び出し元がそのデフォルト値の存在を意識する（部分的情報隠蔽）

クラス内部での情報隠蔽

情報隠蔽は外部公開APIだけでなく、クラス内部にも適用できる
クラス内のprivateメソッドも、それぞれが特定の情報や機能をカプセル化するよう設計すべき
各インスタンス変数が使われる箇所を最小化することでクラス内部の依存関係と複雑性を削減できる

情報隠蔽の過剰適用への注意

モジュール外部で必要とされる情報を隠蔽してはならない
設定パラメータがモジュールのパフォーマンスに影響し、用途によって異なる設定が必要な場合は、そのパラメータをインターフェースに露出すべき
設計者の目標はモジュール外部に必要な情報量を最小化することであり、モジュールが自動的に設定を調整できれば最善

結論

情報隠蔽とDeep Moduleは密接に関連しており、多くの情報を隠蔽するモジュールはより深くなる傾向がある
システムをモジュールに分解する際は、実行時の処理順序に引きずられてはならない（時系列分解は情報漏洩と浅いモジュールを招く）
アプリケーションのタスクに必要な知識の種類を考え、各モジュールがその知識をカプセル化するよう設計することで、シンプルでDeepな設計が実現できる

6 General-Purpose Modules are Deeper

汎用設計と特化設計のトレードオフ

汎用アプローチ: 幅広い問題に対応できる仕組みを実装し、将来的な再利用に備える
特化アプローチ: 現在の要件に絞り、必要な機能のみを実装する
著者の推奨は「やや汎用的（somewhat general-purpose）」な設計である
- モジュールの機能は現在の要件を反映する
- インタフェースは特定の用途に縛られず、複数の利用パターンを支持できる程度に汎用化する
- 過度に汎用化して現在の用途で使いづらくなることは避ける

事例: テキストエディタのテキストクラス設計

特化設計の問題点:
- backspace(Cursor cursor) や delete(Cursor cursor) のようにUIの操作ごとにメソッドを定義した
- deleteSelection(Selection selection) のようにUI固有の型をテキストクラスに持ち込んだ
- メソッド数が増大し、各メソッドは浅く、1か所からしか呼ばれない
- テキストクラスとUIクラスの間に情報漏洩が発生した
- バックスペースキーやセレクションなどUIの抽象概念がテキストクラスに侵食した
- 両クラスが密結合し、それぞれを独立して開発できなくなった
汎用設計への改善:
- insert(Position position, String newText) と delete(Position start, Position end) の2メソッドに集約した
- UI固有の型 Cursor の代わりに汎用型 Position を使用した
- changePosition(Position position, int numChars) により位置操作を汎用化した
- バックスペースとDeleteキーの実装はUIレイヤーのコードで表現できる
- テキストクラスは他用途（文字列置換など）にも転用可能になった

汎用性が情報隠蔽を向上させる

テキストクラスとUIクラスの間に明確な分離が生まれる
テキストクラスはバックスペースキーの処理など、UIの詳細を知る必要がなくなる
新しいUI機能を追加してもテキストクラスに変更が不要になる
開発者の認知負荷が低減する
- 少数のシンプルなメソッドを学ぶだけでよい
- 同じメソッドをさまざまな用途に再利用できる
「偽の抽象化（false abstraction）」の問題:
- 特化した backspace メソッドは情報を隠すと見せかけて、実際には開発者がその内部を確認しなければならない
- 詳細が重要な場合は明示的かつ明瞭にする方が適切である
- インタフェースの裏に隠すことで難解さを生み出す

汎用インタフェース設計のための自己確認

「現在の要件をすべてカバーする最もシンプルなインタフェースは何か」:
- APIの機能を損なわずにメソッド数を減らせれば、汎用化が進んでいる証拠である
- ただし、メソッドを減らすために引数が複雑化するなら汎用化とは言えない
「このメソッドは何種類の状況で使われるか」:
- 特定の1用途のみに対応するメソッドは過度な特化のサインである
- 複数の特化メソッドを1つの汎用メソッドに置き換えられないか検討する
「このAPIは現在の用途において使いやすいか」:
- 過剰な汎用化も問題となる
- 1文字単位の insert/delete しか持たないテキストクラスは汎用だが、エディタ実装には不向きで効率も悪い
- 文字範囲操作のような組み込みサポートが必要な場合もある

結論

汎用インタフェースはメソッド数が少なく、各メソッドは深い
クラス間の分離が明確になり、特化設計による情報漏洩を防ぐ
モジュールをやや汎用的に設計することは、システム全体の複雑性を低減する最善の手法の一つである

7 Different Layer, Different Abstraction

階層ごとに異なる抽象化の原則

ソフトウェアシステムは層で構成され、上位層は下位層の機能を利用する
適切に設計されたシステムでは、各層は隣接する層と異なる抽象化を提供する
ファイルシステムの例:
- 最上位層はファイル抽象化（可変長バイト配列）を実装する
- 中間層は固定サイズのディスクブロックのメモリキャッシュを実装する
- 最下位層はデバイスドライバで、ブロックをストレージとメモリ間で転送する
TCPの例:
- 最上位層は信頼性のあるバイトストリームを提供する
- 下位層は限定サイズのパケットをベストエフォートで送信する
隣接する層が類似した抽象化を持つ場合、クラス分解に問題がある可能性を示す

パススルーメソッド

パススルーメソッド: 同一または類似のシグネチャを持つ別のメソッドを呼び出すだけのメソッド
問題点:
- クラスを浅くする（インターフェースの複雑さを増すが、機能は増えない）
- クラス間の依存関係を生じさせる
- クラス間の責任分担の混乱を示す
解決方法:
- 上位クラスの呼び出し元が下位クラスを直接呼び出す（上位クラスから機能の責任を除去する）
- クラス間で機能を再分配する
- クラスをマージする
例:

public class TextDocument ... {
    private TextArea textArea;
    private TextDocumentListener listener;
    ...
    public Character getLastTypedCharacter() {
        return textArea.getLastTypedCharacter();
    }
    public int getCursorOffset() {
        return textArea.getCursorOffset();
    }
    public void insertString(String textToInsert, int offset) {
        textArea.insertString(textToInsert, offset);
    }
    public void willInsertString(String stringToInsert, int offset) {
        if (listener != null) {
            listener.willInsertString(this, stringToInsert, offset);
        }
    }
    ...
}

あるテキストエディタのコードには、ほぼすべてがパススルーメソッドで構成されたクラスが含まれていた
そのクラスの15個のパブリックメソッドのうち、13個がパススルーメソッドという状況だった

インターフェースの重複が許容されるケース

同一シグネチャを持つメソッドが常に問題となるわけではなく、各メソッドが有意な機能を提供する場合は許容される
ディスパッチャー:
- 引数を使って複数のメソッドの中から1つを選択して呼び出すメソッド
- ディスパッチャー自身のシグネチャは呼び出すメソッドと同一の場合が多い
- どのメソッドを実行するかを選択するという有用な機能を提供する（例: WebサーバーのHTTPリクエスト処理）
同一インターフェースを持つ複数の実装（例: OSのディスクドライバ）:
- 各ドライバは異なる種類のディスクをサポートするが、同一インターフェースを持つ
- 認知負荷を下げる効果がある

デコレーターパターン

デコレーターは既存オブジェクトを取得し、その機能を拡張する（下位オブジェクトと同一または類似のAPIを提供する）
例: JavaのBufferedInputStream（InputStreamをラップしてバッファリングを追加する）
問題点:
- デコレータークラスは浅くなりがち（多くのパススルーメソッドを含む）
- パターンを乱用すると浅いクラスが大量に生じる
デコレータークラスを作成する前に検討すべき代替案:
- 新機能を下位クラスに直接追加する（機能が汎用的、または下位クラスと論理的に関連する場合）
- 特定ユースケース用の機能は、そのユースケースとマージする
- 既存のデコレーターに新機能をマージして、単一の深いデコレーターを作る
- 基底クラスに依存しないスタンドアローンクラスとして実装する

インターフェースと実装の違い

クラスのインターフェースは通常その実装と異なるべきである
両者が類似した抽象化を持つ場合、クラスはおそらく浅い
テキストエディタの例:
- 行単位のAPIを持つテキストクラスは浅く、使いにくい（行の分割・結合を呼び出し元に強制する）
- 文字単位のインターフェース（任意位置への文字列挿入・削除）を提供することで、クラスが深くなり、上位コードが簡潔になる
- 内部実装は行単位でも、インターフェースを文字単位にすることでAPIと実装の差が価値ある機能を提供する

パススルー変数

パススルー変数: 中間メソッドで使用されないにもかかわらず、メソッドの長い連鎖を通じて渡される変数
問題点:
- 中間メソッドがその変数の存在を意識する必要が生じる
- 新しい変数が追加された場合、多数のインターフェースとメソッドを変更する必要がある
解消方法:
- 最上位と最下位のメソッド間で共有されているオブジェクトがあれば、そこに情報を格納する
- グローバル変数として格納する（ただし、複数インスタンスの作成やテストが困難になるなどの問題がある）
- コンテキストオブジェクトの導入（最も一般的な解決策）:
  - アプリケーションのすべてのグローバル状態を格納する
  - システムのインスタンスごとに1つのコンテキストオブジェクトが存在する
  - 複数のインスタンスが単一プロセス内に共存できる
  - コンストラクタでのみ明示的な引数として現れる
  - テストでグローバル設定を変更しやすい
コンテキストオブジェクトの問題点:
- グローバル変数と同様の欠点を多く持つ
- 規律なく使うと、システム全体に非自明な依存関係を生む大きなデータの詰め込み場所になりうる
- スレッドセーフの問題が発生する可能性がある（変数をイミュータブルにすることで対処）

結論

インターフェース、引数、関数、クラス、定義などの設計要素はすべて複雑さを追加する
設計要素が正味のメリットをもたらすには、その要素がない場合に生じる複雑さを消滅させなければならない
パススルーメソッドやデコレーターのように異なる層が同じ抽象化を持つ場合、追加のインフラに対して十分なメリットを提供できていない可能性が高い
パススルー引数もメソッドに変数の存在を意識させる（複雑さを追加する）一方で機能は追加しない

8 Pull Complexity Downwards

基本原則: 複雑さを下方に引き込む

モジュール開発時に避けられない複雑さが生じた場合、ユーザーに処理させるよりモジュール内部で処理すべき
モジュールの利用者数は開発者数を上回るため、開発者がより多くの負担を負うべき
シンプルな実装よりシンプルなインターフェースを持つことが重要
逆の方向（例外を投げてユーザーに処理させる、設定パラメータで判断を委ねる）は複雑さを増幅させる

例1: テキストエディタのテキストクラス

行指向インターフェース:
- 実装はシンプルだが、上位ソフトウェアに複雑さを押し付ける
- ユーザーインターフェース操作（文字挿入、選択の削除）に対応するため行の分割・結合が上位コードで必要となる
文字指向インターフェース:
- テキストクラス内部で行の分割・結合を行い、上位ソフトウェアをシンプルに保つ
- 複雑さをクラス内部にカプセル化し、システム全体の複雑さを低減する

例2: 設定パラメータ

設定パラメータは複雑さを上方に移動させる手法
賛成意見:
- ユーザーが自分の要件に合わせてシステムを調整できる
- 低レベルのコードがドメイン知識を持たない場合に有効
問題点:
- ユーザー・管理者が適切な値を判断できないケースが多い
- 適切な値をシステムが自動的に算出できる場合でも判断を外部に委ねてしまう
- 例: ネットワークプロトコルのリトライ間隔は、成功したリクエストの応答時間から自動計算が可能
設定パラメータを避けるべき理由:
- ユーザーが開発者より優れた値を決定できるか問い直すべき
- 合理的なデフォルト値を自動算出し、例外的な状況のみ設定を求める形が理想
- 設定パラメータは不完全な解決策であり、システムの複雑さを増加させる

過剰適用への注意

全機能を1つのクラスに集約するような極端な適用は不適切
複雑さを下方に引き込む条件:
- (a) 引き込む複雑さがクラスの既存機能と密接に関連している
- (b) 引き込みによって他の多くの箇所がシンプルになる
- (c) クラスのインターフェースがシンプルになる
反例: テキストクラスにバックスペースキーの機能を追加した場合
- 上位コードをあまりシンプルにせず、ユーザーインターフェースの知識をテキストクラスの核心機能と無関係に持ち込む結果となる
- 情報漏洩を招くだけで複雑さの削減にはつながらない

結論

モジュール開発者は、ユーザーの負担を減らすために、自ら追加の負担を引き受ける機会を探すべき

9 Better Together Or Better Apart?

基本的な問い: まとめるか分けるか

ソフトウェア設計における根本的な問いは、2つの機能を同じ場所にまとめるか、分けて実装するかという問題
関数、メソッド、クラス、サービスなど全ての設計レベルで適用される
目標はシステム全体の複雑さを削減し、モジュール性を向上させること

分割のコスト

コンポーネントの数自体が複雑さをもたらす
- 管理するコンポーネントが増えるほど追跡が困難になる
- 分割によりインターフェースが増加し、それぞれが複雑さを追加する
分割によってコンポーネントを管理するための追加コードが必要になる場合がある
分割はコンポーネント間の距離を生む
- 依存関係がある場合、開発者は両者を行き来しなければならない
- 依存関係に気づかないとバグを引き起こす可能性がある
分割は重複を生む可能性がある

コードをまとめるべき判断基準

情報を共有している場合: どちらも特定のドキュメント形式の構文に依存するなど
一緒に使用される場合（双方向の関係がある場合）: 一方を使う人は他方も使う
- 一方向の関係では強い根拠にならない（例: ディスクブロックキャッシュとハッシュテーブルは分離すべき）
概念的に重複する場合: 両方を包含する単純な上位カテゴリが存在する
一方を理解するのに他方を見ることが必要な場合

まとめるべき具体的なケース

情報が共有される場合:
- HTTPサーバーでリクエストの読み込みとパースを別々のメソッドに分けた実装では、読み込みメソッドがリクエストの終端を識別するためにパース処理を必要とした
- 同じ情報を共有するため、一箇所でまとめてread・parseすることで、コードが短くシンプルになる
インターフェースが簡略化される場合:
- 複数モジュールを結合することで、よりシンプルなインターフェースを定義できる
- 例: Java I/OライブラリでFileInputStreamとBufferedInputStreamを統合すれば、大多数のユーザーがバッファリングを意識する必要がなくなる
重複を排除できる場合:
- 繰り返されるコードパターンを別メソッドとして切り出してリファクタリングする
- 有効な条件: 繰り返しコードが長く、置き換えメソッドのシグネチャがシンプルな場合
- コードが多くのローカル変数にアクセスするなど環境と複雑な関係を持つ場合は、置き換えメソッドのシグネチャが複雑になりうる
- エラー処理における重複: エラー返却前に同じクリーンアップ処理が必要な場合はgoto文で単一化する手法も有効

汎用コードと専用コードの分離

複数の目的に使える機構を持つモジュールはその汎用機構のみを提供すべき
特定用途に特化したコードは、その用途に関連する別モジュールに置くべき
システムの下層は汎用的、上層は専用的な傾向がある
特化コードを上層に引き上げることで、下層を汎用的に保つ
赤旗（Special-General Mixture）: 汎用機構のコードに特定用途向けコードが混在している場合、機構が複雑化し情報漏洩が起きる

例1: 挿入カーソルと選択範囲

GUIエディタで挿入カーソルと選択範囲を1つのオブジェクトで管理した実装の問題点:
- 上位コードは依然として選択とカーソルを別々のエンティティとして扱う必要がある
- カーソル位置を取得するためにブール値をテストする必要があり、実装が複雑
改善策: 選択とカーソルを分離し、Positionクラスを新設
- 選択は2つのPositionで、カーソルは1つのPositionで表現
- インターフェースと実装の両方がシンプルになった

例2: ログ記録用の別クラス化（分離が不適切な例）

エラーが検出された時点でロギングを行わず、専用クラスに委譲した設計の問題点:
- ロギングメソッドが浅い（本体は1行程度）にも関わらず、多くのドキュメントが必要
- 各メソッドは1箇所からのみ呼ばれる
- 呼び出し元とロギングメソッドを行き来しなければ理解できない
改善策: ロギングメソッドを廃止し、エラー検出箇所に直接ログ出力を記述する

例3: エディタのUndo機構（汎用部分の分離）

テキストクラスにUndo機構全体を実装した設計の問題点:
- 汎用的なUndo管理コアと、特定操作（テキスト、選択、カーソル）のUndo処理が混在
- テキストクラスとUIコードの間で情報漏洩が発生
- 新しいUndo対象を追加するたびにテキストクラスへの変更が必要
改善策: 汎用的なUndo機構をHistoryクラスとして独立させる
- Historyクラス: アクションの管理・グルーピングとUndo/Redo操作を担当
- 個別のActionクラス: 特定操作（テキスト挿入、選択変更など）のUndo/Redoを実装
- 上位UIコード: アクションのグルーピングポリシーを担当
- 3つのカテゴリは互いを理解せずに実装できる

メソッドの分割と統合

メソッドの長さだけは分割の根拠にならない
- 長いメソッドが必ずしも悪いわけではない（シンプルなシグネチャと読みやすさがあれば問題なし）
- 分割するとインターフェースが増え、複雑さが増す
メソッドの設計目標: 明確でシンプルな抽象化を提供すること
- 各メソッドは一つのことを完全に行うべき
- インターフェースは実装よりはるかにシンプルであるべき（深いメソッド）
メソッドを分割すべき2つの形:
- サブタスクを別メソッドとして抽出: 親メソッドが子メソッドを呼び出す形。子メソッドは汎用的で他のコンテキストでも使用可能
- 独立した2つのメソッドに分割: 元メソッドが複数の無関連な処理を持つ場合。各メソッドのインターフェースが元より簡単になるべきで、大半の呼び出し元がどちらか一方のみを使う構成が理想
赤旗（Conjoined Methods）: 一方を理解するために他方の実装も見る必要がある場合は、分割が不適切
メソッドをまとめるべき場合:
- 浅いメソッドを深いメソッドに置き換えられる
- コードの重複を排除できる
- 中間データ構造や依存関係を排除できる
- より良いカプセル化やシンプルなインターフェースが実現できる

結論

モジュールの分割・統合の判断は複雑さに基づくべき
情報隠蔽が最も優れ、依存関係が最小で、インターフェースが最も深い構造を選択する

10 Define Errors Out Of Existence

例外処理が生む複雑性

例外とは、プログラムの通常の制御フローを変えるあらゆる非通常条件を指す
例外処理コードは通常ケースのコードより本質的に難しい
例外発生時の対処法は2つある:
- 例外にもかかわらず処理を継続する（例: パケット再送）
- 処理を中止してエラーを上位に報告する（システム状態の不整合への対処が必要）
例外処理コードはさらなる例外を生む可能性がある
言語の例外サポートは冗長で可読性が低い（Javaのtry-catch構文が典型例）
例外処理コードはテストが困難でバグが潜伏しやすい
- 分散システムにおける重大障害の90%以上が不正なエラー処理に起因するという研究結果がある

過剰な例外定義の問題

「より多くのエラーを検出する方が良い」という考えが過剰防衛的なスタイルを生む
不要な例外の増加はシステムの複雑性を高める
例外はクラスのインターフェースの一部であり、例外が多いクラスのインターフェースは複雑になる
例外はスタックを複数レベルさかのぼって伝播するため、直接の呼び出し元だけでなく上位の呼び出し元にも影響する
例外をスローするのは容易だが、処理するのは難しく、複雑性は例外処理コードに集中する

例外を定義によって排除する手法

APIの定義を変更することで、例外を処理する必要をなくす（「定義による排除」）
Tclのunsetコマンドの例:
- 元の定義: 「変数を削除する」 → 変数が存在しない場合に例外をスロー
- 改善された定義: 「変数が存在しないことを保証する」 → 変数が存在しなくても正常終了
Windowsとunixにおけるファイル削除の比較:
- Windows: 開かれているファイルを削除できず、エラーが発生する
- Unix: 削除マークを付けて即時成功を返し、全プロセスがファイルを閉じた後に実際に削除する
Javaのsubstringメソッドの例:
- 現状: 範囲外インデックスでIndexOutOfBoundsExceptionをスロー
- 改善案: 範囲外インデックスを自動調整し、重複する文字のみを返す（Pythonのリストスライスがこの方式を採用）
エラーを定義で排除することでAPIがシンプルになり、バグも減少する

例外マスキング

低レベルで例外を検出・処理し、上位レベルのコードには通知しない手法
分散システムで特に有効:
- TCPはパケットロスを検出・再送し、クライアントから隠蔽する
- NFSはサーバーダウン時にアプリケーションをハングさせ、エラーを上位に伝播させない
例外マスキングによりクラスのインターフェースが簡略化され、「深い」クラスになる
複雑性を下位レベルに引き下げることの一例

例外の集約

多数の例外を単一のコードで処理する手法
Webサーバーにおける欠損パラメータ処理の例:
- 個別のサービスメソッドで各例外をキャッチする代わりに、例外を上位のディスパッチャーまで伝播させる
- トップレベルのハンドラーが全例外を処理し、適切なエラーレスポンスを生成する
- カプセル化と情報隠蔽の観点から優れた設計パターン
RAMCloudにおけるクラッシュリカバリの例:
- 個別エラー（オブジェクト破損など）をより大きなエラー（サーバークラッシュ）に昇格させる
- 単一のクラッシュリカバリ機構で複数種類のエラーをまとめて処理する
- リカバリ機構の頻繁な実行によりバグの早期発見も促進される
例外集約と例外マスキングの違い:
- 集約: 例外をスタックの上位まで伝播させてから処理する
- マスキング: 低レベルメソッドで例外を処理する
例外集約は複数の特殊目的メカニズムを単一の汎用メカニズムに置き換える

クラッシュ戦略

処理が困難でまれにしか発生しないエラーに対しては、アプリケーションをクラッシュさせる
メモリ不足エラーの例:
- mallocがNULLを返すたびに確認するのはコードを複雑にする
- ckalloc ラッパー関数を使い、メモリ不足時にエラーメッセージを出力して終了させる
- C++/JavaのnewがスローするOut of Memory例外もキャッチする意味はほとんどない
I/Oエラー、ネットワークソケットエラー、内部的な不整合もクラッシュが適切な場合が多い
アプリケーションの性質によってクラッシュの適否は異なる:
- レプリケーションストレージシステムではI/Oエラーをリカバリする必要がある

特殊ケースの設計による排除

エラーと同様に、特殊ケースも設計によって排除すべき
特殊ケースを多用するコードはif文が増え、理解しにくくバグが生まれやすい
テキストエディタにおける選択範囲の例:
- 「選択なし」状態を別途管理すると多くの特殊ケースチェックが必要になる
- 選択は常に存在するが、場合によっては空（開始位置と終了位置が同じ）とすることで特殊ケースがなくなる
- 空の選択に対するコピーや削除操作も特殊ケースチェックなしで実装できる
「選択なし」というユーザー視点の概念を、実装の内部表現に直接反映する必要はない

限界と結論

例外情報がモジュール外部で不要な場合にのみ、例外の排除やマスキングが有効
過剰な適用は危険:
- ネットワーク通信モジュールで全例外をマスクした場合、アプリケーションがメッセージロスやサーバー障害を検知できなくなる
重要な例外は公開する必要があり、重要でないものは積極的に隠蔽する
複雑性削減のための推奨戦略:
- セマンティクスの再定義によるエラー条件の排除（最善策）
- 低レベルでの例外マスキング
- 複数の特殊ケースハンドラーを単一の汎用ハンドラーへ集約

Chapter 11 Design it Twice

基本原則

ソフトウェア設計は困難であり、最初のアイデアが最良の設計になることは稀
主要な設計上の意思決定において、複数の選択肢を検討することで、より優れた結果が得られる
このアプローチを「Design it Twice（2度設計する）」と呼ぶ

設計代替案の検討プロセス

テキストエディタのファイル管理クラスを例として、以下の3つの代替インターフェース設計を提示:
- 行指向インターフェース: 行単位での挿入・変更・削除操作
- 文字指向インターフェース: 個々の文字単位での挿入・削除操作
- 文字列/範囲指向インターフェース: 行境界をまたぐ任意の文字範囲を対象とした操作
各代替案のすべての機能を詳細に定義する必要はなく、主要なメソッドの概要を把握するだけで十分
互いに大きく異なるアプローチを選ぶことで、より多くの学びが得られる
1つの合理的なアプローチしかないと確信している場合でも、第2の設計を検討する

代替案の評価基準

上位ソフトウェアにとっての使いやすさ:
- 行指向インターフェース: 部分行や複数行操作（コピー&ペーストなど）の際に、上位ソフトウェアが行の分割・結合を行う必要がある
- 文字指向インターフェース: 複数文字を変更する操作にループ処理が必要となる
- 文字指向のアプローチは、各文字ごとにテキストモジュールへの呼び出しが発生するため、他の方式より著しく低速になる可能性が高い
インターフェースのシンプルさ: 代替案間でインターフェースの単純さを比較
汎用性: より汎用的なインターフェースかどうかを評価
実装効率: より効率的な実装を可能にするかどうかを評価

設計の統合と改善

比較後、最良の設計を選定できる立場に置かれる
最良の選択肢は既存の代替案の1つである場合も、複数の代替案の特徴を組み合わせた新設計となる場合もある
既存の代替案に魅力的なものがない場合は、特定した問題点を活かして新たな設計を考案する
テキストクラスの例では、行指向・文字指向の両方式が上位ソフトウェアに余分なテキスト操作を要求するという「赤信号」から、範囲指向APIという解決策が導出される

多層的な適用

インターフェース設計: 最初にインターフェースの選定に適用
実装設計: 実装段階（リンクリスト、固定サイズブロック、ギャップバッファなど）にも適用可能
- 実装における最重要事項はシンプルさとパフォーマンス
上位レベルの設計: UIの機能選定やシステムのモジュール分解などにも適用

時間的コスト

代替案の検討に過度な時間は必要とせず、小規模なクラスであれば1〜2時間程度で済む
この時間投資は、クラスの実装に費やす数日〜数週間と比較して小さい
設計実験により大幅に改善された設計が生まれ、かけた時間以上の効果が得られる
大規模モジュールでは設計探索により多くの時間がかかるが、実装も長くなり、より良い設計による恩恵も大きくなる

優秀な人材とこの原則の関係

優秀な人材がこの原則を取り入れることを難しいと感じる傾向がある:
- 幼少期から最初のアイデアで十分な結果を出せることを学習し、悪い作業習慣が身につきやすい
- 「優秀な人間は最初から正解を出せる」という誤った信念が複数の設計検討を妨げる
より困難な問題に直面した際、最初のアイデアだけでは不十分となる
大規模ソフトウェアシステムの設計は、最初の試みで完璧に仕上げられるほど簡単ではない
最初のアイデアをすぐに実装することは、真の潜在能力を発揮できない原因となる
問題が本質的に困難であることを認識し、慎重に思考することが重要

設計スキルへの効果

設計を2度行うことは、設計の質だけでなく設計スキルそのものも向上させる
複数のアプローチを考案・比較するプロセスを通じて、設計を良くする・悪くする要因を学べる
長期的には、悪い設計を排除し、優れた設計を見極める能力が向上する

12 Why Write Comments? The Four Excuses

コメントの重要性

コードへのコメントはソフトウェア設計において重要な役割を担う
コメントは開発者がシステムを理解し効率的に作業するための手段となる
コメントは抽象化を実現するための不可欠な要素であり、複雑性を隠蔽するために必要
コメントを書く行為そのものがシステム設計の改善につながる
多くの開発者はコメントを不要と考えるか、価値を認めながらも書かない傾向がある

開発者がコメントを避ける4つの言い訳

「良いコードは自己文書化されている」
「コメントを書く時間がない」
「コメントは古くなり誤解を招く」
「これまで見てきたコメントはすべて無価値だった」

言い訳1: 良いコードは自己文書化されている

コードだけでは表現できない設計情報が多数存在する
- インターフェースの非公式な側面（各メソッドの高レベルな説明や戻り値の意味）はコメントでしか記述できない
- 特定の設計上の決定の根拠や、特定のメソッドを呼び出す適切な条件もコードでは表現不可能
メソッドの実装を読むことで抽象インターフェースを推測することは可能だが、時間がかかり負担が大きい
コードを読むことを前提にすると、メソッドを短く保つために多数の浅いメソッドに分割することになり、結果として全体の理解が困難になる
コメントは抽象化の根幹をなす
- コメントなしでは、メソッドの抽象化は宣言（名前と引数・戻り値の型）のみとなり、有用な抽象化を提供するには情報が不足する
- コメントがあることで、呼び出し元が必要とする追加情報を記録し、実装の詳細を隠蔽しながら簡略化された視点を提供できる
コメントは人間の言語で書かれるため、コードより精度は低いが、表現力が高く直感的な説明が可能

言い訳2: コメントを書く時間がない

時間的制約のある開発では、コメントは常に他のタスクより優先度を下げられる傾向がある
投資的思考として、長期的に効率よく作業するためには、初期段階で追加時間を費やして構造を整える必要がある
コメントを書くことで追加される開発時間はおよそ10%程度であり、それによるメンテナンス性向上の恩恵はすぐにコストを上回る
抽象化に関するコメント（クラスやメソッドの最上位ドキュメント）は、設計プロセスの一部として書かれるべきであり、設計品質を直接向上させるため即座にコストを回収できる

言い訳3: コメントは古くなり誤解を招く

コメントが古くなることはあるが、実際には大きな問題にはならない
ドキュメントを最新に保つために必要な労力は大きくない
- 大規模なドキュメント変更が必要なのはコードに大規模な変更があった場合のみであり、その際もコード変更のほうが時間がかかる
ドキュメントの重複を避け、対応するコードの近くに配置することで更新を容易にできる
コードレビューはコメントの陳腐化を検出・修正するための有効な手段となる

言い訳4: 見てきたコメントはすべて無価値だった

この言い訳は4つの中で最も根拠があり、有用な情報を提供しないコメントは多数存在する
既存のドキュメントの多くは質が低いが、これは解決可能な問題である
良いドキュメントの書き方を習得すれば、良質なコメントを書くことは難しくない

良いコメントがもたらす恩恵

コメントの本質的な目的は、設計者の頭の中にあったがコードで表現できなかった情報を記録することにある
- ハードウェアの特性など低レベルの詳細から、クラスの設計根拠といった高レベルの概念まで多岐にわたる
後に変更を加える開発者が、より迅速かつ正確に作業できるようになる
ドキュメントなしでは、後続の開発者が元の知識を再導出または推測する必要があり、時間の損失やバグのリスクが生じる
ソフトウェアの複雑性の発現形態への対応:
- 認知的負荷の軽減: 変更に必要な情報を提供し、無関係な情報を無視できるようにする
- 未知の未知の軽減: システムの構造を明確にし、変更に関連する情報やコードを特定しやすくする
複雑性の主要な原因である依存関係と不明瞭さに対して、コメントは依存関係を明確にし、不明瞭さを解消する役割を担う

13 Comments Should Describe Things that Aren't Obvious from the Code

コメントの基本原則

プログラミング言語のステートメントは開発者の意図を完全には表現できないため、コメントはその補完として機能する
コメントの指針: コードから自明でない情報を記述すること
抽象化の概念を説明するためにコメントは不可欠であり、コードだけでは抽象化は見えづらい
コードから推測可能な情報であっても、モジュールのユーザーにコードを読ませることは時間的コストが高いため、コメントによる補完が重要

コメントの種類と慣習

コメントのカテゴリ:
- インターフェースコメント: クラス、データ構造、関数、メソッドの宣言直前に置かれるコメントブロック
- データ構造メンバーコメント: クラスの変数などフィールド宣言の隣に置かれるコメント
- 実装コメント: メソッドや関数のコード内部に置かれ、内部の動作を説明するコメント
- クロスモジュールコメント: モジュール境界をまたぐ依存関係を説明するコメント
慣習を定めることの目的:
- 一貫性の確保によりコメントの読解・理解が容易になる
- コメントを実際に書く習慣の形成を促す
JavaのJavadoc、C++のDoxygen、Goのgodocなどのツールがあればそれに従うこと

コードの繰り返しを避ける

最も多いコメントの失敗は、コードの隣から容易に推測できる情報しか含まないコードの繰り返し
判断基準: コードを見たことがない人がコメントだけを見て同じコメントを書けるなら、そのコメントに価値はない
同様の失敗として、メソッド名や変数名と同じ単語をコメントに使うことが挙げられる
コメントには名前に含まれない追加情報（単位、制約、意味の詳細説明）を含めるべき
悪い例: textHorizontalPadding に対して「各行のテキストの水平パディング」と書くだけでは不十分
良い例: 「各テキスト行の左右両側に設ける空白スペースの量（ピクセル単位）」と具体的に説明する

低レベルコメントによる精度の向上

低レベルコメントはコードより詳細な情報を提供し、特に変数宣言に有効
変数コメントで明確にすべき情報:
- 変数の単位
- 境界条件が包含的か排他的か
- null値が許可される場合の意味
- リソースの解放責任
- 常に成立する不変条件（例: 「このリストは常に少なくとも1つのエントリを含む」）
変数コメントの改善例:
- 悪い例: 「respBuffer内の現在のオフセット」
- 良い例: 「クライアントに返されていない最初のオブジェクトの、このバッファ内の位置」
変数を文書化する際は「動詞（どう操作されるか）」でなく「名詞（何を表すか）」で考える

高レベルコメントによる直感の強化

高レベルコメントはコードより抽象的な情報を提供し、コードの全体的な意図と構造を理解させる
詳細を省略し、「このコードが何をしようとしているか」を説明する
高レベルコメントを書く際の問い:
- 「このコードは何をしようとしているか？」
- 「すべてを説明できる最もシンプルな表現は何か？」
- 「このコードで最も重要なことは何か？」
「どこからここに到達するか」という形式（実行条件の説明）も読者の理解を助けるために有効
高レベルコメントは低レベルコメントより書くのが難しいが、コードを抽象的に捉え直す訓練になる

インターフェースドキュメント

インターフェースコメントと実装コメントは明確に分離すること:
- インターフェースコメント: クラスやメソッドの使い方に関する情報（抽象化の定義）
- 実装コメント: クラスやメソッドが内部でどのように動作するかの情報
インターフェースコメントが実装の詳細も説明しなければならない場合、それはクラスやメソッドが浅い（shallow）ことを意味する
メソッドのインターフェースコメントに含めるべき要素:
- メソッドの動作の高レベルな説明
- 各引数と戻り値の説明（制約や引数間の依存関係も含む）
- 副作用の説明
- 発生し得る例外の説明
- 呼び出し前に満たすべき前提条件
悪いインターフェースコメントの特徴（IndexLookupクラスの初期バージョンを例として）:
- RPCの名前など実装の詳細が含まれている
- ユーザーに不要なプライベートな設定パラメーターが記述されている
- ヘッダーのインクルード方法など明らかな情報が含まれている
改善後のコメントは実装の詳細を排除し、利用方法に必要な情報のみを提供する

実装コメント

実装コメントの主目的: 「どのように実装するか（how）」でなく「何をしているか（what）」と「なぜか（why）」を説明する
短くシンプルなメソッドは通常、実装コメントを必要としない
コメントが必要な場面:
- 長いメソッドの主要なコードブロックの前（高レベルな説明）
- ループの前（各反復で何が起きるかの説明）
- 目的が明白でないバグ修正コードの理由の説明
バグ修正の場合、バグトラッキングデータベースの課題番号への参照でも代替できる
ローカル変数のコメントは、変数が広い範囲で使用される場合のみ必要（短い範囲では不要）

クロスモジュール設計の決定事項

現実のシステムでは、複数のクラスにまたがる設計上の決定が避けられない
クロスモジュールドキュメントの課題: 開発者が自然に見つけられる適切な配置場所の発見
対処法の例:
- 明白な中央配置箇所の活用: Statusのenum宣言内に、新しい値を追加する際に変更が必要な全箇所を記載する
- designNotesという中央ファイルへの集約:
  - ファイルを主要トピックごとにラベル付きセクションに分割
  - 関連するコードにはdesignNotesファイルへの短い参照コメントを記載
designNotesアプローチの欠点: ドキュメントが依存するコードから離れているため、システムの進化に伴う更新が難しくなる

結論

コメントの目的: システムの構造と動作が読者に明白であり、必要な情報を素早く見つけ、自信を持って修正できるようにすること
「自明」かどうかはコードを初めて読む人の視点から判断する（自分自身の視点ではない）
コードレビュアーがわかりにくいと指摘した場合は議論せず、コメントやコードの改善で対応する

14 Choosing Names

命名の重要性

変数、メソッド、エンティティへの命名はソフトウェア設計において過小評価されている側面
良い名前はドキュメントの一形態であり、コードを理解しやすくし、他のドキュメントの必要性を低減し、エラーの検出を容易にする
不適切な名前はコードの複雑さを増し、バグを引き起こす曖昧さや誤解を生む
複雑さは累積的であり、システム全体で数千の変数に対して良い名前を選ぶことがシステム全体の管理性に大きく影響する

不適切な命名がバグを引き起こした事例

Sprite分散OSにおいて、blockという変数名が2つの異なる目的（物理ブロック番号とファイル内の論理ブロック番号）に使用された
この曖昧な命名が原因で、論理ブロック番号が物理ブロック番号として誤使用され、ディスク上の無関係なブロックがゼロで上書きされるバグが発生した
バグの特定に6ヶ月を要し、複数の開発者がコードを読んでも問題を見落とした
fileBlockとdiskBlockのように用途を区別した名前を使用していれば、このエラーは発生しなかった可能性が高い
多くの開発者は名前に十分な時間を費やさず、"reasonably close"な最初の名前を使用しがちであるが、精確で曖昧さのない直感的な名前を選ぶべき

良い名前の条件: イメージを生み出すこと

名前の目標は、名前が付けられた対象の性質について読み手の心にイメージを生み出すこと
良い名前はその実体が何であるか、そして何でないかについて多くの情報を伝える
名前は抽象化の一形態であり、より複雑な実体についての簡略化された思考方法を提供する
最善の名前は最も重要な側面に注目させ、重要でない詳細を省略する
1つの名前に含められる情報には限界があり、2〜3語を超えると扱いにくくなる

名前の精確性

良い名前は精確性と一貫性の2つの特性を持つ
名前の最も一般的な問題は過度に汎用的または曖昧すぎること
精確性が不足する命名の具体例:
- getCount()よりもgetActiveIndexlets()やnumIndexlets()の方が何をカウントするかが明確
- x・yよりもcharIndex・lineIndexの方が文字の位置を明確に表す
- blinkStatusよりもcursorVisibleの方がboolean値の意味を明確に伝える（boolean変数名は常に述語であるべき）
- VOTED_FOR_SENTINEL_VALUEよりもNOT_YET_VOTEDの方が特別な意味を明示する
- 戻り値のないメソッドで使用されるresultは戻り値であるという誤解を生む可能性がある
精確性ルールの例外:
- ループ変数のように使用範囲が限定されている場合はiやjのような汎用名が許容される
- スコープが小さく全体を一目で確認できる変数は長い名前が不要
名前が過度に具体的すぎることも問題（例: delete(Range selection)のselectionは選択状態でないテキストにも使用可能なためrangeの方が適切）
RedFlag: 適切な名前が見つからない場合は変数の設計自体に明確な定義や目的が欠けている可能性を示す

一貫した命名

一貫性は認知負荷を下げ、読み手が異なる文脈でも名前の意味を即座に理解できるようにする
一貫性の3つの要件:
- 特定の目的には常に共通の名前を使用する
- 共通の名前を他の目的には使用しない
- 目的は十分に狭く定義し、同じ名前の変数が同一の振る舞いを持つようにする
章冒頭のバグはこの3番目の要件に違反した結果であり、blockが2種類の異なる振る舞いに使用された
同種のものを指す複数の変数が必要な場合は、共通名に区別するプレフィックスを加える（例: srcFileBlockとdstFileBlock）
ループ変数ではiを最外ループに、jをネストされたループに使用する慣習が読み手に安全な仮定を可能にする

Go言語スタイルガイドとの見解の相違

Go言語の開発者の一部（Andrew Gerrand）は短い名前（多くは1文字）を推奨し、「長い名前はコードが何をするかを不明瞭にする」と主張する
著者はこの見解に同意せず、より長い名前の方が変数の振る舞いについて若干明確な手がかりを提供すると主張する
Go文化では同じ短い名前を複数の異なるものに使用することを奨励しており（例: chはcharacterまたはchannel、dはdata、difference、distanceなど）、これは混乱やエラーを招く可能性がある
著者がGerrandの主張に同意する点: 「名前の宣言と使用の距離が大きいほど、名前は長くすべき」
読みやすさは書き手ではなく読み手によって判断されるべきであり、フィードバックに基づいて名前の長さを調整することが推奨される

結論

良い名前はコードをより明白にし、初見で変数の振る舞いを正確に推測できるようにする
良い名前の選択は第3章で述べた「投資マインド」の例であり、事前に少し余分な時間を使うことで将来の作業が容易になりバグの発生が抑制される
命名スキルの向上自体も投資であり、最初は時間と手間がかかるが経験を積むにつれて容易になり、最終的にはほぼ追加コストなく良い名前を選べるようになる

15 Write The Comments First

概要

コメントはコーディング完了後ではなく、開発プロセスの最初に記述すべきである
コメントを先に書くことで、ドキュメントが設計プロセスの一部となる
この手法は、より良いドキュメント、より良い設計、そして作業の楽しさをもたらす

コメントを後回しにすることの問題点

多くの開発者がコメントの記述を先送りにする理由:
- コードが変更中であるため、早期のコメント記述は後で書き直しが必要になると考える
- ドキュメント作業を退屈な作業と見なし、できる限り先延ばしにする
先送りによる否定的な結果:
- コードが安定するまで待つという理由で、結局コメントが全く書かれないことが多い
- 後から書く際には精神的にそのコードから離れており、最低限の内容しか記述しない
- 設計時の記憶が薄れているため、コメントがコードを繰り返すだけの内容になる
- 最も重要な設計上の判断が記述されず、コメントが不完全になる

コメントを先に書くアプローチ

具体的な手順:
- 新しいクラスを作成する際、まずクラスのインターフェースコメントを書く
- 重要なパブリックメソッドのインターフェースコメントとシグネチャを書き、メソッド本体は空のままにする
- これらのコメントを基本構造が適切と感じられるまで繰り返し修正する
- クラスの重要なインスタンス変数の宣言とコメントを書く
- メソッド本体を記述し、必要に応じて実装コメントを追加する
- 新しいメソッドやインスタンス変数が必要になった場合は、本体より先にインターフェースコメントを書く
このアプローチにより、コードが完成した時点でコメントも完成しており、未記述のコメントが残らない

コメントが設計ツールとなる理由

コメントは抽象概念を完全に表現する唯一の手段であり、良い抽象概念は良い設計の基盤となる
最初にコメントを書くことで、実装コードを書く前に抽象概念をレビューし調整できる
良いコメントを書くには変数やコードの本質を特定する必要があり、これは設計の早期段階で行うべきである
コメントは複雑さの指標として機能する:
- メソッドや変数が長いコメントを必要とする場合、良い抽象概念が欠如していることを示す危険信号である
- 短くシンプルなインターフェースコメントは、シンプルなインターフェースを示す
- 複雑で長いコメントが必要な場合、そのメソッドは複雑なインターフェースを持つ
- インターフェースコメントが実装の主要な機能をすべて説明しなければならない場合、そのメソッドは浅い
変数についても同様で、長いコメントが必要な変数は変数の分解が適切でない可能性を示す
コメントを書く行為が設計上の問題を早期に発見・修正することを可能にする
コメントが完全かつ明確でなければ、複雑さの良い指標にはならない点に注意が必要である

早期コメント記述の楽しさ

新しいクラスの早期設計フェーズは、抽象概念と構造を具体化する最も楽しい作業の一つである
コメントは設計上の判断の質を記録し、検証する手段となる
最も少ない言葉で完全かつ明確に表現できる設計を目指すことが重要である
シンプルなコメントは良い設計の証明であり、達成感の源となる
戦略的プログラミング（単なる動作するコードではなく優れた設計を目指す）において、コメント記述は最良の設計を特定する手段として楽しめる

早期コメント記述のコスト

コメント後回しの主な論拠は、コードの変化に伴うコメント修正のコストを避けられるという点である
しかし概算すると、この論拠は成立しない:
- コードとコメントの入力に費やす時間は開発時間全体の10%以下と推定される
- コメントがコード行の半数を占めるとしても、コメント記述は開発時間全体の約5%程度である
- 後回しにすることで節約できるのはこの小さな割合のさらに一部に過ぎない
コメントを先に書くことで抽象概念がコーディング前に安定し、コーディング時間の節約につながる
コードを先に書く場合は抽象概念がコーディング中に変化しやすく、コード修正が増える
すべての要素を考慮すると、コメントを先に書く方が全体的に速い可能性がある

結論

コメントを先に書くことを試みることを推奨する
慣れるまで十分な期間継続することが重要である
試行後は、コメントの質、設計の質、ソフトウェア開発全体の楽しさへの影響を評価すべきである

16 Modifying Existing Code

既存コード修正の前提

ソフトウェア開発は反復的かつ漸進的であり、システムは進化の各段階で新機能追加と既存モジュール修正を重ねる
システムの設計は絶えず進化し、当初の構想よりも進化過程での変更によって成熟したシステムの設計が決まる
最初から正しい設計を構想することは不可能である
本章は、システムの進化に伴う複雑性の侵入を防ぐ方法を扱う

戦略的姿勢の維持

戦術的プログラミングと戦略的プログラミングの区別:
- 戦術的プログラミングは複雑性が増しても素早く動作させることを最優先する
- 戦略的プログラミングは優れたシステム設計の産出を最優先する
- 戦術的アプローチは短期間で雑然とした設計を招く
- 「動作する」ことは十分な基準ではなく、設計を優先し戦略的に考える必要がある
- この考えは既存コードの修正時にも適用される
既存コード修正時に陥りがちな思考:
- 開発者はバグ修正や新機能追加の際に戦略的に考えないことが多い
- 典型的な思考は「必要を満たす最小限の変更は何か」である
- 修正対象コードに不慣れで、大きな変更は新たなバグの危険が高いと懸念することが理由となる
- しかしこれは戦術的プログラミングとなり、各々の最小変更が特殊ケースや依存関係などの複雑性を持ち込む
- 結果としてシステム設計は少しずつ悪化し、進化の各段階で問題が蓄積する
戦略的アプローチの理想:
- 各変更の完了時に、最初からその変更を見越して設計した場合と同じ構造をシステムが持つ状態を目指す
- 安直な修正の誘惑に抵抗し、望む変更に照らして現在の設計が依然として最善か検討する
- 最善でなければリファクタリングし、可能な限り最良の設計に到達させる
- このアプローチでは修正のたびに設計が改善する
投資マインドセット:
- リファクタリングと設計改善に少しの時間を投じれば、よりクリーンなシステムが得られ、開発が速まり投じた労力を回収できる
- 変更自体がリファクタリングを要さなくても、コード内にいる間に修正できる設計上の欠陥を探す
- コードを修正する際は常に設計を少しでも改善する方法を探し、改善しなければ悪化させている可能性が高い
商業的現実との衝突:
- 投資マインドセットは商業的ソフトウェア開発の現実と衝突する場合がある
- 正しいリファクタリングに3か月、安直な修正に2時間という状況では、厳しい納期下で安直な手法を取らざるを得ないことがある
- リファクタリングが多くの他者やチームに影響する非互換を生む場合、実行が現実的でないこともある
妥協への対処:
- 妥協は可能な限り抵抗する
- 「現在の制約下でクリーンな設計を作る最善は何か」と自問する
- 3か月のリファクタリングとほぼ同等にクリーンで数日で済む代替手法を検討する
- 今は大規模リファクタリングが無理なら、納期後に取り組む時間を上司に確保してもらう
- すべての開発組織は総労力のわずかな割合を整理とリファクタリングに充てる計画を立てるべきであり、長期的に元が取れる

コメントの維持: コードの近くに置く

コメントが古くなる問題:
- コード変更は既存コメントの一部を無効化する可能性が高い
- 修正時のコメント更新は忘れやすく、不正確なコメントを生む
- 不正確なコメントは読者を苛立たせ、数が多いとすべてのコメントが信頼されなくなる
- 規律といくつかの指針により、大きな労力なしにコメントを最新に保てる
コメントをコードの近くに配置する:
- コメントを説明対象のコードの近くに置けば、コード変更時に開発者が目にする
- コメントがコードから遠いほど適切に更新される可能性が下がる
- メソッドのインターフェースコメントの最適な配置はコードファイル内のメソッド本体の隣である
ヘッダーファイルへの配置の検討:
- CやC++のようにコードとヘッダーが分かれる言語では、宣言の隣の.hファイルに置く代替案がある
- しかしこれはコードから遠く、本体修正時に目に入らず、別ファイルを開いて探す追加作業が生じる
- インターフェースコメントをヘッダーに置けば利用者がコードを見ずに抽象を学べるとの主張がある
- しかし利用者はコードもヘッダーも読むべきでなく、DoxygenやJavadocなどのツールが生成する文書から情報を得るべきである
- 多くのIDEは文書を抽出して提示し、メソッド名の入力時にその文書を表示する
- こうしたツールがあるため、文書はコードを扱う開発者にとって最も便利な場所に置くべきである
実装コメントの配置:
- 実装コメントはメソッド冒頭にまとめず、参照する全コードを含む最も狭いスコープへ押し下げて分散させる
- 3つの主要段階を持つメソッドでは、冒頭に全段階を詳述せず、各段階の最初の行の直前に個別コメントを置く
- 一方でメソッド冒頭に全体戦略を述べるコメントは有用である(3段階を示す例)
- 各段階の詳細はその段階のコードの直前に記す
- 一般にコメントがコードから遠いほど抽象的であるべきで、これがコード変更による無効化の可能性を下げる

コメントはコードに置きコミットログに置かない

コミットメッセージのみに記す誤り:
- 変更の詳細をコミットメッセージに記しコードに記さないのはよくある誤りである
- コミットメッセージはログ走査で閲覧できるが、情報を必要とする開発者がログ走査を思いつくことは稀である
- 走査しても適切なメッセージを見つけるのは面倒である
判断基準:
- コミットメッセージ作成時、開発者が将来その情報を必要とするか自問し、必要ならコードに記す
- 例として、変更を動機づけた微妙な問題を述べるコミットメッセージがある
- コードに記さなければ、後の開発者が変更を取り消してバグを再生させかねない
- コミットメッセージへの併記は構わないが、最重要なのはコードに記すことである
- これは開発者が最も目にしやすい場所に文書を置く原則を示し、コミットログはその場所であることが稀である

コメントの維持: 重複を避ける

重複回避の原則:
- コメントを最新に保つ第二の技法は重複の回避である
- 文書が重複すると、関連する全コピーの発見と更新が困難になる
- 各設計判断はちょうど一度だけ文書化する
- 一つの判断が複数箇所に影響しても各所で繰り返さず、最も明白な単一の場所を探す
- 変数に関わる扱いにくい挙動が複数の使用箇所に影響する場合、変数宣言の隣のコメントに記す
- これは利用コードの理解に困った開発者が確認しやすい自然な場所である
単一の場所がない場合:
- 明白な単一の場所がなければ、13.7節のdesignNotesファイルを作成する
- または利用可能な最善の場所に置き、他の場所には中心の場所を指す短いコメントを添える(「xyzのコメントを参照」)
- 元コメントの移動や削除で参照が陳腐化すれば、指定場所にコメントが見つからず不整合が自明となり、改訂履歴で経緯を調べ参照を更新できる
- 対照的に、重複して一部のコピーが未更新の場合、古い情報を使っている兆候が開発者に示されない
他モジュールでの再文書化の禁止:
- あるモジュールの設計判断を別のモジュールで再文書化しない
- 呼び出し先メソッドの動作を説明するコメントを呼び出しの前に置かない
- 読者は知りたければメソッドのインターフェースコメントを見るべきである
- 優れたツールはメソッド名の選択やホバーでインターフェースコメントを表示し、この情報を自動提供する
- 文書を見つけやすくする一方で、文書の繰り返しによってそれを行わない
外部文書の参照:
- プログラム外に既に文書化された情報は、内部で繰り返さず外部文書を参照する
- HTTPプロトコルを実装するクラスでは、コード内にHTTPを記さずWeb上の情報源のURLを短いコメントで添える
- ユーザーマニュアルに記載済みの機能も同様である
- コマンド群を実装し各コマンドを1メソッドが担うプログラムで、マニュアルがコマンドを説明するなら重複させない
- 各コマンドメソッドのインターフェースコメントに「// Fooコマンドを実装、詳細はユーザーマニュアル参照」のような短い注記を含める
- 読者がコード理解に必要な全文書を容易に見つけられればよく、その全文書を自分で書く必要はない

コメントの維持: 差分を確認する

文書を最新に保つ良策は、改訂管理システムへのコミット前に数分かけて変更全体を走査し、各変更が文書に正しく反映されているか確認することである
このコミット前の走査は、デバッグコードの残置やTODO項目の未対応など他の問題も検出する

高レベルのコメントは維持しやすい

コメントはコードより高レベルで抽象的であるほど維持しやすい
そうしたコメントはコードの詳細を反映しないため、軽微なコード変更の影響を受けず、全体的な挙動の変化のみが影響する
13章で論じたとおり、詳細かつ正確であるべきコメントもある
しかし一般に、最も有用なコメント(コードを単に繰り返さないもの)は最も維持しやすくもある

17 Consistency

一貫性の意義

一貫性はシステムの複雑さを低減し、振る舞いを明白にする強力な手段である
一貫性とは、類似したものを類似した方法で行い、異なるものを異なる方法で行うことを指す
一貫性は認知的な効果を生み、ある場所で学んだ方法を同じ手法を使う他の場所の理解に即座に応用できる
一貫性がない場合、開発者は各状況を個別に学ぶ必要があり、より多くの時間を要する
一貫性は誤りを減らす:
- 一貫性がない場合、実際には異なる二つの状況が同じものに見えることがある
- 開発者は見覚えのあるパターンから誤った前提を導く可能性がある
- 一貫性があれば、見覚えのある状況に基づく前提は安全である
一貫性により開発者はより速く、より少ない誤りで作業できる

一貫性の例

名前:
- 14章で一貫した名前の利用の利点が既に論じられている
コーディングスタイル:
- 開発組織がコンパイラの規則を超えてプログラム構造を制限するスタイルガイドを持つことは一般的である
- 現代のスタイルガイドはインデント、波括弧の配置、宣言の順序、命名、コメント、危険とみなされる言語機能の制限など幅広い問題を扱う
- スタイル指針はコードを読みやすくし、一部の種類の誤りを減らす
インターフェース:
- 複数の実装を持つインターフェースは一貫性の例である
- 一つの実装を理解すれば、提供すべき機能を既に把握しているため他の実装の理解が容易になる
デザインパターン:
- デザインパターンはモデル・ビュー・コントローラのような一般的問題への広く受け入れられた解決策である
- 既存のパターンを利用できれば実装は速く進み、正しく動作する可能性が高く、コードが読者にとって明白になる
- デザインパターンは19.5節で詳述される
不変条件:
- 不変条件は変数や構造が常に真である性質である
- 例として、テキスト行を格納するデータ構造が各行を改行文字で終端する不変条件を強制することが挙げられる
- 不変条件は考慮すべき特殊ケースの数を減らし、コードの振る舞いの推論を容易にする

一貫性の確保

一貫性は維持が難しく、特に多数の人が長期間にわたり関わる場合に困難である:
- あるグループの人が別のグループで確立された慣習を知らないことがある
- 新参者は規則を知らず、意図せず慣習を破り、既存のものと矛盾する新しい慣習を作る
文書化:
- コーディングスタイル指針など最も重要な全体的慣習を列挙した文書を作成する
- プロジェクトWikiの目立つ場所など、開発者が見つけやすい場所に文書を置く
- 新規参加者には文書を読むよう促し、既存の人には時折見直すよう促す
- Web上に公開された各組織のスタイルガイドの一つから始めることを検討する
- 不変条件などより局所的な慣習は、コード内の適切な場所に文書化する
- 慣習を書き留めなければ、他者がそれに従う可能性は低い
強制:
- 良い文書があっても、開発者が全ての慣習を記憶するのは難しい
- 最良の強制方法は違反を検査するツールを書き、検査を通過しない限りリポジトリにコミットできないようにすることである
- 自動検査は低レベルの構文的慣習に特に有効である
- 行終端文字の問題の事例:
  - Unixは改行で行を終端し、Windowsは復帰と改行で終端する
  - 一方のシステムで編集されたファイルを他方で小さく編集すると、エディタが全行終端子を置換することがあった
  - これにより全行が変更されたように見え、意味のある変更の追跡が困難になった
  - ファイルは改行のみを含むという慣習を確立したが、全ての開発者の全てのツールが従うよう徹底するのは難しかった
  - 新しい開発者が加わるたびに行終端問題が多発した
  - コミット前に自動実行される短いスクリプトを書くことで解決した
  - スクリプトは変更ファイルを検査し、復帰を含む場合コミットを中止する
  - スクリプトは手動でも実行でき、復帰と改行の組を改行に置換して破損ファイルを修復できる
  - これにより問題が即座に解消し、新しい開発者の訓練にも役立った
- コードレビューは慣習を強制し、新しい開発者を教育する別の機会を提供する
- レビュアーが細部に厳しいほど、チーム全員が慣習を速く学び、コードはより綺麗になる
郷に入っては郷に従う:
- 最も重要な慣習は、全開発者が「郷に入っては郷に従う」という古い格言に従うことである
- 新しいファイルで作業する際は、既存コードの構造を観察する
- 公開変数とメソッドが非公開のものより前に宣言されているか、メソッドがアルファベット順か、変数がキャメルケースかスネークケースかなどを確認する
- 慣習らしきものを見たら、それに従う
- 設計判断を行う際は、同様の判断がプロジェクトの他の場所で行われた可能性を考え、あれば既存例を見つけ同じ手法を用いる
既存の慣習を変えない:
- 既存の慣習を改善したいという衝動に抵抗する
- より良い考えを持つことは不整合を導入する十分な理由にならない
- 一貫性の価値は、一つの手法が他より優れる価値よりほぼ常に大きい
- 不整合な振る舞いを導入する前に二つの問いを自問する:
  - 旧慣習が確立された時点で得られなかった、自分の手法を正当化する重要な新情報があるか
  - 新しい手法は、旧来の全ての利用を更新する時間をかける価値があるほど優れているか
- 組織が両方の問いに「はい」と同意すれば改良を行い、完了時には旧慣習の痕跡が残らないようにする
- それでも他の開発者が新慣習を知らず、将来旧来の手法を再導入する危険が残る
- 確立された慣習の再検討は、概して開発者の時間の良い使い方ではない

度を超すこと

一貫性は類似したものを類似した方法で行うだけでなく、異なるものを異なる方法で行うことも意味する
一貫性に過度に熱心になり、異なるものを同じ手法に押し込むと複雑さと混乱を生む:
- 本当は異なるものに同じ変数名を使うこと
- パターンに合わないタスクに既存のデザインパターンを使うこと
一貫性は「xに見えるなら本当にxである」と開発者が確信できる場合にのみ利益をもたらす

結論

一貫性は投資の心構えのもう一つの例である
一貫性の確保には追加の作業を要する:
- 慣習を決める作業
- 自動検査を作る作業
- 新しいコードで模倣すべき類似状況を探す作業
- コードレビューでチームを教育する作業
この投資の見返りはコードがより明白になることである
開発者はコードの振る舞いをより速く正確に理解でき、より速く、より少ないバグで作業できる

18 Code Should be Obvious

不明瞭さと明白なコードの定義

不明瞭さは複雑さを生む二大要因の一つであり、システムに関する重要な情報が新しい開発者にとって明白でないときに発生する
不明瞭さへの対処法は、コードを明白になるように書くことである
明白なコードとは、読み手が深く考えずに素早く読め、挙動や意味についての最初の推測が正しくなるコードを指す
- 明白なコードでは、読み手がコードを扱うために必要な情報の収集に多くの時間や労力を要しない
- 明白でないコードでは、読み手が理解のために多大な時間と労力を費やし、効率を下げるだけでなく誤解やバグの可能性も高める
- 明白なコードは、明白でないコードよりも必要とするコメントが少ない
明白さは読み手の心の中にあるものであり、自分のコードの問題よりも他人のコードの不明瞭さのほうが気づきやすい
- 明白さを判断する最良の方法はコードレビューである
- 読み手が明白でないと述べたなら、書き手にとってどれほど明確に思えても、そのコードは明白でない
- 何がコードを不明瞭にしたかを理解することで、将来より良いコードを書く方法を学べる

コードを明白にする要素

既出の二技法:
- 良い名前を選ぶこと（第14章）、正確で意味のある名前は挙動を明確にし、文書化の必要を減らす、名前が曖昧だと読み手は意味を推測するためコードを読み込む必要が生じ、時間がかかり誤りも生じやすい
- 一貫性を保つこと（第17章）、類似の事柄を常に類似の方法で行えば、読み手は既知のパターンを認識し、詳細を分析せずに安全な結論を即座に導ける
空白の適切な使用:
- コードの整形は理解のしやすさに影響する、空白を詰めたパラメータ文書は、各パラメータの記述の境界や、パラメータの数や名前すら判別しにくい
- 少し空白を加えるだけで構造が明確になり、文書が読みやすくなる
- 空白行はメソッド内の主要なコードブロックを区切るのに有用である
- 各空白行の後の最初の行が次のブロックを説明するコメントである場合、空白行がコメントを目立たせるため特に効果的である
- 文中の空白は文の構造を明確にする、空白のある for 文は空白のないものより構造が読み取りやすい
コメント:
- コードを明白にできない場合を避けられないことがある
- その際は、欠けている情報をコメントで補うことが重要である
- うまく行うには、読み手の立場に立ち、何が読み手を混乱させ、どの情報がその混乱を解消するかを見極める必要がある

コードを明白でなくする要素

イベント駆動プログラミング:
- アプリケーションがネットワークパケットの到着やマウスボタンの押下などの外部事象に応答する方式である、一つのモジュールが受信イベントの報告を担い、他の部分が特定イベントへの関心を登録する
- イベントハンドラ関数は直接呼ばれず、関数ポインタやインターフェースを介してイベントモジュールから間接的に呼ばれるため、制御の流れを追いにくい
- 呼び出し箇所を見つけても、実行時にどのハンドラが登録されたかに依存するため、どの関数が呼ばれるか判別できない
- この不明瞭さを補うため、各ハンドラ関数のインターフェースコメントに、いつ呼び出されるかを記述する
レッドフラグ:不明瞭なコード:
- コードの意味と挙動を素早い読みで理解できない場合は危険信号である
- これはしばしば、読み手にとって即座に明らかでない重要な情報が存在することを意味する
汎用コンテナ:
- Java の Pair や C++ の std::pair など、複数の項目を一つのオブジェクトにまとめる汎用クラスは、メソッドからの複数値の返却などに便利で誘惑的である
- 汎用コンテナはコードを不明瞭にする、まとめられた要素が汎用的な名前を持ち意味を曖昧にするためである、呼び出し側は result.getKey() や result.getValue() で参照するが、これらは実際の意味の手がかりを与えない
- コンテナが必要なら、特定の用途に特化した新しいクラスや構造体を定義するほうがよい、要素に意味のある名前を付けられ、宣言に追加の文書を付けられる
- この例は、ソフトウェアは書きやすさではなく読みやすさのために設計すべきという一般原則を示す、汎用コンテナは書き手には便利だが後続の読み手に混乱をもたらすため、特定の構造を定義する数分を費やすほうがよい
宣言と割り当てで型が異なること:
- 変数を List として宣言し、実際の値を ArrayList として割り当てるコードは、List が ArrayList の上位クラスであるため合法である
- しかし宣言は見ても実際の割り当てを見ない読み手を誤解させうる
- 実際の型は変数の使い方に影響するため、宣言と割り当てを一致させるほうがよい
読み手の期待に反するコード:
- main プログラムが return すると終了するのが通常の期待だが、RaftClient のコンストラクタは追加スレッドを生成し、main スレッド終了後も動作を続ける
- この挙動は RaftClient コンストラクタのインターフェースコメントに記述すべきであり、十分に不明瞭であるため main の末尾にも短いコメントを置く価値がある
- コードは読み手が期待する慣習に従うときに最も明白になり、従わない場合はその挙動を文書化することが重要である

結論

明白さは情報の観点から捉えられる、コードが明白でないことは通常、読み手が持たない重要な情報が存在することを意味する
- RaftClient の例では、読み手はコンストラクタが新しいスレッドを生成することを知らない可能性がある
- Pair の例では、読み手は result.getKey() が現在の term の番号を返すことを知らない可能性がある
コードを明白にするには、読み手が理解に必要な情報を常に持つようにする、その方法は三つある:
- 最良の方法は、抽象化や特殊ケースの排除といった設計技法を用いて、必要な情報の量を減らすことである
- 第二に、慣習に従い期待に沿うことで、読み手が他の文脈で既に得た情報を活用させ、新しい情報の学習を不要にする
- 第三に、良い名前や戦略的なコメントといった技法で、重要な情報をコード中に提示する

19 Software Trends

本章の目的

本章はソフトウェア開発でこの数十年に普及したトレンドやパターンを取り上げる
各トレンドについて本書の原則との関係を述べる
各トレンドが複雑性に対して有効に働くかを原則を用いて評価する

オブジェクト指向プログラミングと継承

オブジェクト指向プログラミングの位置づけ:
- 過去30〜40年で最も重要な新しい考え方の一つである
- クラス、継承、プライベートメソッド、インスタンス変数といった概念を導入した
- 注意深く使えばより良い設計を生み出す助けになる
- プライベートメソッドや変数は情報隠蔽に利用でき、クラス外部からの依存を防ぐ
インターフェース継承:
- 親クラスがメソッドのシグネチャを定義し、実装は行わない形式である
- 各サブクラスがシグネチャを実装し、サブクラスごとに異なる実装が可能である
- 例として、I/Oのインターフェースをディスクファイル用とネットワークソケット用で別個に実装できる
- 同一インターフェースを複数用途で再利用することで複雑性に対する有効性を持つ
- 実装が多いほどインターフェースは深くなり、これは抽象化の核心に通じる
実装継承:
- 親クラスがシグネチャに加えてデフォルト実装も定義する形式である
- サブクラスは親の実装を継承するか、同一シグネチャの新メソッドで上書きするかを選べる
- メソッド実装の重複を避け、変更増幅の問題を軽減する
実装継承の問題点:
- 親クラスと各サブクラスの間に依存関係を生む
- 親クラスのインスタンス変数が親子双方からアクセスされ、クラス間に情報漏洩が生じる
- あるクラスの変更時に他のクラスを確認する必要が生じる
- 最悪の場合、変更のために親以下の階層全体の知識が必要になる
- 実装継承を多用する階層は複雑性が高くなりやすい
実装継承への対処:
- 使用前にコンポジションで同じ利益を得られないか検討する
- 共有機能を小さなヘルパークラスで実装する方法がある
- 代替がない場合、親が管理する状態とサブクラスが管理する状態を分離する
- 特定のインスタンス変数を親のメソッドで完全に管理し、サブクラスは読み取り専用または親のメソッド経由で利用する
オブジェクト指向の限界:
- 提供される機構は良い設計を保証しない
- クラスが浅い、インターフェースが複雑、内部状態を外部に公開する場合は高い複雑性を招く

アジャイル開発

成り立ちと範囲:
- 1990年代後半に軽量、柔軟、漸進的な開発を目指す考えとして生まれた
- 2001年の実務者会合で正式に定義された
- 主にチーム編成、スケジュール管理、ユニットテストの役割、顧客との対話などプロセスを扱う
漸進的かつ反復的な開発:
- システムを反復ごとに少数の新機能を追加し評価しながら開発する
- 各反復は設計、テスト、顧客の入力を含む
- 複雑なシステムは開始時点で最良の設計を見通せないため、本書が推奨する漸進的手法と類似する
アジャイル開発のリスク:
- 抽象ではなく機能に焦点を当て、設計判断を先送りさせる傾向がある
- 汎用機構を最初から作らず、最小限の専用機構から始めて後で一般化する主張がある
- この主張は投資的アプローチに反し、戦術的プログラミングを助長する
- 結果として複雑性が急速に蓄積しうる
推奨される姿勢:
- 開発の単位は機能ではなく抽象であるべきである
- 抽象が必要になった時点で、時間をかけて綺麗に設計しある程度汎用的にする

ユニットテスト

背景の変化:
- かつてテストはほとんど書かれず、書かれる場合も別のQAチームが担当した
- アジャイル開発はテストを開発と密に統合し、プログラマが自身のコードのテストを書くべきとする
- この実践は現在では広く普及している
テストの種類:
- ユニットテスト:
  - 開発者が最も多く書くテストである
  - 小さく焦点を絞り、単一メソッド内の小さな部分を検証する
  - 本番環境を構築せず単独で実行できる
  - テストカバレッジツールと併用し全行のテストを確認することが多い
  - コードの追加や変更の際は開発者がテストを更新する責任を持つ
- システムテスト:
  - 統合テストとも呼ばれ、アプリの各部が正しく連携することを確認する
  - 通常はアプリ全体を本番環境で実行する
  - 別のQAやテストチームが書くことが多い
テストと設計の関係:
- テスト特にユニットテストはリファクタリングを容易にし設計上重要な役割を果たす
- テストがないと大きな構造変更が危険になり、バグが配備後まで残りやすい
- 良いテストがないと開発者はリファクタリングを避け、複雑性が蓄積し設計ミスが残る
- 良いテストがあれば自信を持ってリファクタリングでき、構造改善が促される
- ユニットテストはシステムテストより高いカバレッジを持ちバグを発見しやすい
Tclの事例:
- Tcl言語の開発でインタプリタをバイトコードコンパイラに置き換えた
- これはコアエンジンのほぼ全体に影響する大きな変更であった
- 優れたユニットテスト群により、アルファリリース後に判明したバグは一つだけであった

テスト駆動開発

概要:
- コードを書く前にユニットテストを書く手法である
- 新クラス作成時にまず期待される振る舞いに基づくテストを書く
- 当初は全テストが失敗し、開発者は一つずつテストを通すコードを書く
- 全テストが通った時点でクラスが完成する
著者の見解:
- 著者はユニットテストを強く支持するが、テスト駆動開発を支持しない
- 最良の設計を見出すことよりも特定機能を動かすことに注意が向く問題がある
- これは戦術的プログラミングそのものであり、その欠点をすべて伴う
- 漸進的すぎて設計を行う明確な時機がなく、混乱に陥りやすい
- 開発の単位は機能ではなく抽象であるべきで、抽象は一度にまとめて設計する
テストを先に書くべき場面:
- バグ修正時にはテストを先に書くことが理にかなう
- 修正前にバグで失敗するユニットテストを書き、修正後に通ることを確認する
- 修正後にテストを書くと、そのテストがバグを再現しない可能性がある

デザインパターン

定義と普及:
- 特定種類の問題を解く一般的な手法であり、イテレータやオブザーバなどがある
- Gamma、Helm、Johnson、Vlissidesの著書により普及した
- 現在オブジェクト指向開発で広く使われている
利点:
- 一から機構を設計する代わりに既知のパターンを適用する代替手段である
- 共通問題を解き、綺麗な解として広く合意されているため概ね有益である
- 適合する状況では、より良い別手法を考え出すのは難しい
最大のリスク:
- 過剰適用である
- すべての問題がパターンで綺麗に解けるわけではなく、独自手法が綺麗な場合は無理に当てはめない
- パターンは適合する場合のみ改善をもたらす
- パターンが良いことは、より多くのパターンが良いことを意味しない

ゲッターとセッター

概要:
- Javaコミュニティで人気のデザインパターンである
- インスタンス変数に対応し、getFooやsetFooのような名前を持つ
- ゲッターは現在値を返し、セッターは値を変更する
賛否:
- インスタンス変数を公開できるため厳密には必須ではない
- 取得や設定の際に関連値の更新、リスナーへの通知、制約の強制などの追加機能を実行できる
- これらの機能は後からインターフェースを変えずに追加できる
著者の評価:
- インスタンス変数を公開せざるを得ない場合に使う意味はあるが、そもそも公開しない方がよい
- 公開された変数は実装の一部を外部に見せ、情報隠蔽に反しインターフェースの複雑性を増す
- ゲッターとセッターは通常一行の浅いメソッドで、機能をほとんど持たずインターフェースを煩雑にする
- 実装データの公開は可能な限り避ける方がよい
パターン確立のリスク:
- パターンが良いと前提し可能な限り使おうとする傾向がある
- これがJavaにおけるゲッターとセッターの過剰使用を招いた

結論

新しい開発パラダイムの提案には複雑性の観点から疑問を投げかける
大規模システムの複雑性を本当に最小化するかを問う
表面上は良く見えても深く見ると複雑性を悪化させる提案がある

20 Designing for Performance

性能設計の基本姿勢

本章はクリーンな設計を犠牲にせず高い性能を達成する方法を扱う
最も重要な考え方は依然として単純性であり、単純性は設計を改善するだけでなく通常はシステムを高速化する
複雑なコードは余分または冗長な処理を行うため遅くなりやすい

性能をどう考えるか

二つの極端な姿勢の問題点:
- すべての文を最大速度に最適化すると開発が遅くなり、不要な複雑性が生まれ、多くの最適化は実際には性能向上に寄与しない
- 性能を完全に無視すると非効率がコード全体に分散し、システムは必要な速度の5から10倍遅くなりうる
- 後者は「千の切り傷による死」と呼ばれ、単一の改善では大きな効果が出ないため後からの改善が困難になる
推奨される中庸の方針:
- 性能に関する基本知識を用い、「本質的に効率的」かつクリーンで単純な設計案を選ぶ
- どの操作が根本的に高価かを認識する力を養うことが鍵となる
相対的に高価な操作の例:
- ネットワーク通信: データセンタ内の往復で10から50マイクロ秒、広域では10から100ミリ秒を要する
- 二次記憶へのI/O: ディスクI/Oは5から10ミリ秒、フラッシュは10から100マイクロ秒、新興の不揮発性メモリは1マイクロ秒程度でも約2000命令分に相当する
- 動的メモリ割り当て: malloc、new などは割り当て、解放、ガベージコレクションに大きなオーバーヘッドを伴う
- キャッシュミス: DRAMからオンチップキャッシュへのフェッチに数百命令分を要し、多くのプログラムでは性能がキャッシュミスに支配される
高価な操作を学ぶ手段:
- 単一操作のコストを測るマイクロベンチマーク(小さなプログラム)を実行する
- RAMCloudプロジェクトではマイクロベンチマーク用フレームワークを数日で作成し、新規ベンチマークを5から10分で追加できるようにした
効率的な選択の具体例:
- キー値で参照する大量オブジェクトの格納には、ハッシュテーブルと順序付きマップの双方が利用可能だが、ハッシュテーブルは5から10倍高速になりうるため、順序特性が必要でない限りハッシュテーブルを使う
- C言語やC++で構造体配列を割り当てる場合、ポインタ配列にして個別に割り当てるより、構造体を配列内に直接格納し一つの大きなブロックを一括割り当てる方が効率的である
複雑性を伴う効率化の判断基準:
- 効率化が複雑性を少量しか増やさず、その複雑性がインターフェースに影響せず隠蔽される場合は採用に値する(ただし複雑性は累積する点に注意)
- 高速な設計が実装の複雑性やインターフェースの複雑化を大きく招く場合は、まず単純な手法で始め、性能が問題になれば後で最適化する方がよい
- 性能が重要になる明確な証拠がある場合は、最初から高速な手法を実装してよい
RAMCloudの設計判断:
- クライアントがデータセンタネットワーク経由でストレージにアクセスする際の最低遅延を目標とした
- カーネルを迂回しネットワークインターフェースコントローラと直接通信する専用ハードウェアを採用した
- 複雑性は増したが、カーネル経由の通信では要件を満たせないと事前測定で判明していたため決断した
- この一つの大きな問題を正しく解決したことで、他の多くの部分は単純性を重視した設計が可能になった
単純なコードが速い理由:
- 特殊ケースや例外を排除すればそれらを検査するコードが不要になり高速化する
- 深いクラスは一度のメソッド呼び出しでより多くの処理を行うため浅いクラスより効率的である
- 浅いクラスは層の横断を増やし、各横断がオーバーヘッドを加える

変更前に測定する

性能の直感は信頼できない:
- 経験豊富な開発者であっても性能に関する直感は当てにならない
- 直感に基づく変更は効果のない作業に時間を浪費し、システムを複雑化させる恐れがある
測定の二つの目的:
- 第一に、性能チューニングが最大の効果を持つ箇所を特定する
- 第二に、変更後に再測定して実際に性能が向上したかを確認するための基準値を提供する
測定の進め方:
- トップレベルの性能測定だけでは不十分であり、システムが遅い理由はわからない
- より深く測定し、現在多くの時間を費やしており改善の見込みがある少数の具体的箇所を特定する
変更後の扱い:
- 変更が測定可能な性能差を生まなければ、その変更は撤回する(ただしシステムを単純化した場合は除く)
- 大きな高速化をもたらさない限り複雑性を保持する意味はない

クリティカルパスを中心に設計する

本質的修正の優先:
- 性能に影響する遅いコードを特定した場合、最善の改善はキャッシュの導入や異なるアルゴリズム(リストに対する平衡木など)への変更といった本質的な変更である
- RAMCloudのカーネル迂回は本質的修正の例である
- 本質的修正が見つかれば、これまでの章の設計技法で実装できる
本質的修正がない場合の手法:
- 既存コードを高速化するための再設計は最後の手段とすべきであり、頻繁には起こらないが大きな効果を生む場合がある
- 鍵となる考えはコードをクリティカルパスを中心に設計することである
「理想コード」の構想:
- 最も一般的なケースで目的を果たすために実行が必須となる最小限のコードは何かを問う
- 既存のコード構造を無視し、クリティカルパスのみを実装する新しいメソッドを書くと想定する
- 特殊ケースを無視し、複数のメソッド呼び出しを単一メソッドにまとめると想定する
- クリティカルパスに必要なデータのみを考え、最も都合のよいデータ構造を仮定する(複数変数を単一値に統合するなど)
- この最小コードを「理想(the ideal)」と呼ぶ
理想に近い実設計の探索:
- 理想コードは既存のクラス構造と衝突し実用的でない場合があるが、コードがとりうる最も単純で最速の姿という良い目標を提供する
- 理想コードをおおむね保ったまま、クリーンな構造を持つ理想に最も近い設計を探す
- クリーンな抽象化のために理想へ少量のコードを加えてよい(ハッシュテーブル参照に汎用クラスへのメソッド呼び出しを導入するなど)
- 著者の経験では、クリーンで単純かつ理想に非常に近い設計はほぼ常に見つかる
特殊ケースの除去:
- 遅いコードは多様な状況を扱うために構造化され、各特殊ケースが条件文やメソッド呼び出しとしてクリティカルパスに少しずつコードを加えている
- 再設計では検査すべき特殊ケースの数を最小化する
- 理想は冒頭の単一のif文で全特殊ケースを一度の検査で検出することである
- 通常ケースではこの一度の検査のみで、以降はクリティカルパスを追加検査なしに実行できる
- 初期検査が失敗(特殊ケース発生)した場合はクリティカルパス外の別箇所で処理する
- 特殊ケースでは性能より単純性を優先して構造化してよい

事例: RAMCloud Buffer

Bufferの役割と構造:
- RAMCloudはリモートプロシージャ呼び出しの要求・応答メッセージなど可変長メモリ配列の管理にBufferオブジェクトを用いる
- Bufferはメモリコピーと動的記憶割り当てのオーバーヘッド削減を目的とする
- 線形バイト配列に見えるが、効率のため内部記憶を複数の非連続チャンクに分割できる
- チャンクには外部と内部の二種類がある:
  - 外部チャンクは記憶を呼び出し側が所有し、Bufferは参照のみを保持する。大きなチャンクでコピーを避けるために用いる
  - 内部チャンクはBufferが記憶を所有し、呼び出し側のデータをBufferの内部記憶へコピーする。コピーコストが無視できる小さなチャンクに便利である
- 各Bufferは内部チャンク格納用の小さな組み込み割り当てを持ち、不足時には追加割り当てを作成し、破棄時に解放する
Bufferの本質的修正としての位置づけ:
- Bufferは本来必要となる高価なメモリコピーを排除する本質的修正である
- 短いヘッダと大きなオブジェクト内容から成る応答メッセージは、内部チャンクのヘッダと外部チャンクのオブジェクト参照の二チャンクで、大きなオブジェクトをコピーせず収集できる
最適化の動機:
- 当初はチャンク非連続化以外にコード最適化を行わなかった
- Bufferの利用が増え、各リモートプロシージャ呼び出しで少なくとも4個のBufferが生成されるなど、実装高速化が全体性能に影響しうることが明らかになった
最適化対象のクリティカルパス:
- 最も一般的な操作は内部チャンクで少量の新規データ領域を割り当てることであり、これをクリティカルパスとした
- 最単純ケースでは最後の既存チャンクを拡張して領域を確保できるが、これは最後のチャンクが内部であり割り当てに十分な空きがある場合に限られる
- 理想コードは単一検査で簡易手法の可否を確認し、既存チャンクのサイズを調整する
元コードの二つの問題:
- 第一の問題は多数の特殊ケースを個別に検査することである:
  - Buffer::allocateAppend が割り当ての有無を検査する
  - 現割り当てに十分な空きがあるかを二度検査する(Buffer::Allocation::allocateAppend 内と、その戻り値の検査時)
  - Buffer::alloc が Buffer::allocAppend の戻り値を再度検査し割り当て成功を確認する
  - 最後のチャンクを直接拡張せず新領域を割り当て、その後 Buffer::alloc が隣接性を検査してマージするため検査が増える
  - 結果としてクリティカルパスで6個の異なる条件を検査する
- 第二の問題は層が多くすべて浅いことである:
  - これは性能上かつ設計上の問題である
  - クリティカルパスは元の呼び出しに加え二つのメソッド呼び出しを行い、各呼び出しに時間がかかり戻り値検査が特殊ケースを増やす
  - 第7章の通り抽象は層をまたぐと変化すべきだが、三つのメソッドは同一シグネチャでほぼ同一の抽象を提供しており、これは危険信号である
  - Buffer::allocateAppend はほぼパススルーメソッドで、必要時に新割り当てを作る以外の貢献がない
再設計の内容と結果:
- 性能上重要な複数のパス(Buffer内総バイト数の取得なども含む)を中心にクラスを再設計した
- 各クリティカルパスで共通ケースに必須の最小コードを特定し、それを軸にクラス全体を設計した
- 本書の設計原則を適用し、浅い層を排除してより深い内部抽象を作った
- 再設計後のクラスは元の1886行に対し1476行と20%小さくなった
新コードの特徴:
- 新コードは高速で、浅い抽象を避けるため可読性も高い
- 全パスを単一メソッドで処理し、単一検査で全特殊ケースを排除する
- 新インスタンス変数 extraAppendBytes を導入し、Buffer最後のチャンク直後の未使用空き容量を追跡する
- 空きがない、最後のチャンクが内部でない、チャンクが存在しない場合は extraAppendBytes はゼロとなる
- totalLength の更新は各チャンクから総長を再計算すれば省けるが、多チャンクの大Bufferでは高価であり総長取得も頻出操作のため、alloc に小さな追加負荷を加えて総長を常時即座に利用可能とした
性能向上の数値:
- 内部記憶への1バイト文字列追加の総時間は8.8ナノ秒から4.75ナノ秒へと約2倍高速化した
- Buffer生成、小チャンクの内部追加、Buffer破棄までの時間は24ナノ秒から12ナノ秒へ短縮した

結論

本章の最重要の教訓はクリーンな設計と高性能が両立することである
Buffer書き換えは設計を単純化しコード量を20%削減しつつ性能を2倍に改善した
複雑なコードは余分・冗長な処理により遅くなりがちである
クリーンで単純なコードを書けばシステムは十分高速になり、そもそも性能をあまり懸念せずに済むことが多い
最適化が必要な少数の場合でも鍵は再び単純性であり、性能上最重要なクリティカルパスを見つけ可能な限り単純にする

21 Conclusion

本書の主題

本書の主題は複雑性であり、複雑性への対処はソフトウェア設計における最重要の課題である
複雑性はシステムの構築と保守を困難にし、しばしば動作を遅くする要因となる
本書では複雑性に関わる以下の観点を扱った
- 複雑性を生む根本原因（依存関係、不明瞭さなど）
- 不要な複雑性を見分ける危険信号（情報漏洩、不要なエラー条件、汎用的すぎる名前など）
- より単純なシステムを作るための一般的な考え方（深く汎用的なクラスを目指すこと、エラーを存在しないものとして定義すること、インターフェースのドキュメントと実装のドキュメントを分離すること）
- 単純な設計を生み出すために必要な投資の心構え

設計を重視することの欠点

これらの提案は、プロジェクトの初期段階で余分な作業を生む
設計上の問題を考えることに慣れていない場合、良い設計手法を学ぶ過程でさらに作業が遅くなる
現在のコードを可能な限り早く動かすことだけを重視する場合、設計の検討は本来の目標を妨げる退屈な作業に見える

設計を重視することの利点

良い設計を重要な目標とする場合、本書の考え方はプログラミングをより楽しいものにする
設計は魅力的なパズルである
- 特定の問題を可能な限り単純な構造で解く方法を探る行為である
- 異なる手法を検討することは楽しく、単純かつ強力な解を見つけることは大きな喜びを与える
- 清潔で単純かつ明白な設計は美しいものである

良い設計への投資の効果

良い設計への投資は速やかに回収される
効果は具体的に以下の形で現れる
- 初期に慎重に定義したモジュールは、繰り返し再利用することで後の時間を節約する
- 過去に書いた明確なドキュメントは、新機能追加のためにコードへ戻る際の時間を節約する
- 設計スキルを磨いた時間は、スキルと経験の成長を通じて、より速く良い設計を生み出せるようになることで回収される
手法を習得すれば、良い設計は素早く雑に行う設計と比べてさほど時間を要しない

良い設計者が得る報酬

良い設計者であることの報酬は、楽しい設計フェーズに費やす時間の割合が増えることである
設計者の質によって時間の使い方が異なる
- 質の低い設計者は、複雑で壊れやすいコードのバグ追跡に大半の時間を費やす
- 設計スキルを高めれば、より高品質なソフトウェアをより速く生み出せる
設計スキルの向上により、ソフトウェア開発の過程そのものもより楽しいものになる

Summary of Design Principles

1. 複雑性は漸進的に蓄積する: 小さな事柄にも注意を払わなければならない
2. 動作するコードを書くだけでは不十分である
3. システム設計を改善するための小さな投資を継続的に行う
4. モジュールは深くあるべきである
5. インターフェースは、最も一般的な使用方法が可能な限り単純になるよう設計すべきである
6. モジュールにとっては、単純な実装を持つことよりも単純なインターフェースを持つことの方が重要である
7. 汎用的なモジュールはより深い
8. 汎用コードと特殊目的のコードを分離する
9. 異なる層は異なる抽象化を持つべきである
10. 複雑性を下位の層へ押し下げる
11. エラー（および特殊ケース）を存在しないものとして定義する
12. 設計は二度行う
13. コメントはコードから自明でない事柄を記述すべきである
14. ソフトウェアは書きやすさではなく読みやすさを重視して設計すべきである
15. ソフトウェア開発における増分は、機能ではなく抽象化であるべきである

Summary of Red Flags

浅いモジュール（Shallow Module）:
- クラスやメソッドのインターフェースが、その実装と比べてさほど単純になっていない
情報の漏洩（Information Leakage）:
- ある設計上の決定が複数のモジュールに反映されている
時間的分解（Temporal Decomposition）:
- コードの構造が、情報隠蔽ではなく、処理が実行される順序に基づいている
露出過多（Overexposure）:
- API が、よく使われる機能を利用するために、めったに使われない機能まで呼び出し側に意識させてしまう
受け流しメソッド（Pass-Through Method）:
- メソッドが、似たシグネチャを持つ別のメソッドへ引数を渡すだけで、ほとんど何もしていない
繰り返し（Repetition）:
- 自明でないコードが何度も繰り返されている
特殊・汎用の混在（Special-General Mixture）:
- 特殊目的のコードが汎用目的のコードからきれいに分離されていない
癒着したメソッド（Conjoined Methods）:
- 2 つのメソッドの依存関係が多すぎて、一方の実装をもう一方の実装を理解せずには理解しにくい
コードを繰り返すコメント（Comment Repeats Code）:
- コメント内の情報がすべて、その隣にあるコードからすぐに分かってしまう
実装ドキュメントによるインターフェースの汚染（Implementation Documentation Contaminates Interface）:
- インターフェースのコメントが、ドキュメント対象の利用者には不要な実装の詳細を記述している
曖昧な名前（Vague Name）:
- 変数やメソッドの名前が不正確すぎて、有用な情報をほとんど伝えていない
名前を付けにくい（Hard to Pick Name）:
- あるエンティティに対して、正確で直感的な名前を考え出すのが難しい
説明しにくい（Hard to Describe）:
- 変数やメソッドのドキュメントが、完全なものにしようとすると長くならざるを得ない
自明でないコード（Nonobvious Code）:
- あるコードの振る舞いや意味を簡単には理解できない