8 どこまでなら言えるのか

1回だけうまくいった結果から、法則と言ってよいのか。

すぐに答えようとしなくてよい。ただ、「何回測れば信用できるか」について、自分なりの感覚を余白にメモしておいてほしい。それがこの章の出発点になる。

第6章で、振り子の周期を測る実験を計画した。糸の長さを変え、おもりの質量と振れ幅をそろえて、周期を比べる計画である。

ここで、三つの班がその計画に従って実際に測定したとする。糸の長さ 80 cm、おもり 50 g、振れ幅 10° の条件で、 10往復の時間を測り、10で割って1往復の周期を求めた。各班3回ずつ測定した結果が次の通りである。

表 8.1: 振り子の周期の測定結果（\(L = 80\) cm）

	1回目（秒）	2回目（秒）	3回目（秒）
A班	1.78	1.82	1.80
B班	1.81	1.79	1.83
C班	1.76	1.80	1.78

三つの班の値は、1.76秒から1.83秒のあいだに散らばっている。理論値は \(T = 2\pi\sqrt{L/g} = 2\pi\sqrt{0.80/9.8} \approx 1.80\) 秒である。どの値も理論値の近くにあるが、ぴったり一致するものは少ない。

ここで問いが生まれる。 この測定結果から「周期は1.80秒である」と言ってよいのか。 あるいは、「1.78秒から1.83秒のあいだのどこかである」と言うべきなのか。

この章では、測定データのばらつきを正面から扱い、データが支えられる強さで結論を書く方法を学ぶ。

8.1 なぜ測定値はそろわないのか

まず確認しておきたいのは、測定値がそろわないことは失敗ではないということである。

同じ条件で同じ操作を繰り返しても、測定値は毎回わずかに異なる。その原因はさまざまである。

ストップウォッチを押すタイミングのずれ（人間の反応時間）
振れ幅を正確に10°に合わせることの難しさ
糸のわずかなねじれや揺れ
室温や空気の流れのわずかな変動

これらの要因は、実験者がどれほど注意しても完全には取り除けない。測定値がばらつくのは、測定という行為が本質的にもつ不確かさの表れである。

重要なのは、ばらつきを「なくす」ことではなく、 ばらつきの大きさを把握し、それを踏まえて結論を書くことである。

測定値がそろわないのは失敗ではない。ばらつきの大きさを無視して結論を書くことが失敗である。

第4章で学んだ「主張の強さの階段」を思い出してほしい。「示している」「示唆している」「排除できない」の使い分けは、根拠の強さによって決まるのであった。データのばらつきは、まさにその根拠の強さに直結する。ばらつきが小さければ強く言える。ばらつきが大きければ慎重に言うべきである。

表 8.1 の測定で、ばらつきを生む要因を三つ以上挙げよ。それぞれについて、「大きくなりそうか、小さくなりそうか」の見当もつけよ。

要因	ばらつきの大きさの見当
ストップウォッチの押しタイミング（反応時間）	0.1〜0.3秒程度。10往復で割ると0.01〜0.03秒。比較的小さいが、測定値のばらつきと同程度になりうる
振れ幅の設定のずれ	10°を目分量で合わせるとき、1〜2°程度のずれは起こりうる。小角度の範囲では周期への影響は小さいが、角度が大きくなると効いてくる
糸のねじれや横揺れ	振り子が一直線に振れず円を描くことがある。周期がわずかに変わりうる
空気の流れ	窓やエアコンからの風。影響は小さいが、長い糸ほど風に揺らされやすい
おもりの離し方	手で持って離すとき、わずかに押してしまうと初速が生じる。周期にはほとんど影響しないが、振れ幅が変わりうる

8.2 データを見える形に整理する

ばらつくデータから何かを言うためには、まずデータを整理する必要がある。ここでは二つの道具を導入する。平均と広がりである。

8.2.1 平均

A班の三回の測定値は 1.78、1.82、1.80 秒であった。この三つの平均は

\[ \bar{T}_A = \frac{1.78 + 1.82 + 1.80}{3} = 1.800 \text{秒} \]

である。同様に、

\[ \bar{T}_B = \frac{1.81 + 1.79 + 1.83}{3} = 1.810 \text{秒}, \quad \bar{T}_C = \frac{1.76 + 1.80 + 1.78}{3} = 1.780 \text{秒} \]

平均は、ばらつく測定値の「代表値」を一つに絞る道具である。しかし、平均だけでは情報が足りない。 1.78、1.80、1.82 の平均と、1.50、1.80、2.10 の平均はどちらも 1.80 だが、ばらつきの大きさがまったく異なる。

8.2.2 広がり（範囲）

最も単純なばらつきの指標は範囲（最大値 − 最小値）である。

表 8.2: 各班の平均と範囲

班	平均（秒）	範囲（秒）
A班	1.800	\(1.82 - 1.78 = 0.04\)
B班	1.810	\(1.83 - 1.79 = 0.04\)
C班	1.780	\(1.80 - 1.76 = 0.04\)

三班とも範囲は 0.04 秒程度である。つまり、どの班も ±0.02 秒くらいの幅で値がばらついているということになる。

データを整理するとは、代表値（平均）とばらつきの大きさ（範囲）をセットで示すことである。平均だけを報告しても、ばらつきの情報が失われる。

なお、ばらつきの指標としては範囲のほかに標準偏差もある。標準偏差は全データのばらつき具合をより精密に表す指標であるが、この章では範囲を使って議論の骨組みを学ぶことを優先する。

次のデータは、糸の長さ 50 cm での振り子の周期を3班が各3回ずつ測定した結果である。各班の平均と範囲を求め、表にまとめよ。

	1回目（秒）	2回目（秒）	3回目（秒）
D班	1.40	1.43	1.42
E班	1.44	1.41	1.42
F班	1.39	1.42	1.41

班	平均（秒）	範囲（秒）
D班	\((1.40 + 1.43 + 1.42)/3 = 1.417\)	\(1.43 - 1.40 = 0.03\)
E班	\((1.44 + 1.41 + 1.42)/3 = 1.423\)	\(1.44 - 1.41 = 0.03\)
F班	\((1.39 + 1.42 + 1.41)/3 = 1.407\)	\(1.42 - 1.39 = 0.03\)

理論値は \(T = 2\pi\sqrt{0.50/9.8} \approx 1.42\) 秒であり、各班の平均はその近くにある。範囲はいずれも 0.03 秒程度で、80 cm のときの 0.04 秒よりやや小さい。糸が短いほど周期が短く、10往復の合計時間も短くなるため、ストップウォッチ操作のずれの影響がやや大きくなりそうだが、この程度のデータ数では明確な差とは言い切れない。

8.3 ばらつきと、かたよったずれ

測定値のずれには二つの種類がある。

ランダムなばらつき（偶然誤差）: 繰り返し測定すると、真の値の周りに大きくなったり小さくなったりする。ストップウォッチの押しタイミングのずれが典型例である。測定回数を増やすと、平均をとることで影響を小さくできる。
かたよったずれ（系統誤差）: 繰り返し測定しても、いつも同じ方向にずれる。たとえば、糸の長さをおもりの中心まで測るべきところを、おもりの上端までしか測っていなかったとする。このとき、実際の振り子の長さは常に数 mm 短く報告される。何回測っても同じ方向にずれるので、平均をとっても消えない。

この二つの区別は、対処法がまったく異なるという点で重要である。

表 8.3: ランダムなばらつきと、かたよったずれの比較

	ランダムなばらつき	かたよったずれ
方向	大きくなったり小さくなったりする	いつも同じ方向にずれる
原因の例	反応時間、微小な振動、気流	測定基準の間違い、器具の校正不足
平均で小さくなるか	平均すると影響を小さくできる傾向がある	小さくならない
対処法	測定回数を増やす、精度の高い器具を使う	測定方法そのものを見直す

ばらつきは回数で小さくできる。しかし、かたよりは回数では消えない。「何回測っても同じ答えになるから正しい」とは限らない。

日常の議論にも同じ構造がある。たとえば、ある薬の効果を調べるとき、被験者ごとに効き方がばらつくのはランダムなばらつきである。しかし、被験者を「自分から薬を希望した人」だけから選んでいたとすれば、健康意識の高さという偏りが常に同じ方向に結果をずらす。これはかたよったずれである。

第6章で学んだ実験計画の「統制変数」は、かたよったずれを防ぐための仕組みでもあった。

次の測定のずれは、ランダムなばらつきか、かたよったずれか。理由とともに答えよ。

振り子の周期を測定中、窓が開いていて風が不規則に吹いていた。測定値がときに大きく、ときに小さくなった。
ストップウォッチが毎回 0.05 秒速く進む（校正不良）状態で、10往復の時間を測った。
ある生徒がストップウォッチを押すとき、いつも少し遅れて押す癖がある。スタートでもストップでも同程度遅れる。

(a) ランダムなばらつき。 風が不規則に吹くため、あるときは周期を長くし、あるときは短くする。方向が一定ではないので、回数を増やして平均をとれば影響は小さくなる。

(b) かたよったずれ。 ストップウォッチが毎回 0.05 秒速く進むなら、10往復の時間は常に実際より 0.05 秒長く記録される。何回測っても同じ方向にずれるため、平均をとっても消えない。ただし、1往復に換算すると 0.005 秒であり、この場合は小さい。対処法はストップウォッチの校正である。

(c) これは微妙だが、多くの場合ランダムなばらつきに近い。 スタートでもストップでも同程度遅れるなら、10往復の時間（ストップ − スタート）としては遅れが相殺される。もし遅れの量が毎回ばらつくなら、それはランダムなばらつきである。ただし、「スタートで遅れやすいが、ストップでは遅れにくい」といった非対称性があれば、かたよったずれになりうる。

8.4 差があると言うには、何を見るか

実験の目的は、多くの場合「条件を変えたとき、結果に差が出るか」を調べることである。しかし、「平均が違う」だけでは「差がある」とは言えない。

次の二つのデータを比べてほしい。

比較1：糸の長さ 50 cm と 80 cm

糸の長さ 50 cm と 80 cm で周期を測定した。表 8.1 の80 cm のデータと、小課題 8-2 の 50 cm のデータをまとめると次のようになる。

表 8.4: 長さを変えたときの周期の比較

条件	全測定値の平均（秒）	ばらつきの範囲（秒）
\(L = 50\) cm	約 1.42	約 0.03
\(L = 80\) cm	約 1.80	約 0.04

平均の差は \(1.80 - 1.42 = 0.38\) 秒である。一方、各条件のばらつきの範囲はどちらも 0.03〜0.04 秒程度である。 平均の差（0.38秒）は、ばらつき（0.03〜0.04秒）よりずっと大きい。 これなら、「糸の長さを変えると周期が変わる」と言うことに十分な根拠がある。

比較2：おもりの質量 50 g と 100 g

次に、糸の長さを 80 cm に固定して、おもりの質量を 50 g と 100 g に変えた場合を見る。

表 8.5: 質量を変えたときの周期の比較

条件	測定値（秒）	平均（秒）	範囲（秒）
\(m = 50\) g	1.78, 1.82, 1.80, 1.81, 1.79, 1.83	1.805	0.05
\(m = 100\) g	1.79, 1.81, 1.77, 1.82, 1.80, 1.79	1.797	0.05

平均の差は \(1.805 - 1.797 = 0.008\) 秒である。一方、各条件のばらつきの範囲は 0.05 秒程度である。 平均の差（0.008秒）は、ばらつき（0.05秒）よりずっと小さい。 この差は、ばらつきの中に埋もれている。

二つの条件の平均が違っていても、その差がばらつきと同じくらいなら、強くは言いにくい。

ここで注意すべきことがある。「差がない」と「この測定では差を確認できない」は異なる主張である。

「おもりの質量は周期に影響しない」は、物理法則（小角度の単振り子では質量によらない）に基づく主張である。
「この測定では、質量による周期の差を確認できなかった」は、データの分解能に基づく主張である。

後者のほうが正確であり、誠実である。物理法則を知っていれば「影響しない」と言えるが、このデータだけから論じるなら「確認できなかった」と書くべきである。第4章で学んだ「条件付き主張」が、ここでも機能する。

次のデータは、斜面の角度を 15° と 30° にして、台車が 1 m の斜面を下るのにかかる時間を各5回ずつ測定した結果である。

条件	測定値（秒）
角度 15°	2.31, 2.28, 2.35, 2.30, 2.33
角度 30°	1.58, 1.62, 1.55, 1.60, 1.59

各条件の平均と範囲を求めよ。
平均の差とばらつきの大きさを比較し、「角度を変えると下る時間に差がある」と言えるかどうかを判断せよ。

(a)

条件	平均（秒）	範囲（秒）
角度 15°	\((2.31 + 2.28 + 2.35 + 2.30 + 2.33)/5 = 2.314\)	\(2.35 - 2.28 = 0.07\)
角度 30°	\((1.58 + 1.62 + 1.55 + 1.60 + 1.59)/5 = 1.588\)	\(1.62 - 1.55 = 0.07\)

(b) 平均の差は \(2.314 - 1.588 = 0.726\) 秒。ばらつきの範囲はどちらも 0.07 秒程度。平均の差はばらつきの約10倍であり、ばらつきの中に埋もれる大きさではない。したがって、「角度を変えると下る時間に差がある」と言える。より正確には、「今回の測定条件（摩擦あり、1 mの斜面）において、角度 15° と 30° のあいだで、斜面を下る時間に明確な差が確認された」と書くのが適切である。

8.5 再現性を見る

一人が3回測定して平均を出すだけでは、まだ心もとない。なぜなら、その人に特有の癖（たとえばストップウォッチの押し方）が、 3回すべてに共通して入っている可能性があるからである。

ここで、再現性という考え方が重要になる。

再現性とは、同じ条件で、異なる測定者・異なる機会に行っても、同様の結果が得られるかということである。なお、計量の分野では「同一条件での繰り返し（repeatability）」と「条件を変えた再現（reproducibility）」を区別することがある。本書ではこの区別には深入りせず、まとめて「再現性」と呼ぶ。

表 8.1 で三つの班がそれぞれ測定していたのは、まさに再現性を確認するための構造であった。

三つの班の平均値は 1.800、1.810、1.780 秒であった。これらの「班平均のばらつき」を見ると、範囲は \(1.810 - 1.780 = 0.030\) 秒である。各班の中でのばらつき（0.04秒程度）と同程度であり、どの班が測っても似た値が出ている。

このことから、結果は特定の班の癖ではなく、再現性があると判断できる。

一人の測定者が何回測っても「正確」とは限らない。複数の測定者が同様の結果を出すとき、結果の信頼性は高まる。

再現性を見るときの段階を整理する。

個人の再現性：同じ人が繰り返し測定して、値がそろうか。
班内の再現性：同じ班のメンバーが測定しても、値が似ているか。
班間の再現性：異なる班が独立に測定しても、似た結果が出るか。

段階が上がるほど、結果の信頼性は高まる。 1回の測定で「うまくいった」と思っても、それが再現されなければ、偶然かもしれない。

冒頭の問い──「1回だけうまくいった結果から、法則と言ってよいのか」──に対する答えは、「1回だけでは言えない。再現性の確認が必要である」となる。

次の状況を読み、再現性の観点から問題点を指摘せよ。

ある生徒が、自由落下の実験を行った。高さ 2 m から鉄球を落とし、落下時間をストップウォッチで3回測定した。結果は 0.62秒、0.64秒、0.63秒であった。平均は 0.63秒で、理論値 \(\sqrt{2h/g} = \sqrt{2 \times 2.0/9.8} \approx 0.64\) 秒に近い。生徒は「理論通りの結果が得られた」と結論した。

問題点は、再現性の確認が不十分であること。

測定者が一人だけ。この生徒のストップウォッチの押し方に癖があれば（たとえばスタートがいつも遅れ気味）、3回の測定値すべてに同じかたよりが入る。3回の値がそろっていることは、正確さの保証にはならない。
器具が一台だけ。別のストップウォッチを使って同じ結果が出るかは確認されていない。
人間の反応時間の影響が評価されていない。0.63秒の落下時間に対して、反応時間（0.1〜0.3秒）は非常に大きい。ばらつきが0.02秒と小さいのは、3回ともたまたま似た反応をしたか、あるいは反応時間がスタートとストップで相殺されたかもしれないが、それ自体が確認されていない。

「理論値に近い」ことは一つの根拠にはなるが、ばらつきの評価と再現性の確認なしに「理論通り」と結論するのは強すぎる。「今回の測定では理論値と矛盾しない結果が得られた。ただし測定者1名・測定3回の限定的なデータであり、反応時間の影響が十分に評価されていない」と書くほうが誠実である。

8.6 限定つきで結論を書く

ここまでで、データの整理の仕方（平均と範囲）、ばらつきの種類（ランダムとかたより）、差の判断の仕方（平均の差とばらつきの比較）、再現性の確認を学んだ。

この節では、これらを踏まえて結論を書く方法を扱う。

次の二つの結論を比べてほしい。

結論X（強すぎる結論）

振り子の周期は糸の長さだけで決まり、おもりの質量には依存しない。 \(T = 2\pi\sqrt{L/g}\) が成立することが証明された。

結論Y（限定つきの結論）

今回の測定条件（糸の長さ 50〜100 cm、おもり 50〜100 g、振れ幅 10°）において、糸の長さを変えると周期に明確な差が確認された（80 cm で約 1.80 秒、50 cm で約 1.42 秒。差は 0.38 秒で、ばらつきの範囲 0.03〜0.04 秒を大きく上回る）。一方、おもりの質量を 50 g から 100 g に変えた場合、平均の差は 0.008 秒にとどまり、測定のばらつき（範囲 0.05 秒）より小さいため、この測定精度では質量による周期の違いを確認できなかった。これらの結果は、小角度の振り子の周期が \(T = 2\pi\sqrt{L/g}\) で近似できることを支持する。ただし、振れ幅を大きくした場合や、空気抵抗が無視できない条件での検証は行っていない。

結論Xの問題は何か。

まず、「証明された」は強すぎる。限られた条件・限られた回数の測定で法則を「証明」することはできない。次に、条件の限定がない。 50〜100 cm の範囲で確認したことを、あらゆる長さに一般化している。また、ばらつきへの言及がない。「質量に依存しない」も、「この精度では差を確認できなかった」と書くべきである。

結論Yは長い。しかし、長さには理由がある。結論Yが結論Xより強いのは、何をどこまで言えるかが読み手に見えるからである。

結論は、強く書けばよいわけではない。どの条件で、どの範囲で、どの程度まで言えるかを書くとき、結論はむしろ強くなる。

結論を書くときに使える表現を整理する。

表 8.6: 結論文で使える限定表現

表現	使う場面
今回の測定では	条件を限定する
この範囲では	調べた範囲を明示する
おおむね	完全な一致ではないが傾向は合う
明確な差は確認できなかった	差がないのではなく、検出できなかった
〜を支持する	法則が正しそうだという方向の主張
〜を示唆する	支持よりやや弱い
ただし〜は行っていない	検証していない領域を明示する

これらは第4章の「主張の強さの階段」の具体的な使い方である。

次の「結論Z」を読み、(a) 強すぎる箇所を指摘し、(b) 限定つきの結論に書き換えよ。

結論Z：「斜面の角度が大きいほど、物体は速く斜面を下る。これにより、重力加速度が角度に比例して大きくなることが分かった。」

ヒント：斜面の加速度は \(a = g\sin\theta\) であり、\(\sin\theta\) は \(\theta\) に「比例」しない。

(a) 強すぎる箇所

「速く下る」は曖昧。「下るのにかかる時間が短くなる」のか「底に到達する速さが大きくなる」のかが不明。
「重力加速度が角度に比例して大きくなる」は物理的に誤り。重力加速度 \(g\) は定数であり変化しない。変化するのは斜面方向の加速度 \(g\sin\theta\) である。さらに、\(\sin\theta\) は \(\theta\) に比例しない（小角度では近似的に比例するが、一般には非線形）。
「分かった」は断定的すぎる。測定精度やデータの範囲についての留保がない。

(b) 限定つきの結論への書き換え

今回の測定（角度 15° と 30°、斜面長 1 m、摩擦のある木製斜面）において、角度が大きいほど台車が斜面を下るのにかかる時間が短くなる傾向が確認された。この結果は、斜面方向の加速度が \(g\sin\theta\) に従って角度とともに増加するという理論的予測と矛盾しない。ただし、2条件の比較にとどまっており、\(\sin\theta\) の非線形性や摩擦の影響を分離するには、より多くの角度でのデータが必要である。

8.7 次の測定をどう改善するか

データを整理し、結論を限定つきで書いたあとに残る問いがある。 もう一度測るとしたら、何を改善すればよいか。

改善の方向は大きく分けて三つある。

8.7.1 1. ばらつきを小さくする

ランダムなばらつきを小さくするには、二つの方法がある。

測定回数を増やす。平均のばらつきは、測定回数の平方根に反比例して小さくなる。3回より10回、10回より30回のほうが、平均の信頼性は高まる。
精度の高い測定方法を使う。たとえば、ストップウォッチの手動操作を光電センサーに替えれば、反応時間によるばらつきが減る。

8.7.2 2. かたよりを見つけて取り除く

かたよったずれは測定回数を増やしても消えない。対処法は測定方法そのものの見直しである。

糸の長さを測る基準（おもりの上端か中心か）を統一する。
ストップウォッチの校正を行う。
複数の測定者が独立に測定し、結果を比較する。

8.7.3 3. 条件を広げる

限定つきの結論で「この範囲では」と書いたなら、次の測定では範囲を広げることで、結論の適用範囲を拡大できる。

糸の長さを 50〜100 cm だけでなく、20〜200 cm まで広げる。
おもりの質量を 50〜100 g だけでなく、10〜500 g まで広げる。
振れ幅を 10° だけでなく、5°、20°、30°、45° でも測る。

改善提案は「もっと丁寧にやる」ではなく、何を、どう変えれば、結論のどこが強くなるかを具体的に示すものである。

表 8.5 のデータ（質量 50 g と 100 g の周期の比較）では、平均の差がばらつきより小さく、「差を確認できなかった」という結論になった。

この結論をより強くする（もし差があるなら検出できるようにする、あるいは差がないことの証拠を強める）ために、次の測定で改善できる点を三つ挙げよ。それぞれ、なぜそれが有効かも説明せよ。

測定回数を増やす（各条件で 20〜30 回）。 平均のばらつきが小さくなるため、もし 0.008 秒の差が本物であれば、ばらつきが十分小さくなったときに「平均の差がばらつきを上回る」状態になりうる。逆に、回数を増やしてもなお差が確認できなければ、「差がない」という結論が強まる。
光電センサーなど、人間の反応に依存しない測定方法を使う。 ストップウォッチの手動操作では反応時間によるばらつきが 0.01〜0.03 秒あり、検出したい 0.008 秒の差と同程度以上である。自動測定にすればこのばらつきが大幅に減り、微小な差を検出しやすくなる。
質量の差をもっと大きくする（たとえば 10 g と 500 g）。 もし質量が周期にわずかに影響するとしても、50 g と 100 g の差では小さすぎて見えない可能性がある。質量の差を大きくすれば、もし効果があるなら検出しやすくなる。ただし、質量を変えるとおもりの大きさも変わるため、空気抵抗の影響が混ざらないよう統制する必要がある。

8.8 まとめと小演習

この章で扱ったことを振り返る。

まず、測定値がそろわないのは失敗ではなく、測定に本質的に伴うばらつきであることを確認した（セクション 8.1）。次に、データを平均と範囲で整理する方法を学んだ（セクション 8.2）。ばらつきの種類として、ランダムなばらつきとかたよったずれを区別し（セクション 8.3）、二つの条件の差を判断するには、平均の差とばらつきの比較が必要であることを示した（セクション 8.4）。再現性の確認が結果の信頼性を高めること（セクション 8.5）、結論は限定つきで書くほうがむしろ強くなること（セクション 8.6）、そして次の測定を具体的にどう改善するかの考え方（セクション 8.7）を学んだ。

以上をまとめると、次のことが言える。

この章で身につけたい力

測定データを平均とばらつきの大きさのセットで整理できる。
ランダムなばらつきとかたよったずれを区別し、それぞれの対処法を示せる。
平均の差とばらつきを比較して、差が「ある」と言えるかを判断できる。
結論の強さをデータの質に合わせて調整し、限定つきの結論を書ける。
次の測定を具体的にどう改善すれば結論が強くなるかを示せる。

第II部の全体を振り返っておく。

第5章（モデル）：何を残し、何を捨てるかを整理した。
第6章（実験計画）：何を変え、何を固定するかを設計した。
第7章（複数表現）：同じ現象を複数の表現で語り、整合性を確認した。
第8章（不確かさ）：データのばらつきを踏まえ、どこまで言えるかを判断した。

第II部は「つなぐ・組み立てる」の部であった。モデルで現象を組み立て、実験で検証し、複数の表現で伝え、不確かさの中で結論を書く── この一連の過程が、根拠のある主張を構築するための基盤である。

第III部では、組み立てた論証を比べ、批判し、改善する段階に入る。第9章では、論証の骨組みを分解して弱点を診断する方法を学ぶ。

小演習

次のデータは、ある物質を水に溶かしたときの水温上昇を3回ずつ測定した結果である。

	1回目（℃）	2回目（℃）	3回目（℃）
物質P	5.2	5.8	5.5
物質Q	5.3	5.6	5.4

各物質の平均と範囲を求めよ。
「物質Pのほうが水温を多く上昇させる」と言えるか。平均の差とばらつきを比較して判断せよ。
この結論を強くするために、次に何を改善すべきか。

(a)

物質	平均（℃）	範囲（℃）
P	\((5.2 + 5.8 + 5.5)/3 = 5.50\)	\(5.8 - 5.2 = 0.6\)
Q	\((5.3 + 5.6 + 5.4)/3 = 5.43\)	\(5.6 - 5.3 = 0.3\)

(b) 平均の差は \(5.50 - 5.43 = 0.07\) ℃。一方、物質Pの範囲は 0.6 ℃、物質Qの範囲は 0.3 ℃である。平均の差（0.07 ℃）はどちらの範囲よりもはるかに小さい。したがって、この測定精度では「物質Pのほうが水温を多く上昇させる」とは言えない。「今回の測定では、物質PとQのあいだに水温上昇の明確な差は確認できなかった」と書くのが適切である。

(c) 改善策：(1) 測定回数を増やす（各10回以上）。平均のばらつきを小さくすれば、微小な差を検出しやすくなる。(2) 物質の量を増やす。水温上昇の絶対量が大きくなれば、差があったとしても検出しやすくなる。(3) 水の量を正確にそろえる。量がずれると温度上昇がばらつく要因になる。(4) 温度計の精度を上げる（0.1 ℃刻み → 0.01 ℃刻みのデジタル温度計を使う）。

次の二つの結論を比べ、どちらがより適切かを判断し、理由を書け。

結論α：「振り子の周期は \(T = 2\pi\sqrt{L/g}\) で完全に決まる。今回の実験で証明された。」

結論β：「今回の測定範囲（\(L = 50\)〜\(100\) cm、振れ幅 10°）において、測定された周期の値は \(T = 2\pi\sqrt{L/g}\) の予測値と、ばらつきの範囲内で一致した。この結果は、小角度の振り子の周期が \(T = 2\pi\sqrt{L/g}\) で近似できることを支持する。ただし、糸の長さが極端に短い場合や、振れ幅が大きい場合については検証していない。」

結論βのほうが適切である。

理由：

結論αは「完全に」「証明された」と断定しているが、有限回の測定で法則を「証明」することはできない。結論βは「支持する」と書いており、主張の強さがデータに見合っている。
結論αには条件の限定がないが、結論βは測定範囲（長さ 50〜100 cm、振れ幅 10°）を明示している。読み手は結論の適用範囲を判断できる。
結論βは「ばらつきの範囲内で一致した」と書いており、データのばらつきを考慮に入れている。完全な一致ではなく、ばらつきの中での一致であることが明示されている。
結論βは検証していない領域（短い糸、大きな振れ幅）を明示しており、将来の検証課題が見える。

結論αは3語で終わる簡潔さがある。しかし結論βのほうが、根拠に基づいた正確な主張であり、読み手の信頼を得られる。第4章で学んだように、条件を付けることは弱さではなく、誠実さの表れである。

章末課題：不確かさを含めて結論を書く

次の題材から一つを選び、データ整理表と結論メモを作成せよ。

題材A：振り子の周期と糸の長さの関係

以下のデータを使用する。糸の長さを 30 cm、50 cm、70 cm、100 cm の4条件に変え、おもり 50 g、振れ幅 10° で、各条件6回ずつ測定した。

\(L\)（cm）	測定値（秒）
30	1.08, 1.12, 1.10, 1.11, 1.09, 1.13
50	1.40, 1.43, 1.42, 1.44, 1.41, 1.42
70	1.67, 1.70, 1.68, 1.71, 1.66, 1.69
100	1.99, 2.03, 2.01, 2.00, 2.04, 2.02

理論値：\(T = 2\pi\sqrt{L/g}\)（\(g = 9.8\) m/s²）

題材B：落下距離と落下時間の関係

高さ 0.5 m、1.0 m、1.5 m、2.0 m から鉄球を自由落下させ、各高さ6回ずつ落下時間を測定した。

\(h\)（m）	測定値（秒）
0.5	0.30, 0.34, 0.32, 0.31, 0.35, 0.33
1.0	0.44, 0.47, 0.45, 0.43, 0.46, 0.48
1.5	0.53, 0.57, 0.55, 0.54, 0.56, 0.58
2.0	0.62, 0.66, 0.64, 0.63, 0.67, 0.65

理論値：\(t = \sqrt{2h/g}\)（\(g = 9.8\) m/s²）

提出物

データ整理表
- 各条件の平均・範囲を計算した表
- 理論値との比較（理論値、測定平均との差）
結論メモ（400字程度）以下の要素を含むこと：
- この実験で確認できたこと（平均の差とばらつきの比較に基づく）
- データが理論値とどの程度一致しているか（「ばらつきの範囲内で」等の表現を使う）
- この測定の限界（検証できていない範囲、想定される誤差要因）
- 次に改善すべき点（具体的に何をすればどう結論が強まるか）

注意

「正しいことが証明された」のような断定的な結論は書かないこと。
ばらつきに触れずに平均だけで議論しないこと。
改善提案は「もっと丁寧に測る」のような一般論ではなく、具体的に書くこと。

題材A：振り子の周期と糸の長さの関係

1. データ整理表

\(L\)（cm）	測定平均（秒）	範囲（秒）	理論値（秒）	測定平均 − 理論値（秒）
30	1.105	0.05	1.099	+0.006
50	1.420	0.04	1.419	+0.001
70	1.685	0.05	1.679	+0.006
100	2.015	0.05	2.007	+0.008

すべての条件で、測定平均と理論値の差は 0.01 秒以下であり、ばらつきの範囲（0.04〜0.05 秒）より十分小さい。

2. 結論メモ（380字）

今回の測定（糸の長さ 30〜100 cm、おもり 50 g、振れ幅 10°）において、糸の長さを変えると周期に明確な差が確認された。各条件間の平均の差（たとえば 30 cm と 50 cm で約 0.32 秒）は、測定のばらつき（範囲 0.04〜0.05 秒）を大きく上回っている。また、各条件の測定平均は理論値 \(T = 2\pi\sqrt{L/g}\) とばらつきの範囲内で一致しており、この理論式が今回の測定範囲では有効であることを支持する結果が得られた。ただし、測定平均が理論値をわずかに上回る傾向がある（+0.001〜+0.008 秒）。これは空気抵抗やおもりの大きさの影響による系統的なずれの可能性があるが、現在のばらつきの大きさ（0.04〜0.05 秒）に比べると小さく、断定はできない。次の改善として、(1) 測定回数を増やして平均のばらつきを小さくすること、(2) 光電センサーで手動操作のばらつきを除くこと、(3) 振れ幅を変えて小角度近似の有効範囲を確認することが挙げられる。

題材B：落下距離と落下時間の関係

1. データ整理表

\(h\)（m）	測定平均（秒）	範囲（秒）	理論値（秒）	測定平均 − 理論値（秒）
0.5	0.325	0.05	0.319	+0.006
1.0	0.455	0.05	0.452	+0.003
1.5	0.555	0.05	0.553	+0.002
2.0	0.645	0.05	0.639	+0.006

すべての条件で、測定平均と理論値の差は 0.01 秒以下であり、ばらつきの範囲（0.05 秒）より十分小さい。ただし、測定平均は理論値をわずかに上回る傾向がある。

2. 結論メモ（400字）

今回の測定（落下高さ 0.5〜2.0 m、鉄球の自由落下、ストップウォッチによる手動計時）において、高さを変えると落下時間に明確な差が確認された。たとえば \(h = 0.5\) m と \(h = 2.0\) m の平均の差は 0.320 秒であり、各条件のばらつき（範囲 0.05 秒）を大きく上回っている。各条件の測定平均は理論値 \(t = \sqrt{2h/g}\) とばらつきの範囲内で一致しており、自由落下の理論式が今回の測定範囲では有効であることを支持する結果が得られた。測定平均が理論値を常にわずかに上回る（+0.002〜+0.006 秒）のは、ストップウォッチ操作で鉄球の着地を確認してからボタンを押すまでの反応時間の遅れ（かたよったずれ）が主因と考えられる。このずれは平均をとっても消えないため、系統誤差に該当する。次の改善として、(1) 光電ゲートなど自動計測に切り替えて反応時間の影響を除くこと、(2) 落下高さの範囲を 0.2〜5.0 m に広げて理論式の適用範囲を検証すること、(3) 鉄球の代わりに形状の異なる物体（ピンポン球など）を使い、空気抵抗の影響を調べることが挙げられる。

振り返り

何が言えるようになったか 測定データのばらつきを踏まえた上で、どこまで強く結論を言えるかを判断できるようになった。「差がある」と「差を確認できなかった」の区別、「証明された」と「支持する」の使い分けを学んだ。次の測定で何を改善すべきかを、具体的に提案できるようになった。
何がまだ危ういか この章では、ばらつきの指標として「範囲」を使った。範囲は直感的に分かりやすいが、データの個数に影響を受けやすい（データが多いほど範囲は広がりやすい）。標準偏差や信頼区間といった、より洗練された道具は扱っていない。また、「差がばらつきの何倍あれば十分か」の基準は、統計的仮説検定という枠組みで厳密に定めることができるが、本書の範囲外である。ここでは、「平均の差がばらつきより明らかに大きいかどうか」を目で見て判断する素朴な方法を学んだ。この素朴な判断力は、洗練された道具を学ぶときの土台になる。