論文の読み方ガイド
PubMed Trivia の記事は元になる論文の abstract をベースにしていますが、より深く理解したい読者のために、 科学論文を読み解くときに知っておきたい基本的な考え方をまとめました。これを読んでおくと、本サイトの記事だけでなく、 ニュースで見かける「最新研究」も冷静に評価できるようになります。
1. 相関と因果は別物
論文でいちばん混乱しやすいのが「相関 (correlation / association)」と 「因果 (causation)」の違いです。たとえば「朝食を食べている人ほど成績が良い」という相関があっても、 朝食が成績を「上げている」とは限りません。実は親の関心の高さや家庭の経済力など、第三の要因が両方に影響している 可能性 (これを 交絡因子 と呼びます) があるからです。
論文中で「X is associated with Y」と書かれている場合、それは X が Y を引き起こす と主張しているのではなく、X と Y に統計的な関連が観察されたと述べているだけです。 本サイトでは原則として「関連がある」「リスクの低下と関連」のような表現を使い、「原因」「引き起こす」とは書かないようにしています。
2. 研究デザインの強さは並列ではない
論文の結果がどれだけ信頼できるかは、研究デザインで大きく変わります。一般的に信頼性が高い順に並べると次のようになります。
- メタアナリシス・システマティックレビュー — 既存の複数の研究結果を統合し、全体としての傾向を評価する手法
- ランダム化比較試験 (RCT) — 対象をランダムに介入群と対照群に分けて比較する。因果関係を推定しやすい
- コホート研究 — 一定の集団を長期間追跡して結果を観察する
- ケースコントロール研究 — 病気になった人と健康な人を遡って比較する
- 横断研究 — ある時点での集団の状態を一度だけ調べる。因果関係は推定しにくい
- 症例報告 — 個別ケースの記述。仮説生成には有用だが、一般化はできない
本サイトでは原則として メタアナリシス・システマティックレビュー・大規模 RCT を中心に取り上げています。 横断研究や小規模な観察研究を題材にする場合は、その旨が記事の「読み解く上での注意」セクションに書かれています。
3. サンプルサイズと効果量に注目する
「統計的に有意」と書かれていても、その効果が 実生活で意味のある大きさかどうか は別の問題です。 たとえば 10万人を対象にした研究なら、ごくわずかな差でも「統計的に有意」になりえます。それが現実の生活で差を感じる レベルなのかは「効果量 (effect size)」で判断します。
論文でよく見る効果量の指標には次のようなものがあります。
- r (相関係数): 0〜1 (または -1〜1) の値。0.1 が小、0.3 が中、0.5 以上が大の目安
- Cohen's d: 2 群の平均の差を標準偏差で割った値。0.2 が小、0.5 が中、0.8 以上が大の目安
- オッズ比 / リスク比: 1 が「差がない」。1.5 倍なら 50% の増加と読むが、絶対リスクは要確認
ニュースで「2 倍のリスク」と書かれていても、元のリスクが 0.01% なら、増えても 0.02% です。 相対リスクと絶対リスクは別物なので、論文の Discussion セクションで絶対値をチェックする習慣がおすすめです。
4. p 値だけを見ない
「p < 0.05」という表記をよく見かけますが、これは「偶然このような結果が出る確率が 5% 未満」という意味で、 「結果が正しい確率が 95% である」という意味ではありません。p 値は「偶然ではなさそうな差があった」とだけ言える指標です。
近年は「p 値の過信」が科学界全体で問題視されており、信頼区間 (confidence interval, CI) や効果量も併せて読むことが 推奨されています。本サイトでも、可能な限り 具体的な数字 (人数、% など) を本文に含めるようにしています。
5. 利益相反 (COI) と資金源を確認する
論文の末尾には必ず「Conflict of Interest (COI)」や「Funding」の項目があります。 たとえばサプリメントの効果を調べた論文の資金源がサプリメーカーだった場合、結果の解釈には注意が必要です。 (もちろん企業資金の研究すべてが不当という意味ではなく、独立した別研究での再現が確認されるまで保留する、というスタンスが安全です。)
6. 撤回論文 (retracted papers) に注意
まれに、データ捏造や深刻な手法ミスが発覚して論文が 撤回 (retraction) されることがあります。 撤回後も論文自体は読める状態で残ることが多く、引用情報だけ見ると気付けません。 Retraction Watch や PubMed の「Retracted Publication」フィルタで、引用前に必ず最新の撤回情報をチェックすることをおすすめします。
本サイトでは PubMed の検索クエリで撤回論文 (Publication Type: Retracted Publication) を除外する設定にしていますが、 撤回が遅れて発生した場合は遡及的に該当記事を取り下げる方針です。
7. 再現性の問題
心理学や社会科学の領域では、過去に発表された有名な研究の 再現実験 (replication studies) が失敗する ケースが多数報告されています (2015年の Open Science Collaboration による大規模再現研究では、100 件中 39 件しか 再現できなかったと報告されました)。
そのため、1 本の研究結果だけで結論を出さず、複数の独立した研究が同じ方向の結果を示しているか を確認することが重要です。本サイトでメタアナリシスを優先しているのは、この再現性問題への配慮でもあります。
もっと深く学びたい人へ
研究を批判的に読む力を身につけたい場合、以下の概念を順番に学ぶと体系的に理解できます。
- 記述統計と推測統計の違い
- 仮説検定の枠組み (帰無仮説、対立仮説、検出力)
- ベイズ統計の考え方
- 研究倫理と IRB (倫理審査委員会) の役割
- システマティックレビューの方法論 (PRISMA, GRADE)
本サイトでは「研究用語集」もご用意していますので、用語に迷ったときはご参照ください。