用語集
Glossary
用語集です。
A
■Absolute risk reduction,ARR:絶対リスク減少
介入群と対照群におけるイベントのレート(rate)の差。NNTの逆数。
acceptance region 採択域
adjusted 修正済み
■Alpha,α: アルファ値
p値(pvalue)と同じであり、同様に解釈できる。
alternative hypothesis 対立仮説
■ANCOVA (ANalysis of COVAriance): 共分散分析
分散分析の拡張であり、モデルに連続量をふくめることができる。
■ANOVA (ANalysis of Variance): 分散分析
2つ以上の標本の平均値を比べて、標本が同じ母集団からとられたものかどうかを調べる統計手法。
arithmetic mean 算術平均
■As prescribed analysis: 対照比較試験において実際に受けた処置に従って評価する解析方法
■Association: 関連
2つの変数の関係を表す用語。
assumed mean 仮平均
asymmetric distribution 非対称分布
autoregressive 自己回帰(の)
averages 代表値
B
■Bar chart: 棒グラフ
このグラフでは、棒の高さがそれぞれのカテゴリーの出現度数を表す。
Bartlett’s test バートレットの方法
■Bayesian statistics: ベーズ統計学
事前の信条や既存のデータと、新しいデータを組み合わせて数値化する。通常のデータ解析法とは異なった手法。
■Beta,β: ベータ値
実際には間違っている仮説を受け入れる確率。1-βは研究のパワーと呼ばれる。
between (級)内
bias 偏り
■Bi-modal distribution: 双峰分布
1組のデータの中に2つの再頻値がある状態を双峰という。
■Binary variable: 2値変数
カテゴリー変数参照
■Binomial distribution: 2項分布
データが2つの値(例:男/女)のうちのいずれかしかとらない時、2項分布に従うという。
binomial theorem 二項定理
bioassay 生物検定法
bivariate normal distribution 二変量正規分布
blind test 盲検法
■Bonferroni: ボンフェロニ法
多重比較を行う際の問題点を考慮に入れた手法。
■Box and Whisker plot: 箱ひげ図
中央値、範囲、および、四分位数間領域を表すグラフ。
C
canonical correlation 正準相関
■Case-control study: ケースーコントロール研究 患者一対対照研究
リスクファクターとアウトカムの関係を調べる後向き研究。すでに特定の疾患やアウトカムを持っているケースを選び、そのような疾患やアウトカムを持たないコントロールとマッチングして、両グループに対する特定のリスクファクターの影響を比較する。
■Cases: ケース
通常は患者を指すが、病院や病棟、行政区分、血液サンプルなどを指すこともある。
■Categorical variable: カテゴリー変数
同じ範疇のさまざまなカテゴリーを表す値を持つ変数。(例:血液型、目の色 肌の色、 人種)
変数が2つのカテゴリーしか持たなければ、2値変数(例:性別)、固有の順序があれば、順序変数(例:軽度、中度、重度)と呼ぶ。
categorization カテゴリー化
categorize カテゴリーのまとめ方
■Causation: 因果関係
原因とそれがもたらした効果との直接的な関係、通常は実験研究により確立される。
■Censored: 打ち切り
打ち切り観察とは、観察期間全体の情報が得られなかったもの。通常、生存分析において、患者をしばらく追跡した後、引っ越し、研究に参加する同意を取り下げてしまったりすることで生じる。何が起こったかわからないためにこの時点以降、この患者を解析に含めることができない。
central limit theorem 中心極限定理
■Central tendency: 中心性
一組の数値の「中心」の値。
Chebyshev’s inequality チェビシェフの不等式
■Chi-squared test,x2 test: カイ2乗検定
2つのカテゴリー変数の関係を検定する手法。
classification 分類
cluster analysis クラスター分析
coefficient of concordance 一致係数
coefficient of determination 決定係数
■Cohortstudy: コホート研究
1つのグループ(コホート)を経時的に追跡し、処理やリスクファクターの影響を調べる前向きの観察研究。
common factors 共通因子
communality 共通性
comparison 比較
component 成分
conditional probability 条件付き確率
confidence coefficient 信頼係数
■Confidence interval,CI: 信頼区間
母集団の真の値が含まれることが、かなり確信できる数値範囲。 例えば95%CIとは、この範囲に母集団の値が存在すると、95%確信できることを意味する。
confidence limits 信頼限界
■Confounding: 交絡
共変量や、分離することができない因子の影響。例えば、ある症状を持つ女性が新しい治療を受け、男性がプラセボ治療を受けたとしたら、治療の効果と性別による影響を分離することができなくなる。この場合、性別が交絡因子である。
contingency table 分割表
continuous distribution 連続分布
■Continuous variable: 連続変数
ある範囲でどのような値でもとることができる変数。
control(group) 対照、制御(群)
convergence in probability 確率収束
correction 補正、修正
■Cotrol charts: 管理図
統計学的プロセス管理に用いる図。測定値がへんかし、一定の範囲を超えた時に、早期に視覚的に警告を与えることができる。
■Correlation: 相関
2つの変数の間に直線的な関係がある時、相関があるという。(例:社会経済的階級と死亡率)
■Correlation coefficient: 相関係数
2つの変数の直線関係の強さの指標。
correlation ratio 相関比
■Covariance: 共分散
相関と同様、2変数の直線関係の強さを表す。相関は-1から1の間の値をとるので、異なるデータ群を直接比較することができるが、共分散はその範囲におさまらないので直接比較できないこともある。
■Covariate: 共変量
アウトカムに影響を与える可能性があるため解析に含める必要性のある、主要変数以外の連続変数。
■Cox regression model: コックス回帰モデル
生存に影響する種々の変数の影響を探る手法。
criterion variable 基準変数
D
data データ
data analysis データ分析
■Database: データベース
すばやく簡単に検索できるように構成された記録集合。
■Degrees of freedom,df: 自由度
自由度の一人は、統計学的計算に利用できる。独立した情報の数である。
dependent variable 従属変数
■Descriptive statistics: 記述統計
平均値、中央値、標準偏差、四分位数、および、ヒストグラムなど、標本のデータを記述するもの。読者にデータをわかりやすく示すことを目的としている。
deviate 偏差
dichotomous question 二項選択法
discriminant function 判別関数
discrimination 判別
discrete distribution 離散分布
distribution 分布
■Discrete variable: 離散変数
特定の値、通常は、整数しかとらないような変数。 (例:猫の子供の数など)
■Distribution: 分布
データが独特のパターンを持つ時、ある分布に従っていると考える。色々なデータパターンがあるが、その中で最もよく用いられるのが正規分布である。
D.K.(Don’t Know) 「わからない」
dose-response curve(relationship) 用量反応曲線(関係)
double blind test 二重盲検法
drop out 脱落例
Durbin-Watson statistic(ratio) ダービン・ワトソン統計量(比)
E
efficient, efficiency 有効な、効率性
entropy エントロピー
epidemiology 疫学
error 誤差、過誤
error margin 誤差幅
estimable 推定可能
estimate 推定値
estimation 推定
estimator 推定量
event 事象
■Evidence based medicine,EBM: 根拠に基づく医療
医療において科学的根拠に基いて診療方法を選択すること。
exact probability test 直接確率法
expectation 期待値
expected frequency 期待度数
experimental design 実験計画
explanatory variable 説明変数
exploratory 探索的
exponential distribution 指数分布
F
factor 因子
factor analysis 因子分析
factor loadings 因子負荷量(係数)
factorial effects 要因効果
factorial experiment 要因実験
■Field: フィールド
場所や領域を意味する。物理的なものだけではなくて、概念的なものも含む。
finite population 有限母集団
■Fisher’s exact test: フィッシャーの直接確率法
カテゴリー変数間の関連を正確に検定する手法。
fixed-effect model 母数モデル
follow-up study 追跡研究
fractional factorial design 一部実施計画、――の一部実施(法)
free-answer question 自由回答法
frequency 度数
frequency distribution 度数分布
F statistic(ratio, test) F 統計量(F 比、F 検定)
G
genetic algorithm 遺伝的アルゴリズム
geometric distribution 幾何分布
geometric mean 幾何平均値
goodness of fit 適合度
Greco-Latin square グレコ・ラテン方格
H
harmonic mean 調和平均
hazard function ハザード関数
■Hazard ratio,HR: ハザード比
観測された一方のグループにおける特定のイベントのハザード(有害な出来事が起こる可能性)を、他方のグループにおけるイベントのハザードで割った値。HRが1とは、2つのグループ間でリスクの差がないないことを意味する。HRが2ならリスクは2倍である。HRは信頼区間を添えて用いる。
heteroscedastic, -ity 不等分散(性)
■Histogram: ヒストグラム
連続データをいくつかの階層に分けて表したグラフ。
homoscedastic, -ity 等分散(性)
hypergeometric distribution 超幾何分布
■Hypothesis: 仮説
変数間の関係を予測する、検定可能な主張。
I
■Incidence: 発生率
一定期間中に特定の症状を起こしたグループの比率、あるいは、割合。
independence 独立
independent variable 独立変数
■Inferential statistics: 推測統計
何かを検定する統計手法はすべて推測に基づくものである。研究結果が母集団において実際に差があることを示唆しているかどうかを推定する。
infinite population 無限母集団
■Intention to treat,ITTanalysis: ITT解析
対照比較試験において、被験者が実際には治療を受けていなくても、ランダムに割り付けされた群に含めて解析する方法。
inspection 検査
■Interaction: 交互作用
2つ以上の変数が互いに関係しており、独立していない時に起こる。
■Inter-quartile range,IQR: 四分位範囲
第1四分位点の下側に25%の患者、第3四分位点の下側に75%の患者が含まれる。両値の差で表される、データの散らばりの指標IQRには標本の中央部分の半分が含まれる。
interval estimation 区間推定
interval scale 間隔尺度
interviewee 被調査者
interviewing method 面接調査法
■Intra-class correlation coefficient: 級内相関係数
2つの連続変数の一致度を測る。 例えば同じテストを別の人が行った場合、どのくらい正確に繰り返すことができるかを調べたい時に用いる。
J
Jacknife ジャックナイフ
K
■Kaplan-Meier survival plot: カプランーマイヤー生存プロット
ある標本コホートにおいて、死亡が起こる度に推定生存率を再計算し、そのコホートの生存率をグラフで表す方法。
■Kappa,: カッパ値
2つのカテゴリーデータの一致度の指標。例えば同じテストを別の人が行った場合、どのくらい正確に繰り返すことができるかを調べたい時に用いる。
Kendall’s rank correlation coefficients ケンドールの順位相関係数
■Kolmogorov-Smimov test: コルモゴロフースミルノフ検定
データが正規分布に従う集団からとれたという仮説を検定する手法。
■Kruskal-Wallis test: クラスカルーウォリス検定
2つ以上の独立したグループを比較するノンパラメトリック検定法。
Kullback-Leibler information number カルバック・ライブラー情報数
kurtosis 尖度
L
lag 時間遅れ、時間差、ラグ
law of large numbers 大数の法則(strong -, weak- : 強法則、弱法則
■Level of agreement: 一致度
人やテストがどのくらい一致するか比較。
level of significance 有意水準
■Life table: 生命表
経時的に生存者の割合を示した表。 生存分析に用いられる。
likelihood 尤度
■Likelihood ratio,LR: 尤度比
特定の状態を有する患者において、検査結果が見られる尤度をその状態を有していない患者において、同じ検査結果が見られるまで尤度で割った値。
linear discriminant function 線形判別関数
■Log rank test: ログランク検定
カプランーマイヤー、または、生命表の推定値を用いて、生存率を比較するノンパラメトリック検定法。
logistic function ロジスティック関数
■Logistic regression: ロジスティック回帰
線形回帰の変形であり、可能なアウトカムが2つしかない時に用いる。
log-linear model 対数線形モデル
log-log 両対数
log-normal distribution 対数正規分布
longitudinal 継時的、縦断的
loss function 損失関数
M
Mahalanobis’ generalized distance マハラノビス汎距離
mail survey 郵送調査
■Mann-Whitney U test: マンーホイットニーU検定
2組の被験者から得た2組のデータの間に、有意差があるかどうかを調べるノンパラメトリック検定。
■Mantel-Haenszel test: マンテルーヘンツェル検定
カイ2乗検定を拡張したものであり、いくつかの2元表を比較する。この手法はメタアナリシスに応用ができる。
mathematical statistics 数理統計学
maximuim likelihood estimate(estimation) 最尤推定値(推定法)
McNemar’s test マクネマーの検定
■Mean: 平均値
観測されたすべての数値の合計を、観測数で割ったもの。
mean deviation 平均偏差
■Median: 中央値
観測された値が最小値から最大値へと順序付けされている時、真ん中の値。
■Meta-analysis: メタアナリシス
独立した複数の研究の結果をまとめて、総合的に効果を推定する手法。
■Mode: 最頻値
最もよく現れる観測値。
moving average 移動平均
multidimensional scaling(MDS) 多次元尺度構成
multiple correlation coefficient 重相関係数
multiple regression 重回帰
multi-stage sampling 多段サンプリング
multivariate analysis 多変量解析
Multivariate analysis of variance 多変量分散分析
multivariate normal distribution 多変量正規分布
MANOVA =Multivariate analysis of variance
N
■Negative predictive value,NPV: 陰性予測値
検査結果が陰性だった場合、患者がその症状を持たない可能性。
■Nominal date: 名義データ
特定の順序のない、名前がついたカテゴリーのデータ。(例:肌の色)
nominal scale 名義尺度
■Non-parametric test: ノンパラメトリック検定法
データの分布の形に依存しない検定法。
normal approximation 正規近似
■Normal distribution: 正規分布
対称的なデータ分布。グラフにすると特徴的なベル型なる。
normal equation 正規方程式
■Null hypothesis: 帰無仮説
検定を受けるグループの間に差がないという仮説。検定の結果により、その仮説を支持するか、または、棄却する。通常、帰無仮説は、実際に我々が見出したいと思うことの反対のものである。2つの治療法に「差がある」と思っているのなら、帰無仮説は「差がない」として、これを論破するために統計学的検定を行う。
■Number needed to harm,NNH: 害必要数
1人の患者がその治療による有害作用を受けるのに要する患者の数。
■Number needed to treat,NNT: 治療必要数
1人の患者がその治療による効果を得るのに要する患者の数。
O
observational error 観測誤差
observed frequency 観測度数
observed value 観測値
OC(operating characteristic)curve 作用特性曲線
■Odds: オッズ
あるイベントが起こった回数の、イベントが起こらなかった回数に対する比。稀なイベントの場合、オッズとリスクはおなじような値になるが、ありふれたイベントではかなり異なった値になる。
■Odds ratio,OR: オッズ比
一方のグループで、あるイベントが起こるオッズを、他方のグループで、そのイベントが起こるオッズで割ったもの。
■One-trailed test: 片側検定
帰無仮説が例えば、新しい治療が現在の治療より勝っているかどうかは問わず、劣っているかどうかという、一方向にのみ棄却される検定。使用は稀である。
1-way layout 1 元配置法
open-ended question 自由回答法
optimum allocation 最適割当法
ordered classification 順序化
■Ordinal data: 順序データ
例えば、最低から最高のように、順序のあるカテゴリーに分けることができるデータ。
ordinal scale 順序尺度
orthogonal polynomial 直交多項式
P
paired comparison 一対比較法
■Parametric test: パラメトリック検定法
データが特定の分布に従うことを前提とする検定方法は、すべてパラメトリック検定と考えることができる。もっとも一般的な分布は正規分布である。パラメトリック検定の例としては、t検定や分散分析がある。
partial confounding 部分交絡(法)
■Pearson correlation coefficient: ピアソンの相関係数
正規分布に従う母集団からとられた値に対して用いる相関係数。
■Percentage: パーセント
あるカテゴリーに属する個数を、グループ全体の個数で割って100を掛けたもの。
periodic 周期的
■Poisson distribution: ポワソン分布
年間死亡者数などの固定された期間に起きたイベントの数を表す分布。
■Poisson regression: ポワソン回帰
稀なイベント数を扱う回帰計算の一種。
■Population: 母集団
標本の抽出元である全被験者集団。
population correlation coefficient 母相関係数
population mean 母平均
population variance 母分散
■Positive predictive value,PPV: 陽性予測値
検査結果が陽性だった場合、患者がその症状を持つ可能性。
■Power: パワー
研究のパワーとは、統計学的に有意な差を検出できる確率である。
■Prevalence: 有病率
ある単一の時点において存在している。特定の症状を持つ患者の割合。
proportion 出現率
■Proportional hazards survival model: 比例ハザード生存モデル
生存分析モデルの1つ。一方の群におけるイベントのリスクが、他方の群におけるリスクより大きいあるいはちいさいとして、期間を通じてこの比例関係が変化しないと仮定する。コックス回帰モデルがもっともよく用いられる。
prospective study 前向き調査
■pvalue: p値
通常、帰無仮説の検定に用いて、観測された差が偶然によって出た確率を示す。
Q
quartile 四分位点
■Quartiles: 四分位数
中央値に添えて用いられる。第1四分位点の下側には1/4のデータがあり、第3四分位点の下側には3/4のデータがある。
quartile deviation 四分位偏差
quality 質
quantity 量
quantitative 量的、計量的
quota system 割当調査法
R
■r: 相関係数
2つの変数の間に直線的な関係がある時、相関があるという。相関係数は直線関係の強さを表す。
■R2: 寄与率
回帰モデルによって説明されるデータの変動の総量の推定値。
■Range: 範囲
一組のデータにおける最大値と最小値。
■Rank: 順位
一組のデータにおいて、観測値に与えられた相対的順序を示す数値。
■Rate: レート
あるイベントが一定の期間中に起こる回数。
■Receiver operator characteristic curve,ROC curve: 受信者操作特性曲線
スクリーニングテストにおいて、感度を上げるカットオフ値は特異度を下げる。ROC曲線は、スクリーニングテストのカットオフ値を変えた時の特異度と感度を表すグラフである。感度と特異度のもっともよい妥協点となるカットオフ値を選ぶ。
■Regression: 回帰
回帰、回帰分析とは、一方が他方に依存している2つの変数の関係を探る手法。
■Relative risk: 相対リスク
リスク比は、しばしば相対リスクと呼ばれるが、オッズ比も相対リスクの指標となる。
■Relative risk reduction,RRR: 相対リスク減少
介入がイベントのリスクを減少させる割合。(絶対リスク減少と比較)
■Risk: リスク
あるイベントが起こる確率。起こったイベントの数を、リスク保有者数で割って求める。
■Risk ratio,RR: リスク比
一方のグループにおけるイベントが起こるリスクを、他方のグループのリスクで割ったもの。
S
■Sample: 標本
大きな母集団から抽出された小さなグループ。
Scheffe’s test シェフェの方法
■Sensitivity: 感度
検査をした時に、特定の状態を発見する比率。その状態を持つ患者の中でテスト結果が陽性である割合。
■Significance: 有意性
帰無仮説が真である時に、その結果を得る確率。
■Skewed date: 歪んだデータ
データの分布が対称的でないこと。
■Spearman rank correlation coefficient: スピアマンの順位相関係数
ノンパラメトリック変数に用いられる相関係数。
■Specificity: 特異度
検査における疾患の可能性の除外率、その状態を持たない患者の中でテスト結果が陰性である割合
■Standard deviation,SD: 標準偏差
データの値が平均値の両側にどの程度広がっているかを示す指標。
■Standard error of the mean: 標準誤差
標本の平均値が、母集団の平均値にどの程度近いと考えられるかを示す指標。
■Stratified: 層化された
層化された標本とは、いくつかのサブグループに分けられた標本のことである。
stochastic process 確率過程
■Student’s t test: スチューデントのt検定
t検定。
■Subject: 被験者
研究における標本。
sufficient statistic 十分統計量
supervisor 責任者
survival analysis 生存時間分析
survey 調査
T
taxonomy 分類(学)
■t test: t検定
2群の平均値を比較するのに用いられるパラメトリック検定法。スチューデントのt検定とも呼ばれる。
threshold しきい値、閾(値)
■Transformation: 変換
数式を用いてデータの値を変えること。データを正規分布に従わせ、パラメトリック検定が使えるようにするために行われることが多い。
■Two-tailed test: 両側検定
新しい治療法が現在のものより勝っていても劣っていても、帰無仮説が棄却される場合の検定法。
■Type ⅠandtypeⅡ errors: 第1種及び第2種過誤
どんな統計学的検定法も、正しい仮説が棄却される(第Ⅰ種過誤)、および、間違った仮説が受け入れられる(第Ⅱ種過誤)、という2種類の過誤を犯す可能性がある。第Ⅰ種過誤を犯す確率はp値と同値である。
U
unbiased estimator 不偏推定量
unbiased variance 不偏分散
uniform distribution 一様分布
uniform random numbers 一様乱数
V
validity 妥当性
■Variable: 変数
被験者間、あるいは、時点間で異なる特質、データ解析では、変数はフィールドと呼ばれ、ケースに対して記録されたすべての事項を指す。
■Variance: 分散
値が平均値の両側にどの程度広がっているのかを示す指標、標準偏差の2乗。
variance ratio 分散比
varimax rotation バリマックス回転
variation 変動
variability ばらつき、ちらばり
W
Welch’s test ウェルチの検定
within (級)間
■WilcoXon signed rank test: ウィルコクソンの符号(付き)順位検定
対になったグループの差を比較するノンパラメトリック検定法。
X
■x2 test: カイ2乗検定
2つのカテゴリー変数の間の関係を調べる検定法。
Y
■Yates’ continuity correction: イェーツの連続補正
カイ2乗検定を補正し、p値の正確度を上げる方法。