生物统计学(biostatistics)是用数理统计的原理和方法来分析和解释生物界随机现象规律及其科学决策的学科。本课程在药学专业背景下讲解高级生物统计学原理、方法和应用技能,既有传统的常用生物统计学方法,也涉及到在大数据和AI背景下一些前沿统计学方法。
南京中医药大学生物统计学(2022秋)单元测试题答案
第1单元 绪论
- 生存分析方法是: A基础统计学方法 B经典多元统计学方法 C基于高性能计算的统计学方法 D单因素…
- 来自两个不同总体中的个体之间的差异是: A异质 B变异 C系统误差 D随机误差…
- 如何高效的从黄花蒿中提取出青蒿素成为当前有效治疗疟疾的迫在眉睫的世界问题。现某研究者对超声…
- 机器学习属于: A传统统计方法 B初等统计学方法 C基于高性能计算的统计学方法 D是一种数学…
- 为什么说科学研究实验通常是迭代进行的 A增加重复性 B增加科学性 C扩大样本量 D一次实验不…
- 统计学R.A.Fisher是实验设计方法的最早开拓者,他提出的实验设计的三原则为: A随机、对照、区组 B…
- 一般来说医学研究程序为: A边设计边实验 B先设计后实验 C有了数据后再设计 D设计与实验不分先…
- 被誉为现代统计学之父的统计学家是() ABradly Efron BCarl Friedrich Gauss CR.A.Fisher DKarl …
- 生物统计分析包括____,____
- 当研究因素和对应的水平数较多时,进行研究方案优选,宜采哪种设计? A析因设计 B均匀设计 C正交设计…
- 专业显著性与统计学差异表示是相同的内涵
- 实验设计中影响因素可以采用____表示
- 实验设计的三个基本原理是____,____,____
- 实验设计的目的是____,____,____
- 药物研究设计的三要素是____,____,____
第15单元 机器学习
- 有关R语言描述错误的: AR 是开源的、免费的 B全面的统计学语言工具 C相关资料较少 D在科研平台…
- 下述哪个方法无法获得R语言的帮助信息 Ahelp(“mean”) B?mean Cexample("mean") Dfunction("…
- 在众多机器学习模型中,下列哪种算法模型最受欢迎 A支持向量机SVM B随机森林 C神经网络 D决策树…
- 需要用到机器学习的情形有: A大量的样本 B复杂的数据结构 C个性化定制 D需要实现自动化分析…
- 哪些功能是借助于机器学习实现的? A语音识别 B股市预测 C天气预报 D自动驾驶…
- 机器学习的类型有: AAI B监督学习 C非监督学习 D强化学习
- 常见的分类学习案例有: A垃圾邮件的判别 B病理诊断 C语音识别 D手写文字…
- R语言中最常见的数据结构有: A向量 B矩阵 C数据框 D列表
- 机器学习中的模型评价有哪些方面: A准确性 B可解释性 C速度 D扩展性…
- 支持向量机SVM的优点有: A支持向量机有一个正则化参数,有助于避免过拟合。 B支持向量机提供概率估…
- 神经网路中过拟合的解决方法有: A提早结束模型训练 B正则化 C随机丢弃部分神经元 D获得更多数…
- 统计思维并不有助于科学发现,它无法对可靠性、再现性和不确定性进行量化统计思维并不有助于科学发…
- 相比机器学习,人工智能的领域要大得多,它可能涉及语言学、哲学、心理学、神经科学、数学和计算机科…
- 在某种程度上,数据科学已经做到了强调了数据的重要性多于算法的学习。…
- 强化学习(Reinforcement Learning,简称RL)是机器学习中的另一领域,强调如何基于环境而行动,以取得最大…
第14单元 生存分析
- 风险比HR指的是() A两种不同条件下死亡概率之比 B两种不同条件下生存概率之比 C两种不同条件的危…
- log-rank 检验法属于() A参数法 B非参数法 C半参数法 D回归分析法
- Kaplan-Meier法属于( ) A参数法 B非参数法 C半参数法 D回归分析法
- Cox回归的应变量是() A生存时间 B结局变量 C生存时间和结局变量 D生存率…
- 生存曲线下降的坡度越陡,表示的是() 生存时间越长 生存概率越大 生存时间越短 与生存时间无关…
- 关于生存曲线,下述正确的描述是( ) A横坐标为时间,纵坐标为生存率 B生存曲线是严格上升的 C生存曲…
- 不宜作生存分析的情况是() A女性乳腺癌患者手术之后的存活时间 B体检查出肿瘤患者的时间 C患者…
- 生存分析中,描述生存时间的集中趋势宜用的指标是() A算术平均数 B几何均数 C中位数 D百分位数…
- 生存分析中的生存时间是( ) A观察开始至终止的时间 B观察开始至失访的时间 C出院至失访的时间 D…
- 进行生存分析时,不属于截尾数据的是( ) A随访期内死于本病者 B随访期内死于其他病因者 C随访期内…
- 下述不适合使用Cox回归模型条件的是( ) A比例风险恒定 B观察个体相互独立 C协变量与时间无交…
- 两组生存分析数据的比较,不适合使用的统计分析方法是( ) Alog-rank 检验 BBreslow 检验 CCox…
- Cox回归模型中的回归系数表示的意义是() A模型预测能力大小 B危险因素相对作用大小 C自变量能…
- 危险率函数h()表示的是( ) A在时间t附近的瞬间死亡概率 B生存大于时间t的累积概率 C生存时间…
- 在生存分析中关于生存概率与生存率,下述说法正确的是() A生存概率小于生存率 B生存率不会随时…
第13单元 聚类分析
- 下述哪种距离算法对异常值非常敏感 A皮尔逊的相关性系数 B欧几里德距离 C曼哈顿距离 DSpearman相…
- Hopkins统计量描述错误的是: A通过假设观测到的数据由均匀分布总体生成的概率大小,来评估一个数据…
- 鉴定异常值的方法有: A百分位数小于2.5%或高于97.%位置的样本 B距离其均数2倍标准差之上的样本 C…
- 产生离群值的原因有: A数据收集错误 B样本污染 C异常采样 D观察值本身就存在异常…
- 聚类分析中距离测量的经典方法有: A欧几里德距离 B曼哈顿距离 C皮尔逊相关系数 DSpearman相关系数…
- 常见的聚类算法有以下两类: A无监督聚类 B划分聚类 C分层聚类
- 划分聚类常用的算法有: AK-Means BK-Medoids CCLARA DAgglomerative Clustering
- 在无监督学习中,训练样本的标记信息是未知的
- 无监督学习的目标通过对无标记训练样本的学习来揭示数据的内在性质及规律。…
- 聚类既能作为一个单独过程,用于找寻数据内在的分布结构,也可作为分类等其他学习任务的前驱过程…
- 距离度量的算法选择对于对于聚类分析影响不大
- 大多数常见的聚类算法,默认的距离度量为欧几里德距离
- 选择相关性距离时,考虑的则是指标之间变化的趋势是否相同,而非数量级的差异。…
第12单元 偏最小二乘回归
- 偏最小二乘回归中 t 表示____变量提取的主成分
- 偏最小二乘回归最常用的软件( ) AR BSPSS CSAS DSIMCA
- 偏最小二乘回归中u表示( ) Ax变量提取的成分 By变量提取的成分 C所有变量提取的成分 D考虑x、y…
- 偏最小二乘回归中,模型达到精度要求的条件是Q平方值( ) A<0.0985 B>0.0985 C=0.0985 D<0.05…
- 偏最小二乘回归,一般要求变量间具有( ) A独立性 B正态性 C相关性 D无要求…
- 偏最小二乘回归中,判断自变量重要的指标是( ) AT平方 BVIP CP值 D第一主成分…
- SIMCA软件的分析流程图包括步骤有几个____
- 偏最小二乘回归分析中异常点发现采用____
- 在xj解释Y时作用的重要性,可以采用____来反映
- Q值小于____时,模型达到精度要求
- 偏最小二乘回归分析建模的第一步要对变量进行____处理
- 偏最小二乘回归分析的最常见软件____
- 偏最小二乘回归被称为____
- 偏最小二乘法方法特点是将____,____,____有机结合起来
第11单元 因子分析
- 因子旋转时,使得公共因子的相对负荷的方差之和达到最大,且保持原共性因子的正交性及公共方差总和…
- 因子在旋转时必须保持公共因子间互不相关的要求( )
- 常用的因子提取的方法有() A主成分法 B主因子法 C极大似然法 D迭代主因子法…
- 因子旋转时,为了使新因子的意义更明确,有时放弃公共因子间互不相关的要求以使得新的因子对应的轴…
- 当因子模型得到的结果不好解释时,可以通过什么方式进行改善? ____ A主成分法 B主因子法 C因…
- 在因子模型中,不能由其他公共因子所解释的部分称为 ____ A载荷 B公共因子 C特殊因子 D共同…
- 表示m个公因子对变量xi(i=1,2,...,p)的方差贡献总和,称为第i个? ____ A载荷 B公因子 C特殊因…
- 反应第m个因子对第p个显变量的解释力大小的指标称为? ____ A载荷 B公共因子 C特殊因子 D共…
- 因子分析的目的是? ____ A研究显变量间的相关性 B研究潜变量间的相关性 C建立变量间的数量关…
- 在因子模型中潜变量又称为?() A公共因子 B因子载荷 C特殊因子D 回归系数…
- 以下哪个变量属于潜变量?____? A年龄 B教育背景 C能力 D职业
第10单元 主成分分析
- 主成分分析中,原变量xj前的系数aij反映了第i个主成分提取xj的信息,称为第i个主成分对xj的贡献,所…
- 主成分分析中,特征向量对应的分量之平方和也为1。( )
- 主成分分析中,特征向量为单位向量,即各向量的分量平方和为1。( )
- 从相关矩阵出发计算主成分时,所有主成分的方差之和等于变量的个数。( )…
- 从协方差矩阵出发计算主成分时,所有主成分的方差之和不等于各变量的方差。( )…
- 主成分可以从相关矩阵出发计算,也可以从协方差矩阵出发计算。( )
- 主成分间存在相关关系。( )
- 主成分个数的确定可以依据前k个主成的累积贡献率,通常取累积贡献率达到多少的k作为主成分分个数?…
- 下列叙述正确的是?____ A原数据经过标准化处理后得到的数据的协方差矩阵不变 B原数据经过标准…
- 为了使主成分分析能够均等地对待每一个原始变量,消除由于单位的不同可能带来的影响,我们通常进行…
- 主成分分析得到多个主成分,第一主成分、第二主成分是按什么进行排序的?____ A均数 B相关系数 …
- 下列哪个选项说法是错的?() A常用的降维方法除了主成分分析外,还有因子分析 B主成分分析在降维…
- 主成分分析的目的是____? A研究变量间的相关性 B建立变量间的数量关系从而进行预测 C降维,减…
第9单元 曲线拟合
- 下列哪个关系不是非直线关系() A人体发育过程中各种生理指标在不同年龄段时的变化 B药物剂量与实…
- 不借助计算机时,完成曲线拟合的基本步骤 A定曲线型-直线化-求方程-作图 B作图-定曲线型-直线化-…
- 拟合回归曲线的条件是 A海量数据 B资料性质与实际观察点趋势一致 C没有误差的数据 D长时间搜…
- 有关曲线拟合,下说法错误的是 A曲线拟合又称非线性回归 B曲线拟合要按照最优的曲线类型推断曲线…
- 有关曲线拟合,下说法错误的是 A曲线拟合又称非线性回归 B曲线拟合要按照最优的曲线类型推断曲线…
- 最常用的4中回归曲线: A指数曲线 B双曲线 C简单抛物线 Dlogistic曲线…
- 曲线拟合的用途有: A修匀 B估计 C求极值 D预测
- 拟合指数曲线的特点包括: AX值越增大,Y增加更快 BX值与Y值增加的程度相同 CX与Y的变化速度始终是…
- 运用统计软件拟合曲线时,应由研究者自行决断的是: A定曲线型 B绘制图形 C判断观察点的权限 D曲…
- 拟合指数曲线常采用什么方法 A自助法 B模拟法 C最小二乘法 D目测法…
- 由于抽样误差,实际资料所绘制的散点图一般难以全部通过同一条合理的光滑曲线。…
- 通过X构建曲线回归估计的Y,其有效应用范围可以超过实际观察所得X的界限…
- 当一组观察点在散点图上显示出极大点或极小点趋势时,通常都无法从现有数据中直接确定其位置…
- 估计误差越小的曲线拟合结果一定越好
- 取自人体及其他生物的各种指标,往往都有它们各自的“极限值”
- 曲线回归的意义是直线回归延伸的结果,直线回归也是曲线回归全过程中的局部。…
第8单元 多重线性回归
- 一个资料作线性回归方程,需要满足的条件有:____、____、____、____。
- 线性回归方程中回归系数的估计常采用____的方法。
- 多重线性回归模型中 是y的估计值,这个估计值指的就是给定x1,x2,……,xm条件下的y的平均值。( )…
- 常用的衡量回归方程“优劣”的标准有() A决定系数 B校正的决定系数 C剩余标准差 D赤池信息准…
- 多重线性回归分析中,反映回归平方和在因变量Y的总离均差平方和中所占比重的统计量是____ A简单…
- 对同一资料作多变量线性回归分析,若对两个具有不同个数自变量的回归方程进行比较,应选用的指标是…
- 多重线性回归分析中,反映自变量对因变量的作用大小的是____ A决定系数 B标准化偏回归系数 C偏…
- 逐步回归分析中,若增加引入的自变量,则____ A回归平方和与残差平方和均增大 B回归平方和与残差…
- 多重线性回归分析,对回归方程作方差分析,检验统计量F值反映了____ A所有自变量与因变量间是否存…
- 以下不是多重线性回归模型应用必须满足的条件是____ A因变量与自变量存在线性关系 B因变量值相…
- 现测量了102名患有动脉硬化患者的血脂,因变量为低密度脂蛋白与高密度脂蛋白含量的比值(),建立的…
- 在数据分析阶段,控制混杂因素的方法是? ____ A删除混杂因素变量 B与研究因素同时引入模型 C将…
第7单元 多元统计分析基础
- 现有同龄中学男生3名,测量其身高、体重、胸围,结果如下表。请计算这三个指标的均向量____? …
- 现有同龄中学男生3名,测量其身高、体重、胸围,结果如下表。身高与体重的协方差为() …
- 研究样品间的关系常用____,研究指标间的关系常用____
- 多元统计分析常用的统计量有____、____、____等。
- 相同数据的Person相关系数与夹角余弦没有关系。( )
- 标准化变换后变量的协方差矩阵就等于原变量的相关矩阵( )
- 协方差矩阵是对称矩阵,常常只给出矩阵的左下半部分。( )
- 相关系数矩阵不是对称矩阵。( )
- 哪三种距离是明氏距离的特例() A曼哈顿距离 B马氏距离 C欧氏距离 D切比雪夫距离…
- 哪种距离既消除了各指标的量纲影响,又排除了指标间相关性的干扰?() A曼哈顿距离 B欧氏距离 C…
- 当q=1时,明氏距离即为哪种距离?() A曼哈顿距离 B欧氏距离 C切比雪夫距离 D统计距离…
- 下列哪个距离表示二维空间中两点间的直线距离?____ A曼哈顿距离 B欧氏距离 C切比雪夫距离 D…
第6单元 均匀设计
- 均匀设计的数据分析一般采用()分析方法 A极差分析 B方差分析 C贡献率分析 D回归分析…
- 均匀设计表U n(q m)的q表示什么? A试验次数 B能安排的因素数 C表示处理数 D表示因素的水平…
- 均匀设计表的特点是( ) A整齐可比 B均匀分散 C水平数多 D可分析多个因素的作用…
- 当一个中药复方有效成分优选的研究,涉及较多因素和剂量时,适宜方法为( )。 A析因设计 B正交设计 …
- 下面哪个实验设计特别适用于因子水平数较多的研究? A区组设计 B正交设计 C析因设计 D均匀设计…
- 均匀设计中响应函数的可视化工具是____,____
- 阿魏酸的合工艺考察中选择带*号的均匀设计表是因为____顺序
- 均匀设计的基本思想是____
- 均匀设计的数据分析常采用____方法
- 均匀设计的基本工具是____
- 均匀设计表的特点是____
- 描述均匀设计表均匀性参数是____
第5单元 正交设计
- 正交设计的分析方法中,哪个方法最直观? A极差分析 B方差分析 C回归分析 D卡方分析…
- 在进行正交设计时,研究者需要了解正交表的几个表? A1 B2 C3 D4
- L 8(2) 7的正交表最多可安排几个因素? A2 B8 C7 D9
- 正交设计中的“正交”含义是() A正交表列之间的相关系数不为0 B正交表列之间独立 C正交表列之间…
- 正交设计表的特点是( ) A可安排多个因素 B可安排多个水平数 C不能分析交互作用 D均匀分散、整齐…
- 处理就是指研究因素的水平
- 正交设计必须严格按 ____来安排试验
- 正交设计数据分析方法有____,____,____,____
- 均匀分散反映了试验的____
- 正交试验特点____,____
- 正交设计的试验次数是____
- 正交表的各列间存在____
第4单元 重复测量设计
- 重复测量方差分析的小样本资料要求满足() A各组资料服从同一个正态分布 B每组资料分别服从各自…
- 对于2组4个观察时点的重复测量设计的研究,下列陈述正确的是____ A对每个时点的两组资料用成组t…
- 重复测量设计的方差分析中处理与时间效应存在交互作用是指() A每个处理组各个时间点的总体均数…
- 为研究镍对雌性大鼠卵母细胞的毒性作用,将60只雌性大鼠随机分成0mg/kg,1.25 mg/kg,2.5 mg/kg,5.0…
- 重复测量设计方差分析中有() ASS总= SS组间+SS配伍+ SS误差 BSS总= SSA+SSB+SSAB + SS误差 CS…
- 三组或三组以上服从正态分布且方差齐同的定量资料均数间两两比较时,采用t检验将会() A增加犯I类…
- 重复测量设计方差分析,如果时间点p<0.05, 那么进一步做的是( )。 A两两时间点之间的t检验。 BL…
- 将手术要求基本相同的15名患者随机分3组,在手术过程中分别采用A、B、C三种麻醉诱导方法,在T0(诱…
- 将手术要求基本相同的15名患者随机分3组,在手术过程中分别采用A、B、C三种麻醉诱导方法,在T0(诱…
- 将手术要求基本相同的15名患者随机分3组,在手术过程中分别采用A、B、C三种麻醉诱导方法,在T0(诱…
- 重复测量设计方差分析时若不满足球形对称(H-F条件),则() A结束分析 B仍继续采用一元方差分析 …
- 重复测量设计方差分析的前提条件是() A数据是定量资料。 B数据服从正态分布。 C数据服从球形…
- 重复测量设计的数据特点是() A同一个研究对象各个时间点数据彼此不独立。 B不同研究对象之间数…
- 多因素重复时,当组别和时间存在交互作用,需要研究单独效应
- 重复测量设计单变量分析时,应该满足球对称检验,不满足应该进行校正…
第3单元 析因设计
- 2*2的析因设计(两因素两水平)交互作用示意图如果平行说明( ) A两因素之间无交互作用 B因素A在B不…
- 析因设计分方差分析中,两因素A.B具有交互作用指____ A两因素A.B的主效应相互影响 B两因素A.B有…
- 某中医院用中药复方治疗高胆固醇症,将12例高胆固醇病人随机分为4组治疗:第一组用一般疗法;第二组…
- 2*2析因设计方差分析中有____ ASS总= SSA+SSB+SSAB + SS误差 BSS总= SS组间+SS配伍 CSS总= SS…
- 方差分析基本思想____ A组间均方大于组内均方 B组间均方大小于组内均方 C两方差之比服从F分布…
- 例 在一项动物实验研究中,将40只雌性小鼠做成哮喘动物模型,然后随机分为4组,接受A和B两种药物不同…
第2单元 药学研究设计基础
- 随机区组设计资料的方差分析中,为推断处理因素是否起作用,所查方差分析用F界值表中的分母自由度为(…
- 效应指标的选择从专业上讲主要是要考虑( ) A系统误差和随机误差 B客观性 C灵敏度和特异度 D定…
- 某研究者在5种不同的温度下分别独立地重复了10次试验,其测得某定量指标的50个数值,根据资料的条件,…
- 64只大鼠随机均分到4种不同的饲料组去,饲养一段时间后,观测每只鼠的肝重比值(即肝重/体重),希望评价4…
- 研究某新药治疗失眠的效果,需要控制受试对象心理因素对试验结果的影响,应设立( ) A实验对照 B空白对…
- 关于方差分析的思想正确的是( ) A将均方进行分解 B将离均差平方和进行分解 C与t检验原理一样 …
- 关于完全随机区组设计,下面正确的是( ) A是单因素设计 B是两因素设计 C两因素设计,且两因素的…
- 关于SNK检验(即q 检验)、Dunnet t检验和LSD-t检验,下面说法正确的是( ) ASNK法与t检验原理一一样 B…
- 为什么多组资料的样本均数比较不能用t检验? A增加了一类错误 B增加了二类错误 C增加了系统误…
- 实验设计时,设立对照可以( ) A排除抽样误差对分析的干扰 B减少第一类错误 C排除非实验因素对分…
- 随机化的作用有____,____,____,____
- 关于均衡性的最理想设计是____,____
- 最好的对照满足条件是____,____,____
- 选择动物研究对象遵循的3R原则是____,____,____
- 实验因素需要注意要点是____,____,____
第16单元 Bootstrap估计与Permutation检验
- 在R语言中,可以被用于进行置换检验的软件包是: Amath Bggplot2 Ccoin Dcorr…
- 有关随机种子数的描述错误的是: A置换检验都是使用伪随机数来从所有可能的排列组合中进行抽样 B…
- 在R语言中,可以用于计算可信区间的软件包是: Avcd Bcorr Cggplot2 Dboot…
- 可以进行Kruskal-Wallis检验的coin函数是: Akruskal_test(y ~ A) Bwilcox_test(y ~ A) Cchisq_t…
- coin 包提供了一个进行置换检验的一般性框架,可以回答如下哪些问题: A响应值与组的分配是否独立 B…
- 置换检验真正发挥功用的地方是 A非正态数据 B存在离群点 C样本很小 D无法做参数检验…
- 当数据呈现什么特点时,传统的参数检验是很有效的 A近似正态 B无离群点 C数据量大 D抽样误差大…
- boot包中的boot() 函数调用生成统计量函数statistic 多次,每次是基于数据data进行采样,然后基于采…
- Bootstrap无需假设一个特定的理论分布,便可生成统计量的置信区间并能检验统计假设…
- 置换检验主要用于生成检验原假设的p值,它有助于回答“效应是否存在”这样的问题…
- 即便初始样本对其总体代表性很差,置换检验也可以提高推断效果。
- coin包中的function_name函数中的distribution="exact"时,当前仅可用于两样本问题…
- 此时人们往往求助于非参数检验,非参数检验不再关注数据的值,而只关注数据的秩…
- 如果样本不能很好的代表总体,任何检验方法都是无效的
- 置换方法和参数方法都计算了相同的t统计量,所以原理也是相同的