嘉鱼热线欢迎您!
您现在的位置:主页 > 科研成果 > >详细内容

溶栓是患者的两种对立状态(溶栓与未溶栓)中一种较

来源:/ 作者:嘉鱼热线 发布时间:2015-09-02 20:53 【字体: 点击数:
分享到: 更多

《科学观察》保留所有权利。

我国的科研质量和发展速度就会得到大幅度提高。

【版权声明】 以上《影响我国科研成果和学术论文质量的要因分析》之图文信息归《科学观察》所有。未经《科学观察》书面许可,科研工作者和杂志编辑自身统计学水平逐渐提高,科技管理政策到位,很有效很成功的“逆向统计学教学法”。

若统计学教材和教学质量高,而且可以使学习者真正提高统计学的理论水平和解决实际问题的能力。这就是笔者提出并经过教学实践证明,不仅可以使统计教学达到事半功倍的效果,发挥其主观能动性和创造性,调动他们主动钻研统计学的积极性,使学习者对统计学产生浓厚的学习兴趣,来开展生动活泼的统计教学,并组织统计学讨论课等方式,要改革统计学教学方法。通过对误用统计学案例的辨析与释疑、让学生去亲自查找著名学术期刊上论文中的统计学错误,发现此理论深受实际工作者的青睐。

其次,通过教学实践,具有很大的实用价值,此理论是正确的,大量的教学实践证明,它正是无数实际工作者希望学会统计学、用对统计学所需要的理论和方法,笔者将其概括为“统计学三型理论”,将有利于合理运用统计学,正确揭示每个实际问题中的这“三型”,寻找灌输统计学理论和方法的突破口。笔者通过大量的教学实践发现:很多科研工作中与统计学有关的问题都可分解出“表现型”、“原型”和“标准型”,要在理论结合实际上狠下工夫。听听科研成果转化。应从实际工作者思考问题和解决问题的习惯思维中,服务于科研,教材应源于科研,应设法提高统计学教材的质量,此处不再赘述。

首先,在生物医学科技领域内表现得尤为明显。原因已在前面述及,与大学和研究生阶段的统计学教材质量和教学质量有直接的关系。这一点,积极营造一种科学严谨、求真务实、勇创难关的科研氛围。

若问我国科研人员科研设计与统计分析水平不高的症结何在?可以肯定地说,奖励那些创造出真正高水平科研成果的科研工作者,应该有科学的奖惩制度。应该严惩科技活动中的权钱交易、弄虚作假、伪劣成果的制造者,应追究其科研产出的数量和质量,并且应通过有效的监督检查机制来付诸实施。成百上千万的大型科研课题分配下去了,应以科技政策和法规的形式明文规定出来,科研管理者和科研工作者分别应承担哪些职责、义务和应享受哪些待遇,在科技政策上明确体现并付诸实施“重视科学、实事求是、尊重人才、任人唯贤”。其实状态。

6.2.3 我国应高度重视高校统计学教材建设与教学方法改革

在科研活动中,应引入竞争机制,千万不能搞“权钱交易、任人唯亲”,要在“质量、速度和效益”上下大功夫,都应有科学、严格的科技管理和监督检查的政策与法规来指导和制约,等等各方面,学术期刊的审批和论文质量把关,代表国家水平的各类教材(如全国统编本科和研究生医学统计学教材)的质量审查,科技人员的继续教育和职务、职称晋升,科技期刊的审批、质量管理和评比,有关领导者和决策者应当在指导思想上引起高度的重视。在科研课题的立项、管理、监督、检查验收和成果评审,而且不是一朝一夕就能得到提高的,科技工作者的科研素质是至关重要的,要解决好这个大是大非问题,促使各级科研管理工作者和全体科研工作者千方百计提高科研质量。

应当清醒地认识到:我国科技工作的科学性与严谨性方面所面临的形势十分严峻,一般都能顺利通过官方组织的“考核或鉴定”。国家应加大对科研课题和科研成果的统计学检查与监督力度,但到最后,科研成果水平一般,导致科研课题完成的质量不高,盲目蛮干,也不愿邀请统计学工作者参与合作,即使对统计研究设计和统计分析知之甚少,照样通过了评审。有一种奇怪的现象:有些科研工作者获准大的科研课题后,显得重视程度很不够。因为有些科研课题和科研成果存在明显的统计学问题,有各方面的专家参与审评工作。但在统计学检查与监督方面,虽然也比较严格,因为真理只属于那些科研态度严谨、科研作风踏实、专业基础过硬、坚持不懈努力的人。

6.2.2 我国应加强科技政策与法规建设

我国在科研课题和科研成果的审批中,认真学好统计学。千万不能单凭“学术权威”和“老资格”盲目进行科学研究和轻率地作出结论,应当树立“活到老学到老”的精神,科研工作者、特别是科技领头人,而且可以大大提升科研课题的研究质量和水平。所以,不仅可以节省人力、物力、财力和时间,若能灵活正确地运用统计学,而且是拓宽科研思路、夯实科研根基、扫清科研障碍和呈现科研精华的一根魔杖。在科研工作中,一个称职的学术期刊编辑和管理者应当具有较高的统计学水平。

6.2.1 在科研课题和科研成果审批中应加大统计学检查与监督力度

6.2 间接影响因素的解决办法

统计学不仅是从事科研工作的一个重要工具,应该自觉刻苦学习和钻研统计学知识,在统计学方面绝对不能是“门外汉”,两种。应当清楚地意识到:统计学质量高低是学术期刊质量优劣的重要标致之一。作为学术期刊的审批者、评价者和编辑出版者,应坚持“宁缺毋滥”的原则。

6.1.3 努力提高科研工作者和科技领头人的统计学水平

学术期刊编辑和期刊质量管理工作者应高度重视学术期刊的质量,使他们对拟发表的每一篇稿件严把统计学质量关。对审阅的稿件能否发表,调动他们的积极性,应采取任务招标的方法,但他们可以发挥统计学专业的研究生的作用,特别是称职的统计学专家。虽然统计学专家人数很少,编辑部应舍得投入人力和财力聘请高水平的稳定的审稿专家,仅供我国科技政策制定者、管理者、统计学教学工作者和广大科研工作者参考。

6.1.2 努力提高学术期刊编辑和期刊质量管理工作者统计学水平

学术论文质量把关的关键环节在杂志编辑部,笔者提出以下相应的对策与建议,为了从根本上扭转不利局面和大幅度提高我国科研成果和学术论文的质量,最多应付考试或考查。

6.1.1 加强杂志编辑部对稿件中统计学质量把关的力度

6.1 直接影响因素的解决办法

针对上述提及的影响我国科研成果和学术论文质量的六个因素,因而他们不会自觉钻研统计学,只能使学生增加厌烦情绪,关键在于高水平的统计教学方法。如果仍采用“满堂灌”的“填鸭式”的传统教学模式,要想培养起他们对统计学的浓厚兴趣,此时,学习统计学是一件繁琐、枯燥乏味的事。学生的学业负担很重,统计学教学方法需要改革。在非统计学工作者看来,一般都不重视统计学课程的学习。

6 提高我国科研成果和学术论文质量的对策与建议

其三,因此,对统计学的重要性缺乏了解,学生没有从事科研工作的经历,教学课时又比较少,高等医药卫生院校对统计学课程的重视程度需要加强。有些院校将统计学列为选修课或考查课,其教学效果是可想而知的。

其二,用满载标准型理论的统计学教科书去教学,而且也没有从认识上提出想法,现行的统计学教科书不仅没有从方法上提出对策,对于这样的问题,根本无法将表现型直接转变成标准型,有些问题因科研设计上的缺陷,而且,将其正确地过度为统计学教科书中的标准型,实际科研工作者不会透过问题的表现型的本质(即问题原型),统计学教材需要革命。卫生或医学统计学教材的编制体系和内容与统计学的实际应用之间差距过大。教材中经统计学工作者反复加工过的标准型与科研工作中实际问题的表现型之间缺乏桥梁,对于科研成果。究其原因主要有以下三方面:

其一,几乎是一用就错,尤其是在统计研究设计方面显得知识极其匮乏。许多人学了多遍统计学仍不得要领,统计学的误用率高得惊人,他们中的绝大多数仍属盲目套用统计学者,但很多来自高等院校的本科生、硕士生和博士生进入科研、临床和教学等工作岗位后,立刻通知作者邮寄几百元论文发表费。

尽管全国各高等院校(特别是医药卫生院校)都开设了统计学(如数理统计学、卫生统计学或医学统计学)课程,采取的经营策略是:稿件一收到,却没有相应的监督检查、考核的机制;有些科技期刊编辑部过分追求经济效益,却没有非常有效的政策与法规来制约、来监督检查和管理;科研人员、临床医生和科技期刊的编辑的统计研究设计与统计分析水平离实际要求相距较大,他们常被无情地踢开。

5.2.3 我国高校统计学教材与教学方法远远不能满足科技事业的发展需要

科研课题、科研成果、学术期刊中的科研设计与统计分析错误很多,一旦课题被批准,统计学工作者常被拒之在大型科研课题的门外。更令人难以容忍的是:统计学工作者常被当作合作申请基金课题的“敲门砖”,在实际科研工作中,需要有造诣深、经验丰富的统计学工作者从头至尾参与。然而,统计研究设计与数据的统计分析是不可回避的且具有较高难度的艰巨任务,其中,科研成果转化。原本需要多学科科研人员协同攻关方可高效率高质量地完成,我国期刊编辑部显得不够严格。

5.2.2 我国科技领域缺乏关于科研工作科学性与严谨性要求的科技政策与法规

一些多因素多指标的科研课题,相比之下,在对稿件中统计学质量把关方面,指出他们的论文中有许多统计学应用错误。实事求是地说,对论文的科学性要求很高,他们说国际上有些高档次的杂志编辑部审稿很严,问其原因,但他们向国外著名杂志投出的许多稿件却被无情地退了回来,发现他们所做的科研工作本身水平很高,的确有点心有余而力不足。

5.2.1 我国的科研课题和成果审批缺乏严格的统计学检查与监督

5.2 间接影响因素

有时,对引领年轻科技工作者进行高水平的科技创新工作,这显然与他们的学术头衔和学术地位不太相称,笔者看到他们在科研设计与统计分析方法合理选用方面还有较大的差距,从他们提出的问题、已做的科研课题和已发表的学术论文中,有院士、专家、教授、博导、硕导、博士后、博士等高学历高学衔的学术权威和学术带头人,相比看论文科研成果。出错是必然的。

在向笔者直接或间接进行过统计咨询的科技人员中,其发表的学术论文若不请统计学工作者严格把关,将期刊中论文的“科研设计与统计分析质量”排斥在评价标准之外!在这样的情况下,他们很难察觉出来;笔者惊奇地发现:期刊质量管理部门在评审各类期刊时,对稿件中各种统计学错误,因此,发现他们对统计研究设计和统计分析方法方面的知识了解甚少,这是科研成果和科技期刊中统计学错误很多的一个重要原因。

5.1.3 科研工作者和科技领头人对统计学重要性的认识和统计学水平亟待提高

笔者在统计咨询和审稿工作中接触过大量医学期刊的编辑,全靠他们来审阅科技成果和学术论文是不明智的做法,但对于统计研究设计和资料的统计分析就比较陌生了。因此,科技专家对本专业的内容可能非常熟悉,舍不得投入人力、物力和财力。

5.1.2 学术期刊管理者和编辑者对统计学重要性的认识和统计学水平亟待提高

人常说:隔行如隔山,在学术论文的质量把关上,杂志编辑部对于统计学在科研工作中的作用和地位认识不足,只有数量很少的论文是经过统计学工作者把关过的。这充分说明,只有少数几个包含了1?2位统计学专家。而且在发表的如此众多的学术论文中,但在这些非统计类专业期刊编辑委员会中,我国的科技期刊有数千种,概括起来有如下几类。

从规模上来看,有些间接原因正是导致我国科研成果和学术论文质量差的最根本原因,从深层次上来剖析,有些是间接的,有些是直接的,科研成果。其科学性与严谨性主要体现在统计学应用的合理性与正确性上。为何我国的学术论文中统计学误用率会如此之高呢?其原因是多方面的,很多调查或实验性研究的学术论文,至少应有两个水平)。更确切且易于理解的表述应当是:吸烟和饮酒易于使受试对象患肺癌。

5.1.1 杂志编辑部对论文中统计学质量把关不严

5.1 直接影响因素

如前所述,“是否吸烟”和“是否饮酒”才是患肺癌的危险因素(即任何一个被称为因素的影响条件,也就是说,饮酒是相对于不饮酒而言的,医疗科研成果。却是错误的。因为吸烟是相对于不吸烟而言的,听说科研。这句话似乎谁都可以理解。但从统计学角度看,如人们常说:“吸烟和饮酒是肺癌的危险因素”,无法解释清楚。类似的例子还有,使一个简单问题变得十分复杂,即“出现心功能不全”与“未出现心功能不全”。原作者把原因变量的一个水平与结果变量的一个水平强行扯到一起,它也有两个水平,即“溶栓”与“未溶栓”;结果变量为是否出现心功能不全,它有两个水平,原因变量为患者所处的状态,对“因素与水平”、“变量与其取值”之间的关系解释不清。在例1中,还反映科研工作者对于某些统计学的基本概念不够清楚。具体地说,其专业结论为:未溶栓组心功能不全发生率45.5%(=162/356)高于溶栓组心功能不全发生率34.7%(=75/216)。

5 影响我国科研成果和学术论文质量的要因分析

例2 在例1中,说明两者之间的差别有统计学意义,P<0.05,因c2 =6.422,c2 检验回答的问题是:溶栓组心功能不全发生率与未溶栓组心功能不全发生率之间的差别是否具有统计学意义,在这个2´2表资料的分析中,还是想说两者之间的差别较大呢?含糊其词!事实上,究竟是想说两者之间的联系密切,“发现两者的联系有统计学差异”,一个好的“原因”与一个坏的“结果”之间是无法进行相关分析的;再看结论的后半句,而心功能不全是患者可能出现的两种结果(出现心功能不全与未出现心功能不全)中的一种坏结果,因为c2 检验并不是“相关分析”方法;溶栓是患者的两种对立状态(溶栓与未溶栓)中一种较好的状态,“溶栓与心功能不全的相关分析”这句话是错误的,前言不答后语”。首先,这个结论是“慷慨陈词,发现两者的联系有统计学差异。请问:这个结论说明了什么?可以说,P<0.05。原作者所下的结论为:溶栓与心功能不全的相关分析,得:?c2 =6.422,事实上科技成果。出现心功能不全者162人。该医生采用2´2表c2 检验,出现心功能不全者75人;未溶栓组患者356人,即溶栓组患者216人,收集到如下临床资料,仍有可能会出错。

例1 某临床医生为了研究心功能不全与溶栓的关系时,由于存在种种原因,陈述结论时,还应给出关于总体参数的95%置信区间。

假定一个科研课题从统计研究设计到做完统计分析的每一步都正确,这是绝对不够的!应给出检验统计量的值、具体的P值;若报告与推断总体有关的结果时,仅给出“P>0.05”或“P<0.05”或“P<0.01”的信息,而不是“增加”2.4倍。

4.5 结论陈述错误

例3 很多科研工作者在学术论文中报告所获得的统计分析结果时,说明心肌梗塞者中血浆Lp(a)>30mg/dl者与血浆Lp(a)<30mg/dl者人数的比值是未患心肌梗塞者中相应比值的2.4倍,因OR(优势比)=2.4,完整的结果报告还应给出logistic回归分析的参数估计和假设检验结果;主要错误出在结果解释上,报告结果尚不够完善,95%可信限1.630~3.594)。请问:这样解释和报告结果正确吗?此处,心肌梗塞的危险性增加2.4倍(OR=2.4,有如下结果:Logistic回归分析结果显示:血浆Lp(a)>30mg/dl者,则患者易于死亡。

例2 某科研工作者在研究“心肌梗塞和脑血栓患者Apo(a)五核苷酸重复序列基因多态性及与血浆Lp(a)水平的关系”时,若SARS(即“非典”)合并糖尿病患者的LDH的测定值高,这属于滥用“相关”这一统计学名词概念!正确地解释为:平均说来,这不能解释成“转归”与“LDH”之间有相关关系,死亡组LDH均数大于治愈组LDH均数,转归分为“死亡”与“治愈”,P=0.0017)。请问:这样解释结果正确吗?通过仔细阅读原文可知:LDH(IU/L)的测定结果在死亡病例组和治愈组分别为:死亡组:825.59±247.82;治愈组:366.24±149.08。由此可见,发现患者最终转归与LDH的高低显著相关(r=-0.3596,写道:一种。多因素logistic逐步回归分析,常作出错误的解释。

例1 某人在研究“SARS合并糖尿病死亡原因分析”时,由于对所使用的统计分析方法的原理理解不够准确,这样做可能会失去很多好的自变量组合的机会。

在解释统计分析结果时,也就是说,对因变量贡献变大的自变量是很不利的,对于单独作用小且与其他某个或某些自变量同时存在时,将具有统计学意义(即假设检验的结果为P<0.05)的那些自变量引入多重回归分析的过程之中去。学会科研成果怎么写。显然,即先进行简单线性回归分析(即每次只考察一个自变量),相当多的科研工作者采取的筛选变量的策略是错误的,得出脱离实际的专业结论。

4.4 结果解释与报告错误

例4 在进行多重回归分析时,用线性关系去描述非线性关系,盲目拟合线性回归方程,常视变量之间的曲线关系而不顾,常盲目套用c2 检验。

例3 在研究一个结果变量与一个或多个原因变量之间依赖关系时,也不管分析的目的、影响因素的数目和资料所具备的前提条件,很多科研工作者却不管定性的结果变量是二值变量、多值有序变量还是多值名义变量,很多科研工作者却误用成组设计定量资料的t检验或单因素多水平设计定量资料的方差分析方法作了处理。

例2 对于结果变量为定性变量的科研资料,原本应选用相应设计定量资料的方差分析方法处理,计算结果也难免出错。

例1 很多取自多因素设计的定量资料,但有时因方法选择不当,尽管可以借助国内外著名的统计分析软件来实现,甚至完全是错误的。对于复杂的统计计算问题,常常选用的统计分析方法不恰当,因此,只能一知半解地盲目套用统计学教科书上的方法处理自己的科研资料,中一。但又没有与统计学工作者开展科研协作的动力和习惯,而很多科研工作者常对复杂的统计分析方法望而生畏,需要的统计分析方法就比较复杂,只要资料中包含的影响因素多、观测指标多,掩盖事实真相。

无论是调查研究资料还是实验研究资料,其结果是过分夸大相对数的作用,很多科研工作者经常犯的错误是将百分比与百分率混为一谈;分母很小时也计算相对数,图形反映的变化趋势是假象。

4.3 统计分析方法选择与实施错误

例4 在表达相对数时,等长的线段代表的数量不等,要么坐标轴上所标的刻度值违反数学原则,要么所选用的统计图类型与资料性质不吻合,令人费解;用统计图表达实验资料时,表中数据的含义表达不清楚,其结论必错无疑。

例3 用统计表表达实验资料时,因此,这与原先的研究目的不匹配,却不得不选用错误的统计分析方法(如c2 检验、秩和检验等)处理资料,由于列表错误,原本应选用一致性检验(或称kappa检验)处理此类定性资料,却采取按每一种方法测定结果分别进行分类计数(其表现形式为2´4的长表),本应同时按两种方法的测定结果进行分类计数(其表现形式为4´4的方表),甚至是错误的。其实科技成果。

例2 很多科研工作者希望比较两种实验方法或测定方法对同一批受试对象先后测定的结果(假定测定结果可分成优、良、中、差4档)是否一致,其结论也就很值得怀疑,必然要误用统计分析方法,这就把“具有一个重复测量的两因素设计”错误地当作“具有独立重复实验的两因素析因设计”了,则认为总样本量(即受试对象个数)为120人,全部测定数据的个数为4´5´6=120个。若像前述那种方式记录实验结果,则实际总样本量(即受试对象个数)N=4´5=20人,共有6个时间点,每组5个受试对象,而不管哪些数据是重复测自每一个受试对象身上的。假定实验共分为4个实验组,这叫作“具有重复测量的设计”。很多科研工作者仅按时间点记录各组的测定结果,又在多个不同时间点上对其重复观测同一个定量指标的数值,得出错误的结论。

例1 对接受不同处理的几组患者(或动物)中的每一个,有时影响对资料的表达质量和效果;有时直接导致误用统计分析方法处理资料,是指测定观测指标并记录观测结果、整理资料、表达资料、描述资料的集中和分散情况等。这方面的错误,具体例子从略。

资料收集与加工,因篇幅所限,如对照过剩、假对照、对照不全、缺乏必要的对照组、盲目设立对照组等,违反实验设计的对照原则的形形色色实例不计其数,严重违反了实验设计的重复原则。

4.2 资料收集与加工错误

科研工作中,每个小组动物数n=1,实验共分为15个小组,然而,看上去不算太少,虽然总动物数N=15,得出专业结论。在此项实验研究中,然后观察组织病理变化情况,每组3只(每个组的3只动物分别随机注入0.6ml、1.0ml及4.0ml 1%甲紫溶液),以消除个体差异及增龄对实验结果的影响。按注入甲紫后1周、2周、1个月、3个月及6个月将15只动物随机分为5组,另一侧作为正常对照,雄性9只、雌性6只。每只动物任选一侧腮腺为实验侧,其临床研究的结论是没有说服力的。

例2 为了观察甲紫注入小型猪正常腮腺后组织病理变化情况,有人选择6月龄、体重20?25kg的中国实验用小型猪15只,因此,两组在很多方面是不均衡的,应属于假对照),你知道怎样申报科研成果。属于历史对照;从本质上看,对照组起不到真正对照的作用(从形式上看,两组患者自身条件以及两个时间段上医疗条件都相差悬殊,无法做到随机化,此研究中严重违反了随机、对照和均衡三个原则。两个时间段上的患者前后对照比较,观察血管内皮eNOS、支气管上皮iNOS、巨噬细胞iNOS(%)的取值。显然,男22例、女12例。根据手术时间将患儿分为对照组(1998年8月前)和肺保护组(1998年8月-2000年3月),采用手术治疗合并重度肺动脉高压先心病患儿34例,严重违反实验设计四个基本原则中的一个或多个的学术论文俯拾即是。

例1 某临床医生在其投稿的论文中这样写道:自1996年11月至2000年3月,在公开发表的许多科研论文中,就可能会影响结论的正确性。然而,在这四个基本原则中的任何一个原则上出了问题,就比较有意义了。

随机、对照、重复和均衡是实验设计的四个基本原则。一项RCT研究,就没有什么意义;若选取“血清总IgE等”为观测指标,若选取“身高、体重、血小板等”为观测指标,极易得出错误的结论。如研究哮喘与某些基因之间的关系时,反而会产生误导,这些指标不仅不能正确反映实验因素的实验效应,但却会毫无根据地选择一些指标(特别是人为打分的主观指标),研究者并不是十分清楚,选用哪些观测指标来准确地反映实验因素的实验效应,这就属于确定实验因素方法的错误。

4.1.4 科研工作严重违反实验设计的四个基本原则

例3 有时,使国家大量的科研经费付诸东流,使投入远远大于产出,必然浪费人力、物力、财力和时间,而盲目选定一些实验因素进行大规模实验研究,不通过预实验去摸索情况,这就属于选用受试对象方面的错误。

例2 有些实验研究的结果所受影响因素尚不清楚时,而直接选用人体作为受试对象,本应选用动物作为受试对象,对药物的安全性和有效性还知之甚少时,特别是药物研究,此类科研是严重违反伦理道德的!

例1 有些实验研究仍处在探索阶段,怎样申报科研成果。就武断地采取完全随机分组方法将患者分到实验组与对照组中去。显然,也未获得受试者的知情同意,研究课题未经伦理委员会批准,治疗的疾病并非是慢性病,选用安慰剂作为对照药,经常能看到这样的科研课题——为了研究某种新药的疗效,哈佛大学在中国农村进行的人体研究存在严重的道义问题。

受试对象、实验因素和实验效应(通过观测指标来体现)是实验设计的三要素。

4.1.3有些科研工作在实验设计三要素上考虑不周

例2 在审稿中,这些均侵犯了参与者的知情权。美国联邦政府“人类研究保护办公室”的报告指出,而且合同中所使用的是中国农民难以理解的复杂语言,想知道医疗科研成果。并未向参与者报告接受X光及肺功能测试的危险及会产生不舒服症状等问题,但他们根本不知道自己和家人的血样被送到何处以及派了何种用途。该研究在开展之前,先后被抽了两次甚至多次血样,对象是安徽大别山区岳西县的农民。这里数以万计农民全家参加了“体检”,是以哈佛大学公共卫生学院和安徽医科大学合作的名义进行的,肆意浪费令人心酸。

例1 据2002年5月23日《文摘报》转载2002年5月16日《城市晚报》的一则消息:哈佛校长在北大演讲认错——承认在中国农村进行十五项人体研究是极其错误的。美国哈佛大学人体研究计划始于1995年,科研经费人民血汗,错误结论害人不浅,统计方法胡乱套用,实验资料残缺不全,其后果是:设计方案千窗百孔,随心所欲搞科研”,即“拍着脑袋定方案,导致无法用正确的统计分析方法去处理所得的科研资料。用一句形象的语言来形容此类研究者的做法是非常恰当的,溶栓是患者的两种对立状态(溶栓与未溶栓)中一种较。但它们之间的相互关系却没有完全表达出来(简称对照不全错误),虽然调查或实验研究在本质上涉及多个影响因素,其结果是:很多组间缺乏可比性,在这几个组决定的特定条件下进行实验研究,会想当然地设置几个组,又受到研究条件(时间、人力、物力、财力等)的限制,由于他们奇缺实验设计知识,常考虑很多的影响因素,其结论的可信度可想而知。

4.1.2 科研设计严重违反伦理道德

例2 很多实际工作者为了实现一个很复杂的研究目标,其实漏洞百出,看似严谨,前后矛盾,文不对题,写出来的论文,即把原本属于回顾性研究范畴的“病例对照研究设计”错误地当成前瞻性研究范畴的“队列研究设计”了。医疗科研成果。因此,却按前瞻性方式去描述,撰写科技论文时,现分述如下。

例1 很多科研工作者(特别是临床医生)经常对已做过的科研工作进行回顾性总结,即统计研究设计错误、资料收集与加工错误、统计分析方法选择与实施错误、结果解释与报告错误和结论陈述错误,其统计学误用率约为80.0%。

4.1.1 设计类型概念模糊

4.1 统计研究设计错误及其实例

我国科技论文中统计学错误主要包括以下五大类,其错误率分别为38.32%和52.78%;若将非基金类论文一起考察,立状。其中存在统计学错误的论文分别有151和19篇,发表国家自然科学基金和国家重点基础研究发展规划项目的论文分别为394和36篇,其错误率分别为36.18%、36.84%和45.07%;若按基金类别分,其中存在统计学错误的论文分别有212、14和32篇,发表国家级、军队级、省部级基金项目的论文分别为586、38和71篇,2000年到2004年的五年间,据不完全统计[18],科研设计方面的错误率约占30.0%。(3)就拿获得国家级科技期刊奖的某些医学杂志来说,单位为“篇”)。(2)国内外许多调查研究表明[4-7,12-17]:科技期刊论著中统计学误用率相当高,其统计学方面的错误率平均约为88.0%(315/358,认为值得发表的稿件中,可以从数量上向人们展示我国科技期刊论文中统计学方法误用的程度与现状。(1)在笔者为我国某些知名医学期刊审稿中发现:经过两位以上医学专家审稿,导致结论错误。

4 我国科技论文中统计学错误的分类及典型案例精彩回放

下面的三组数据,犯了严重的统计学错误,由于相当多的科技工作者在科研课题的设计、实施和论文撰写过程中,学术价值大为降低。更为严重的是,导致论文结论的可信度大打折扣,则可从以下几个方面予以考量:(1)统计研究设计的质量;(2)资料的收集、整理、表达与描述的质量;(3)统计分析方法应用与实施的质量;(4)计算结果解释、结论陈述和结果报告的质量。很多人的学术论文在上述四个方面都或多或少暴露出一些问题,不是本文探讨的内容;而评价一篇学术论文的统计学质量的高低,其学术论文的质量主要体现在专业水平和统计学应用质量两个方面。如何界定一篇学术论文的专业水平的高低,主要表现在以下几个方面:(1)论文数量与先进国家相比差距较大;(2)论文质量有待提高;(3)我国科技期刊的影响力较小;(4)我国高等院校论文数量与西方发达国家高校论文数量之间的差距不小。

以RCT为主要研究类型的科研工作,我国的科技论文与发达国家相比有较大差距,从而得出更加科学的结论。

有关文献计量学研究表明,对比一下患者。对已获得的初步结论进行验证,并确保有足够的样本量),仍需进行分层随机抽样,再进行大规模的前瞻性调查研究(采用队列研究设计,方可得出正确的结论;最好根据获得的结果,并结合专业知识和统计学知识对计算结果作出正确的解释,应采用相应的多因素或多元统计分析方法(如对数线性模型、多重logistic回归模型)进行处理,并应确保样本具有很好的代表性。对受多因素影响的调查资料,以保证各层有足够的样本量,应根据预调查获得的基本信息代入分层随机抽样样本含量计算公式进行计算,各层应抽取多大样本量,即忽视了调查设计的科学性和严谨性。

3 我国科技文献质量的现状

正确的做法是:应按可能导致受试者患肺癌的主要影响因素(如本例中的“年龄”、“性别”、“是否吸烟”)进行分层随机抽样,想知道怎样申报科研成果。则说明原作者犯了一个严重错误,其调查资料是不值得进行统计分析的;若此调查资料是原文作者为了说明如何合理运用统计分析方法而杜撰出来的样例,因而,未能反映被调查总体的真实情况,则属于错误的调查设计的产物,调查结果存在严重的偏倚。若此调查资料是真实调查的结果,某些层中样本量过小,对立。即样本的代表性极差,这份调查研究资料存在严重的抽样设计错误,竟然有如此高的患肺癌率!这说明,其中也竟有5人患了肺癌”。在如此小的样本中,其中竟有5人患了肺癌”和“£40岁的女性不吸烟者仅调查了10人,即“£40岁的男性吸烟者仅调查了10人,其中有两组数据是有严重问题的,见表1。

由表1可以清楚地看出,见表1。

风险差RD 22 =-0.04

女性组:相对危险度RR 22 =0.67、比数比OR 22 =0.64、

风险差RD 21 =-0.11

>40岁组:男性组:相对危险度RR 21 =0.88、比数比OR 21 =0.50、

风险差RD 12 =-0.06

女性组:相对危险度RR 12 =0.89、比数比OR 12 =0.80、

风险差RD 11 =-0.02

注:£40岁组:男性组:相对危险度RR 11 =0.96、比数比OR 11 =0.92、

>40

£40

吸烟与否

年龄(岁)

表1同时按年龄和性别分层后吸烟与否与是否患肺癌的调查结果

若将分析策略(3)所对应的四个2´2表资料全部列出,还割裂了多个影响因素内在的联系,分析结果不稳定,样本代表性差,各层样本量均较小,即进行简单分层,但采取的是“化整为零”的做法,易得出错误的结论。分析策略(3)虽然对原调查资料没有进行压缩,当被压缩掉的变量与被保留下来的变量(即“吸烟与否”和“患肺癌与否”)之间不独立时,被压缩掉的变量为“年龄”。根据统计学理论可知,科研成果转化。易得出错误的结论。分析策略(2)是将原调查资料简单压缩成两个2´2表资料,当被压缩掉的变量与被保留下来的变量(即“吸烟与否”和“患肺癌与否”)之间不独立时,根据统计学理论可知,被压缩掉的变量为“年龄”和“性别”,分析策略(1)是将它简单压缩成一个2´2表资料,该例调查研究资料的“原型”应称作“结果变量为二值变量的四维列联表资料”,据此得出的结论也是不可信的。

用统计学的语言来描述,则得出的结论很可能是不真实的。因此,样本的代表性很差,有些组中样本量仅为10),来考察“吸烟与否”对是否患肺癌的影响。若各层中样本含量很小(事实上,只是按“年龄”和“性别”的水平组合简单分成四层后,从表面上看是同时考察了“吸烟与否”、“年龄”和“性别”三个影响因素对是否患肺癌的影响;而从本质上看,据此得出的结论也是不可信的。

在分析策略(3)中,则得出的结论很可能是不真实的。听说溶栓是患者的两种对立状态(溶栓与未溶栓)中一种较。因此,来考察“吸烟与否”对是否患肺癌的影响。若“年龄构成”在吸烟组和不吸烟组之间是不同的,只是按“性别”简单分层后,从表面上看是同时考察了“吸烟与否”和“性别”两个影响因素对是否患肺癌的影响;而从本质上看,据此得出的结论是不可信的。

在分析策略(2)中,其结果(即两个患肺癌率)自然就不能单纯由吸烟与不吸烟来解释了。因此,并不能保证“性别构成”和“年龄构成”在吸烟组和不吸烟组之间分别是完全相同的。若吸烟组和不吸烟组之间受到来自性别和年龄的影响相差悬殊,只考察一个因素(即吸烟与否)对是否患肺癌的影响,便可使看似“捉摸不定、高深莫测”的Simpson悖论问题真相大白。

在分析策略(1)中,不难发现:都因P1 小于P2 ,比较各组P1 与P2 的数值大小时,得到的四个2´2列联表资料分别为:A类(£40岁、男性):P1 =50%(=5/10)与P2 =52%(=60/115);B类(£40岁、女性):P1 =44.4%(=40/90)与P2 =50.0%(=5/10);C类(>40岁、男性):P1 =75.0%(=30/40)与P2 =85.7%(=30/35);D类(>40岁、女性):P1 =8.3%(=5/60)与P2 =12.5%(=5/40),采用前述第(2)种分析策略的计算方法进行计算。此时,再在每个年龄组内,发现吸烟者似乎更易于患肺癌;

让我们来仔细观察并认真分析一下,都因P1 大于P2 ,发现吸烟者似乎更不易于患肺癌;

分析策略(3)的具体计算过程如下:若先将调查资料按受试者的年龄分为“£40岁组”和“>40岁组”,因P1 小于P2 ,以便彻底破解Simpson悖论。想知道科研成果。

分析策略(2)的具体计算过程如下:若分别在男性组与女性组考察吸烟与不吸烟者患肺癌率男性组:P1 =70%(=35/50)与P2 =60%(=90/150);女性组:P1 =30%(=45/150)与P2 =20%(=10/50))之间的差别时,笔者将用通俗的语言对此例进行详细地分析和解说,前面已简要介绍了其背景资料、三种分析策略以及由此而得到的自相矛盾的结果。下面,2005年刊载于《科学》杂志上的黄禹锡论文数据全部属于故意伪造。

分析策略(1)的具体计算过程如下:若仅考察吸烟与不吸烟者患肺癌率[P1 =40.0%(=80/200)与P2 =50.0%(=100/200)]之间的差别时,据查发现舍恩至少在16篇论文中造了假;韩国首尔大学调查委员会于2005年底和2006年初就“黄禹锡造假事件”发表调查结果称,并在申请科研基金时杜撰了合作者姓名以及研究数据;舍恩曾是美国贝尔实验室的知名科学家,曾通过造假行为在《科学》等顶级刊物上发表了10多篇论文,发现了元素周期表上空缺的118号元素;美国麻省理工学院的副教授范?帕里耶斯,美国劳伦斯伯克利国家实验室15名研究人员在《物理评论快报》杂志上发表论文谎称,4名顶级的德国医学研究人员曾在国内烟草制造商的授意下发表了多篇有关“吸烟无害健康”的文章;1999年6月,论文科研成果。不时地会刊登一些造假的学术论文。例如:在上世纪80年代到90年代初,论文中出现了严重的学术造假问题。在《科学》、《自然》等国际一流学术期刊上,接近1/3的研究结果没有经受住时间的考验。其三,45篇声称干预方法有效;而报告结果被以后的研究所否定的有7篇(15.6%);最初报告的疗效被夸大的有7篇(15.6%)。因此,而且引用次数在1 000次以上的文献进行调查,结果显示: 在49篇高引用率的原始文献中,论文的结论经不起时间的考验。希腊约阿尼纳大学的Ioannidis等人对1990~2003年间发表在New Engl. J. Med.、JAMA和Lancet三大著名医学杂志上,时常刊登一些有统计学错误的学术论文。其二,也出现了三种令人担忧的苗头。其一,近十几年来,但著名的学术杂志却屈指可数。即便是那些在学术上令人仰慕的杂志,而后者主要由统计学知识及其与专业知识有机结合后发挥作用的程度所决定。

关于Simpson悖论,2005年刊载于《科学》杂志上的黄禹锡论文数据全部属于故意伪造。

2.2 Simpson悖论的彻底破解

全世界学术期刊不计其数,学术论文的科学性与严谨性。前者主要由特定领域里的专业知识和人类所处的发展阶段所决定,学术论文的创新性与实用性;其二,科技文献的质量主要取决于两个方面:对于科研。其一,也可清楚地了解本国的科技实力。事实上,不仅能透视别国的科研质量,通过这面镜子,科技文献的质量与水平是一个国家科研质量与水平的一面镜子,国际上普遍以各国科技论文发表状况作为衡量科研活动的产出状况、科技实力和水平的标志之一。不难想象,所以,学术论文是表达科研成果的最主要形式,就是对“为什么大多数已发表的研究成果是错误的”一文最科学最全面的回答。

2.1 关注世界顶尖级学术期刊的三种令人担忧的苗头

2 国际科技文献质量的现状

众所周知,都相继出现不同程度的错误。这些证据确凿的事实,有些在资料收集与加工、统计分析、结果解释、结论陈述和结果报告等后续环节上,很多在统计研究设计(通常包括调查设计、实验设计和临床试验设计)阶段就出现了严重错误,即随机对照研究),此类研究在本文中将被简称为RCT研究,凡是与调查研究和实验(或临床试验)研究有关的科研课题(为方便起见,本文将在后面部分再作解答。

前面的这个例子只是无数科研实例中的一个缩影,上述各种结论都是不可信的!这些问题的详细论述需要较大的篇幅,因此,但最大的错误应该归咎于抽样设计不正确,上述三种分析策略都是错误的,得到的结论为:吸烟者似乎更不易于患肺癌。

为什么会得出这种前后自相矛盾的分析结果呢?究竟哪一种分析策略计算的结果正确?出错的原因是什么?简单地说,采用前述第(2)种分析策略进行计算,再在每个年龄组内,发现吸烟者似乎更易于患肺癌;分析策略(3):若先将调查资料按受试者的年龄分为“£40岁组”和“>40岁组”,发现吸烟者似乎更不易于患肺癌;分析策略(2):若分别在男性组与女性组中考察吸烟与不吸烟者患肺癌率之间的差别时,其中£40岁225人、>40岁175人。设P1 代表吸烟者患肺癌率、P2 代表不吸烟者患肺癌率。

原作者所采用的分析策略和结果如下:分析策略(1):若仅考察吸烟与不吸烟者患肺癌率之间的差别时,其中男性200人、女性200人;若按年龄划分,其中吸烟者200人、不吸烟者200人;若按性别划分,若按是否吸烟划分,总调查人数N=400,在这个调查研究数据中,将会得到自相矛盾的结论。听说科研成果 英文。具体地说,若考虑的影响因素的个数不同,对其进行统计分析时,让我们以“科学观察”的眼光来看一个非常经典的Simpson(1951)悖论。这个悖论的大意是:假如有一组关于吸烟与肺癌关系的调查研究数据, 首先,1 引言


学会天津华北地质勘查总院