生物统计,所谓的健康大数据

生物统计,所谓的健康大数据

ynchris
ynchris
3.93万 浏览

概述

现在到处都在说大数据,这个世界仿佛离开各种数据就不能活了。其中“健康大数据”也是被提及最多的之一。而生物统计(Biostatistics)这个和健康数据密切相关的专业也随之爆火-录取人数,开设该专业的院校数和录取标准也是水涨船高。然而Biostatistics这个拗口的词对大部分中国人和美国人还是比较陌生,我过美国海关时黑人边检大叔问我学什么专业时听到Biostatistics做出了正宗的黑人问号脸……这个专业到底干啥?适不适合我学?要拿到个什么学历?毕业后去向如何?未来前景怎样?结合自身经历和体会,我来给对这行不太了解的同学们起底一下这个新兴火爆但很多人又不了解的专业。

个人经历

我本人是个热爱小动物的人,从小的梦想是成为国家地理杂志的开着吉普在非洲草原拍狮子,或是穿着厚重羽绒服在南极拍企鹅的动物学家。虽然家里可谓是工程世家,我却没有跟随父辈的道路,义(追)无(悔)反(莫)顾(及)地在高考时报了生物专业。读了两年后又被姑姑忽悠到加拿大,又被同学忽悠着学了生化专业……毕业了才发现这真是个大坑,所幸第一份工作在基因检测行业,让我了解到了生物数据的复杂和重要,于是我通过数年的挣扎,读研,申博,现在在一个美帝大城市的一个马马虎虎的学校(机构?)读生物统计博士。一路走来是非常坎坷,不过因为一些从业经历,也对这个专业有了相对全面的见解。

生物统计到底干嘛?

Karl Pearson,生物统计奠基人

跟很多当代专业一样,生物统计这个概念起源于工业革命后的英国,目的原本是用统计方法进行流行疾病监控,比如查找病原啊,人口普查啊,疫苗接种情况啊这种。所以生物统计和流行病学(Epidemiology)关系联系紧密。之前生物统计还叫Biometry,而在20世纪五六十年代,开始在美帝被叫成Biostatistics,而很多著名院校也开了该专业,比如哈佛和约翰霍普金斯等。通常这个专业被设置在公共卫生学院(School of Public Health)下,但随着近二十来年生物统计的火爆,没有公共卫生学院的学校则会把该专业开设在医学院或者统计系下。

经过一百多年的演变,生物统计已经不是纯粹做疾病防控和人口普查之类的工作了。现在生物统计最为人所知的是做临床实验,甚至很多人认为生物统计就是做临床实验的。而事实上,现在的生物统计分了很多领域,包括:1. 传统疾控和人口普查。2. 临床实验数据研究。3. 计量心理学。3. 计量卫生经济。4. 这些年超火的基因组研究。5. 这些年更火的医疗图像分析。6. 健康设备数据。7. 疾病研究。8. 物种普查。以上是我能数出来的一些领域,更细分的我也无法完全罗列了。总而言之,生物统计范围很广,凡是有生物的地方,就用得上生物统计。

生物统计师要做的事情通常都是结合数据情况,开发或应用统计算法。跟传统统计学家相比,应用性更强,理论性更弱,要解决的问题也更加具体。

你适合学生物统计吗?

生物统计里面有生物和统计两个成分,那必然是两者兼具才能做好这个领域。通常来说,这个专业要求的统计知识还是比较多的。而这个专业通常存在于美帝和部分英国院校的硕士和博士项目中,本科是没有的。通常学校都会要求申请者有多元微积分,线性代数和基础概率论和基础应用/理论统计的背景。所以我个人建议如果你本科是学统计的话,可以考虑一下申请生物统计的硕士和博士。当然,学数学的而且热爱生物医学的也可以申请。最近学工程啊计算机啊经济啊金融啊精算啊这些专业的也有不少申请生物统计专业。当然还有不少我这样从生物医学转行过来的。

也许你是想跟我一样从生物狗转过来,那你自然会比较担心是否能跟得上课程。那我建议你最好是先申请硕士,硕士相对容易申请,并且你可以在硕士时把缺的数学类课程补完一下。而博士项目的话,最后毕业时大家的水平会相对比较接近,而数学水平高的在找工作时也基本在一个水平线上(找教职除外)。现在随着申请人数越来越多,非数学类专业出身的也是越来越难申请了,想转行请趁早。另外就是要对自己有信心,中国人的数学基础可是超强的,多花点时间总可以跟上。

美帝的生物统计一般会开设的课程包括:statistical inference, linear regression, categorical data analysis, multivariate analysis, clinical trial, survival analysis等,其中最后两门课临床实验和生存分析是区别于普通统计系的标志性课程。其他可选课程包括stochastic process, Bayesian statistics, generalized linear model, statistical genetics等。其中前三门课程尤其是stochastic process,也就是随机过程,重要程度等同于必修。另外通常会要求必修一门流行病学,和选修一些生物类基础课,比如遗传学之类的。

生物统计专业里还有个逃不过去的坎,也是凸显工程专业出身优越的地方: computing。现在的数据越来越大,结构越来越复杂,所以进行统计计算的时候对于编程要求越来越高。如果你厌恶编程,那就应该多考虑一下了。生物统计最常用的软件是R和SAS,R是免费的统计软件,SAS则是食品药品监管局FDA指定临床实验统计软件,相对其他编程语言,语法很奇怪。一般硕士毕业找工作的话,熟练SAS是非常有必要的,最好能考到高级SAS证书。而博士的话必须熟练R,相比之下SAS反倒不用多熟练,因为博士工作主要是进行研发性工作,不需要做编程苦力。如果你的目标是要处理真正的大数据,那我建议最好做好使用C++的准备,不然在R里面一个算法跑个半年都常见。

常见的统计类书籍是少不了的
SAS学生免费版,很不友好的语言
R,统计学的好伙伴

毕业出路

我们这的医院,工作环境还算可以

除了当教职之外,生物统计学家就业面非常广。最常见的是药厂,对博士起薪达到110k~130k美金年薪,而硕士也有60k~70k,而且工作很好找,许多大药厂都非常乐意招收生物统计博士,校招的机会出奇的多,面试也出奇地容易过,这让一些统计系的看了都牙痒痒。药厂的优点是工作稳定,缺点是提升空间有限,做久了容易闷。另外就是各大医院,比如我这的医院,对于博士有70k以上年薪,而且重要的是做得好还能提拔教职,相当于高薪的博士后。这点也让很统计和生物专业的气愤。而一些搞电子医疗系统的公司也乐意招收生物统计师,工资和药厂差不多。

另外有很多生物统计学家就职于保险和金融行业。这种行业硕士工资要略低一些,不过博士的工资则依然很有保障,甚至能比药厂高一点。

最后,许多生物统计学家还在跟统计学家和工程师程序员抢饭碗,就职于IT行业。现在流行的医疗图像识别,比如根据CT图像辨识肿瘤,就是很适合生物统计学家的工作,前提是你要有这方面的相关经验。而移动健康数据更不必说,智能手机,腕带,手表等可穿戴设备提供的大量数据更是需要有经验的生物统计学家来处理。医疗设备公司也设计了可随时测量血糖的血糖仪等专业医疗设备,用机器学习算法预测低血糖也是生物统计的一个应用。而这种高科技公司初始薪水也是相当慷慨,比药厂和金融行业都高,当然缺点自然是对应聘者的专业技能要求高,尤其是计算编程能力的要求更高。

结语

希望大家看了我的文章后对生物统计有了更深的了解,也希望以后有人说从事生物统计行业不用黑人问号脸了。如果有想申请这个专业的朋友,有疑问的话还可以给我评论留言。

君君提示:现在你也可以写原创文章,点此查看详情 >>

本文著作权归作者本人和北美省钱快报共同所有,未经许可不得转载。文章仅代表作者看法,如有更多内容分享或是对文中观点有不同见解,省钱快报欢迎您的投稿。

39332 132 87
ynchris
ynchris 6
  • 长文章

  • 笔记

  • 粉丝

扫码下载APP