作为一名在硅谷“打拼”了五年的数据科学家,从市场营销,到推荐算法,再到用户界面,也算是用数据支持过产品的方方面面。数据行业的兴起,起源于人们把线下行为一步一步的搬到了互联网上,从我们主动打开电脑在线上买买买,到手机在不经意间就可能把我们的位置上传到服务器,互联网行业收集和利用的数据一直在向用户行为的各个维度不停扩张,这也就给了数据工作者在各个领域利用用户数据创造商业价值的机会
·
所以就以自己支持过的这三个领域,跟大家聊聊不同领域的【数据科学家】日常工作有何异同,顺便分享为何我觉得支持用户界面是数据科学最有趣的领域
☕️☕️☕️
·
📌数据工作不变的主题
在比较这三个领域的不同之前,先来说说这三份工作的相同之处。数据科学家的工作,总是逃不开三个主题
·
1️⃣Opportunity Sizing:在一个新的产品创新想法被产生后但执行前,用数据来估算这个创新会带来的潜在影响力,以评估是否应该投入资源来实现
·
2️⃣A/B Testing:在一个新的产品创新想法被实现后但推广前,用实验来测量这个创新会带来的实际影响力,以评估是否应该推广给所有用户
·
3️⃣Research:完善实验方法,开发测量指标,研究用户数据等短时间内不直接影响产品的工作
·
我前后支持的三个领域,都涉及到了这三个方面的工作,但是由于领域不同,这些工作的目标函数和有趣程度却千差万别
☕️☕️☕️
·
📌市场营销数据科学家
那是我的第一份数据工作,东家是Facebook,我的合作方,营销员的主要工作呢是在脸书的平台上发布广告,吸引脸书的用户,特别是那些中小型的个体户,在看到广告之后,在脸书的平台上做广告
·
比如我们想卖广告刚建了脸书上商业页面的用户,那opportunity sizing就是来看这些目标用户的规模有多大,值不值得我们专门去设计广告。如果目标用户足够多,我们就可以设计广告,然后给一部分的用户送广告,一部分不送,测量转化率,也就是通过广告我们是不是把更多有商业页面的免费用户转化成了在脸书上做广告的付费用户
·
作为我的第一份工作,我从这段经历里学到了很多东西,但是最后让我想离开的两个最大原因是
·
👉市场营销的转化率真的是一个非常不敏感的指标,所以一般实验总是测量不到什么有结论性的结果,但与此同时呢,除了转化率,又很难找到比它敏感但对下一步的创新有指导意义的其他测量指标,所以用数据做决策这事难之又难
·
👉市场部门在对待A/B testing时,与其说他们想通过实验学习如何更好的创新,更像是通过测量来彰显自己通过设计广告给脸书带来了多少广告商。这一点最致命的伤害是,当我们在做完善实验方法等Research时,很多时候目标变成了怎么用log transformation, 用winsorization,用covariate adjustment等方法来让测量结果变成一个有统计显著性的“正”结果,这样才能协助部门”鼓吹”自己给脸书带来的利润。虽然我自觉并不是那种刻板的博士生,但我也很难认同把时间花在”炮制“数据上
☕️☕️☕️
·
📌推荐算法数据科学家
我刚跳槽到Netflix的那会,被借调到隔壁组做了一会推荐算法的数据科学家。我们都知道,奈飞的影片推送是根据每个用户的观看历史和其他行为做了个性化定制的,但这个算法一直在不停的提高和更新。所以我那时候的工作,就是来估算新的算法可能会影响到多少用户以及测量新的算法真正带来了多少影响力
·
这份工作除了本身严谨,而且职位听起来也很高大上,但我觉得我后来迫不及待的结束借调是因为觉得能够产生的影响力很局限。我那时候的合作者都是做机器学习的算法工程师,对于每一个新开发的推荐算法,先不说由于机器学习的算法像个黑盒,应用算法的工程师有时候都难以解释到底发生了什么,就算可以解释,我的合作者就是这方面的专家,我很难在新算法没有显著提高用户体验之后一针见血的告诉他们哪个特征还可以提高或者哪个参数还可以调调,觉得自己不能对产品产生直接的影响力
☕️☕️☕️
·
📌用户界面数据科学家
那时候我负责的是奈飞手机应用的所有用户界面,从主页到搜索到下载,到后来加入的新片功能,所有页面的布局,文字,按键都是我和我的产品组一起要创新和优化的内容
·
我喜欢做用户界面的数据分析主要有三大原因
·
👉用户其实对界面上的任何变化都是很敏感的,每次做实验,就算核心指标没有移动,总可以找到一些描述用户具体行为的指标变化了,所以每次实验总是可以基于数据讲述产品的故事
·
👉对于用户界面,虽然设计师有着专业知识,但是其实每个人都接触着各种各样的互联网产品,所以就算做不了设计,总是可以贡献想法或者提出改进意见的。而数据科学家的优势,就是可以一边提出想法,一边还能拿数据支撑自己的想法,所以绝对满满的存在感
·
👉对于很多成熟的产品,其实现有的推荐算法都已经很成熟了,要提高很难,但是往往产品中的新功能会需要新的推荐算法来支持,而这个新功能呢往往是用户界面团队来启动的。而我的团队曾经开发的新功能呢就需要新算法来支持,而在做最初的原始模型验证这个想法的可行性时,由于还没有算法团队的资源,所以作为数据科学家,我就有了开发初始机器学习模型的机会
☕️☕️☕️
·
以上就是我支持过的三个领域的数据工作,当然其实数据工作的范围远不止这些,每一个数据科学家也不一定会苟同我对用户界面这块的热爱。但是我想说的是,数据工作会因为你涉及的领域不同而千变万化,因此不仅我们可以试着去寻找一份更适合自己兴趣的工作,作为求职者,我们也更应该去应聘一份因为自己的独特背景可以在众求职者中脱颖而出的工作