-
观点
驳《翻转课堂:为何叫好不叫座?》,在中国照样切实可行
文/ 倪金磊 阿帕图英语联合创始人兼CEO
这几天看到虎嗅上面有一篇文章题为《翻转课堂:为何叫好不叫座?》里面提到了阿帕图的翻转课堂,我认同作者的部分观点,但也有一些不同的理解之处。
首先:翻转课堂是对传统课堂的颠覆。在翻转课堂中,学生是学习的主体,老师回归到辅助者的角色。学生按照自己的节奏和水平安排自己的学习,老师对学生能够进行针对性的辅导。理论上,翻转课堂所带来的教学效果是显而易见的。美国可汗学院的产品在美国公立学校得到了广泛的应用。
其次,翻转课堂对老师的要求不同。对传统老师的要求主要体现在对整个知识体系的把握与诠释能力,而在翻转课堂下对老师的要求主要是与学生的沟通能力。而公立学校想转型,最困难的地方是在于老师思想的改变。
第三,翻转课堂不容易实现是真的,因为线上课程是重中之重,线上课程体系的建设需要大量的投入。阿帕图做产品做了4年,仍然还在不断完善过程中。在能够进行快速开发课程之前,有大量的基础性系统开发需要完成。好在我们已经通过四年多的时间完成了线上课程和系统的建设,并在不断根据学生反馈改善中,
翻转课堂在中国中小学课外培训市场是切实可行的
虽然不容易实现,但是,翻转课堂在中国是切实可行的,阿帕图学生的进步证明了这一点,而学生家长也都十分认同翻转课堂。
第一,翻转课堂注重能力的培养,并非以忽视结果为代价,而是在保证教学效果的基础上,提升了学习能力。现有体制内的教学评估体系固然有问题,但一个有能力的学生,不管是在校内还是在校外,都不应该是成绩不好的。
第二,阿帕图翻转课堂中的答疑部分,不是靠学生主动提问来发现问题,而是通过系统的记录和数据分析主动发现问题,通过老师帮助学生解决问题,让学生进入学习的正循环。中国学生不善于提问是普遍存在的现象,这也恰恰是翻转课堂能够帮助学生改善的一个方面。当学生能主动发现自己的问题了,其实他已经学会了一半。中国学生不擅长提问不是他们没有这个想法和习惯,而是在传统教学中缺失了对这个能力的培养,翻转课堂正好弥补了这一点。中国学生之所以表现出主动性不强,是因为他们其实没有学懂,导致自信不够,进入学习的负循环。
第三,在公立学校实施翻转课堂确实有一定难度,但是体制外的课外培训中,翻转课堂完全是现实可行的。阿帕图在过去两年的教学试点充分证明了这一点。我们相信翻转课堂会在课外辅导和培训中能够快速发展,最终会倒逼体制内的改革。
最后,现在的家长对孩子教育的需求已经多元化了,但同时也很纠结。一方面,家长必须接受体制内教育这个现实;另一方面,家长同样希望自己的孩子能够有独立学习和思考的能力。只是传统教育不可能二者兼得,让家长左右为难。翻转课堂让孩子既能够在体制内取得理想的成绩,同时能够培养孩子的学习能力。
在此不过多纠缠于翻转课堂是否是在线教育的最佳模式,也不去争论国内的公立学校能否实习翻转课堂。但我们通过翻转课堂的教学实验效果也证明,对于中国中小学课外培训市场,翻转课堂是最佳模式之一,也顺应了市场的需求。
本文由芥末堆网授权虎嗅网发表。原文链接http://www.huxiu.com/article/31787 /1.html
-
观点
【HR必知】名企是如何通过社交网络招聘的
过去,企业招聘一般通过招聘网站、公司官网、猎头公司这三大渠道进行,三者各有明显的优缺点。招聘网站和官网的优点在于可以面向广阔的人才市场,缺点是只能满足企业对初级人才的招聘需求。而对中高级员工的招聘,企业一般通过猎头公司等外部代理机构来完成,它们有现成的人才库,但同时要收取 高达20%30%年薪的代理佣金,这对企业是一块不菲的开支。
随着以微博、社交网络为代表的社会化媒体平台的发展,企业招聘有了一个富有潜力的新渠道,企业可以根据人们的网络踪迹精准搜罗人才,也可以通过精心的策划,把招聘同时变成一个提升公司品牌的过程。
Adobe:精准匹配
社会化媒体在让人人都变成“自媒体”的同时,随着时间的发展,也沉淀了大量的用户踪迹。企业可以根据这些真实信息来精准匹配企业的招聘需求。
Adobe在全球的员工总数超过1万名,正常情况下每年都有700750个空缺职位,其中20%的软件工程师是由外部的代理公司帮助招聘来的,但Adobe需要为每个职位支付2万美元的佣金。高昂的成本之外,Adobe还要承担人才流失的风险,因为通过代理机构招来的员工留下来的比例并不是很高。 如果因此出现新的人才缺口,Adobe只能再开出更诱人的条件让代理公司再去“猎”到合适的人。
大概在一年前,Adobe开展了一场“寻找天才员工”的竞赛,他们把负责招聘的HR人员分成两组,一组采用传统的方式招聘50名可靠的技术工程师, 另一组则在社交媒体网站上招聘。结果,用社交媒体的一组只用了几个小时就找够了人选,而用传统方式的一组过了好几个星期之后还在寻找过程中。
大量开展社交媒体招聘后,Adobe不仅节省了大量的时间和成本,更让公司轻松找到了那些愿意为Adobe工作的人。因为在社交网络上,公司不仅能 看到这些人的从业经历和所在的地理位置,还能知道哪些人对Adobe的战略和文化是认同的。如今,代理机构只负责Adobe美国不足2%的招聘业务。
社交网络不仅改变了人们的沟通方式,也让求职者和招聘企业的“供求”信息达到更精准的匹配。这除了有赖于人们在社交网络上留下的真实信息之外,更得 益于企业主动对这张数字化的人际关系网络数据的挖掘和分析,最终让招聘工作人员快速有效地摸清求职者的工作技能、教育背景、从业经历、爱好、性格特征等信 息。
通过社交网络,企业可以在特殊的圈子里找到自己需要的特定人才,然后进行有的放矢地安排笔试、面试。以往,企业通常需要在几轮面试过后,才大概掌握 求职者的性格特征。现在,通过社交网络,企业在与求职者见面前就把对方的“底牌”基本摸得差不多了。在美国,一家医院收到了一名女士的工作申请,但院方后 来发现此人在照片共享网站上上传了自己的裸照,于是直接拒绝了申请。
德勤:人才在线之旅
上述模式还只是停留“找人”的层面上。而在一些企业看来,社交招聘可以是一个一石二鸟的过程,甚至可以首先是一种营销,企业可以在社交网络上以一种有趣的和可亲的姿态聚拢人气,顺便地找到合适的人才。
德勤会计师事务所中国子公司新浪官方微博在去年9月份推出了一个活动——“德勤在线之旅”。参与者可以亲身体验一次线上旅行,旅行从“机场”开始, 旅客可以在这里选择自己想要去的地方是北京、上海,还是香港,“飞”抵目的地后,旅客可以参观德勤在当地的虚拟办公室,并与里面的员工进行交谈。每参观一 个地方,旅客就能收到一个绿点,集齐六个绿点后,旅行完成。德勤在数小时之内就收到了足够多的工作申请。最后统计发现,有超过1.7万人参与到这个在线游 戏中,其中有许多人在游戏中与德勤频繁互动。
谷歌也把这种社交网络招聘方式运用得非常娴熟。其在自己的社交平台Google+上增加了一个“Life at Google”(谷歌生活)账户,除了分享人们在谷歌工作的情况、氛围和文化外,还不失时机地在上面发布招聘信息,并有多个工作人员在后台与来访者充分沟 通。现在,“Life at Google”已经成为谷歌招聘的核心平台。
群邑:真人秀
对社交网络招聘上,群邑中国发挥媒介传播机构的专长,把招聘过程先变成了一个“走秀T台”,无论是招聘者还是候选者,都“走”出了自己的精彩。当然,招聘任务也圆满完成。
去年6月份,群邑中国在社交媒体上推出了一档真人秀短片《群邑学徒》。在这档总共10集的系列短片中,10位从群邑中国实习项目中遴选出来的候选 人,要在为期10天的面试中,接受群邑中国设置的5场考核,从消费者报告到病毒营销再到社交媒体传播,内容涵盖媒介传播的各个方面。视频短片以每天一集的 速度在视频网站更新,并在社交网站和社区里推广。
要知道,这些考核内容对这10位30岁以下对传播、营销有浓厚兴趣,但对行业知之甚少的年轻人而言,并不是轻易的事儿。当然群邑中国也知道这一点, 他们并不想从这10个里面决选出一个知道‘e(2.718281828)’数列中第一个十位数质数的“天才”,而只是想通过《群邑学徒》为这些年轻人搭建 一个学习和了解媒介行业的平台。对于那个10天后决选出的最终胜出者,群邑中国除了为他提供一个工作职位外,还为他提供了为期一个月的海外培训机会。
在这场营销目的大于招聘目的的活动中,群邑中国“搭台”,候选人“唱戏”,共同上演一场精彩的“走秀”。在这场“秀”中,群邑中国充分向人们展示了 公司需要什么的人、有什么样的人,这些人能做什么——当然,言下之意还有群邑中国能为什么样的公司做什么样的事情。至于最后招募的那位人才,更像是这场市 场活动的副产品。
文章来自:199it
-
观点
招聘网站的五宗罪
和招聘网站接触最多的三类人群,HR、猎头、候选人。纵观笔者的职业生涯,就是在这三种角色中不断转换的血泪史。
笔者从候选人、HR、猎头三者的角度,吐槽下招聘网站的五宗罪。
一、中低端?还是中高端?不可兼得
一对小夫妻走进一个房产中介说:“我们要买房子。”
房产中介员说:“我们手上有最新的租房信息,你要不要看下?”
小夫妻摇了摇头说:“我们要买房子。”
房产中介员又说:“我们有附件的商铺出租的信息,非常实惠,我拿给你看看。”
小夫妻很无奈的说:“我们只要买房子,不要租房、也不要租商铺。”
这个故事告诉我们,搞清楚用户的需求很重要。
国内传统的三大招聘网站,51job、智联、中华英才网,做的是一揽子计划,所有行业,所有职位全Cover,试图解决全中国人民的求职大计,这显然是行不通的。
中低端候选人、中高端候选人求职的需求是有很大差异的。中低端候人,侧重在海量面试、选择多、重点看薪酬。中高端候选人侧重在面试少而精、招聘的增值服务、个人隐私的保密性、做选择时会平衡薪酬和职业生涯规划等。三大招聘网站提供的服务,2C(求职者)方面,在满足中低端候选人需求方面,有一定优势。而在满足中高候选人求职需求方面,显然力不从心,在增值服务上需求满足上基本可以忽略不计。如同开篇想买房子的小夫妻,你给人家推销租房信息、商铺出租信息,人家显然不买账。
此外不得不提,中国的官本位思想、精英思想对中高端求职者的影响。职级、职位层级分明的企业制度,给中高端候选人打上了精英的烙印,他们不屑于和普通求职者使用同样的招聘产品,不屑于搜索公司时看到无数“配不上”自己的公司。他们需要的,是一款服务于自己阶层的招聘产品。更有甚者,只通过猎头渠道求职,因为通过猎头跳槽,不仅是自己身份和地位的体现,也更便于在争取职位、薪酬方面占据有力位置,还可以获得向猎头咨询行业信息、职业规划等增值服务。
饮水思源,缺少中高端候选人资源的三大网站,成了无水之源。B端(招聘企业)在中高端招聘上,不买账也很正常。
恶性循环的日积月累,造成了三大招聘网站,在中高端人才招聘方面集体的非常不给力的局面。
随着中国经济的发展、产业升级、竞争激励下人才争夺战的升级,以及经过30多年的经济发展积累沉淀下的中高端人才数量的激增。中高端人才招聘逐渐成为招聘行业的主力战场,三大招聘网站的不给力,繁荣了猎头市场,也造就了一个巨大的市场空白。不是所有公司都用得起猎头,市场呼唤一款针对中高端人才招聘的利器。
于是,猎聘网来了、人人猎头来了,他们会笑到最后或昙花一现?笔者认为它们都有着基因上的缺陷,拭目以待。
二、先有鸡,还有先有蛋?先有B?还是先有C?
有奶就是娘,三大招聘网站的业务形式决定它们的绝大部分营收都来自于B(招聘企业),于是它们长期过着笑脸对B,屁股对C(候选人)的日子。它们把更多的服务、资源、人力投入到了B(招聘企业),对于C采取爱理不理的策略,或者说他们不知道该如何理C。铺天盖地的招聘广告,成了他们和候选人沟通的唯一方式。呼唤自由的灵魂、呼唤做个抬头族,没有提供给C需要的服务,其它的都是扯淡。市值200多亿美元Linkedin的崛起,其庞大的个人用户数量功不可没。饮水思源,中高端用户是无可争议的水源。
互联网招聘,得C者,得天下。如同中国60%的用户搜索用百度,任凭企业怎么骂娘说百度的广告费用高,最后都得老老实实的付钱。请三大招聘网站,转转你高贵的头,好好倾听下用户的需求,想想自己可以做什么,想想怎么吸引中高端用户来你家安营扎寨。
送你们毛主席的一句话,人民、只有人民是历史的创造者。
三、一锤子买卖 & 用户黏性
如果不是想跳槽,你会登陆招聘网站的账号吗?你还记得你招聘网站的账号吗?
一个普通的求职者,平均2-3年会跳槽一次。基于跳槽周期比较长的原因,招聘网站把自己的服务定位成了一锤子买卖,你跳槽的时候愿意用一下就好了,其它时候你忘记我我不怪你,俨然一个无怨无悔的隐形情人的角色。
根据我做猎头和HR的经验,我把候选人分为2:7:1。20%的人有强烈的换职意向、70%的人没有主动考虑换职或者观望有没有更好的机会,10%的人坚决不跳槽。
没有人会拒绝好的机会,70%的观望的人群,是一个庞大的需求。而这70%的人没有强烈的求职动机,不会主动更新简历,不会主动求职,没有平台获得更好的职位信息,他们的求职需求没有被挖掘出来,而这70%的人恰恰是行业最中坚力量。
不做一锤子买卖,而是做一个用户粘性的平台,通过平台,定制化的推送职位信息,挖掘这70%候选人的需求,这会是一个至少2倍、3倍于现有市场的大盘子。
四、海量投递 & 海量筛选,精准匹配缺失
3-5秒,是HR判断一个候选人是否适合的时间。不是HR没有责任心,而是迫不得已。
举个例子,一个在行业中有知名度中型企业,随便一个经理职位,每天从三大招聘网站中的任何一个,都会收到近百份或者更多的简历,更何况很多企业同时开通三大招聘网站中的2个或者3个。
一个HR会同时负责至少3-5个职位的招聘,可以想象他每天收到的简历会是怎样的简历海洋。而这只是悲剧的开始,这些简历中,大概只有5%-10%是合适的候选人,90%-95%的简历是不符合需求,而HR为了找到合适的5%-10%,需要把所有的简历看完。
候选人出于对公司、职位的向往,或者从增加可能性角度考虑,海投简历,反正投递简历也不要多花钱。其中也不乏,每天投递一次简历、把公司所有职位都投递一遍的奇葩。虽然可以通过学历、工作年限等条件做简单的机器筛选,可是筛选后的简历数量依然庞大。招聘行业一直缺少职位需求和候选人匹配的算法,无法实现职位需求和候选人简历的精准匹配,所以HR只好花大量的人工做简历筛选。
笔者做HR的时候,看简历看到想吐,连想死的心都有了。而作为招聘HR,还有面试、沟通、会议、报表、招聘会等大量的事情需要做,苦逼的HR何时可以迎来自己的1949?
百度旗下的百伯人才尝试过做匹配算法,结果也不算成功。HR呼唤简历筛选的神器。
五、最大的原罪:路径依赖
男人永远无法体会,女人生孩子时的感觉。因为你不是女人,在丰富的想象也只是猜测。所以只有把你自己变成产品的用户,你才知道自己真正想要的是什么。招聘网站基于自己对HR的了解,推出了之前的招聘产品。前几年的成功经验,让它们更加固步自封,形成了路径依赖。
招聘网站的产品同学们,似乎并没有真正了解HR的需求。因为它不知道,HR需要筛选简历、需要做各种统计表格、需要精准的简历而不是无效的简历,需要一个工具提供高工作效率让自己有更多的时间陪陪家人、谈谈恋爱,需要一个工具给自己带来政绩可以往上爬。所以,请想办法把自己变成HR吧。招聘网站的产品同学们,更没有了解不同层次候选人的需求。因为它不知道,中高端候选人需要的增值服务、需要的职业生涯规划,需要的行业分析、公司分析、职位分析。而对于这些,最有发言权的是猎头。所以,请想办法把自己变成猎头吧。
招聘网站的产品同学们,更不知道如何实现职位需求和候选人简历的精准匹配,而这些需要HR、猎头、技术人员的通力合作。所以,请了解下技术,是怎么做分词、切词、意图分析、数据挖掘、算法的吧,而不是留给我们一个十几年如一日的搜索框。
有的读者会问,你吐槽的这五宗罪,你有什么高招解决吗?不破不立,笔者心中已有答案。如果有缘,咱们下一篇文章见。
文章来源:由猎眼天下授权虎嗅网发表
原文链接http://www.huxiu.com/article/18072 /1.html
-
观点
社交网络招聘是必然趋势, HR要利用好
编者按:60%的受访者表示,通过Facebook等社交网站寻找更多高质量的职位候选人,将成为他们招聘策略中的关键举措。由此可见通过社交网络特别是职业社交网站寻找求职者已经成为招聘方,起码是国际企业的一个重要招聘形式。
招聘之所以会让无数的HR头疼是因为不容易找到那个最合适的人,这个结果的原因是雇佣方和劳动者的信息不匹配,有时候是职位空缺的消息无法及时有效的传达给想要跳槽的目标人群;有时候是想要跳槽的人找不到满意的岗位,信息的不对等导致了雇佣方和劳动者的筛选成本增高,在无法找到最合适的那个机会时,只能选择次合适的机会,这样就会导致人力资源的使用浪费。
随着市场经济的不断发展,跨地区流动障碍的降低,人才流动也在不断加速,一方面是政府不再控制人才的流向,另一方面人们也渴望找到更适合自己才能发展的岗位,因此这时的人才市场逐渐发展起来。人才市场就是一块招聘信息与应聘人员信息充分流动的平台,应聘者可以穿梭在不同的用人单位的摊位,用人单位也可以收集更多人的简历,在更大范围内筛选合适的候选人。人才市场这个渠道进一步推动了人岗匹配的契合度。
此外,人才招聘网站的出现革命性的推动了人才在更大范围内的自由流动,在这样一个虚拟平台上,雇主很容易的发布自己的招聘需求,目标人群则不受任何限制,只要符合应聘条件都可以来投递简历;而对于应聘者而言也非常容易去寻找适合自己的岗位,通过检索和条件限制的方式来寻找最匹配自己需求的岗位。
众所周知,在推动互联网招聘不断发展的过程中,目前智联招聘、前程无忧和中华英才网是最受用户青睐的招聘门户,当然目前赶集网、百姓网、58同城也都在抢夺这一市场份额,在这几个综合性招聘平台上聚集了大量的企业用户,每天都会产生成千上万个新增岗位,在这种波涛汹涌的更新背后则是人才的大量流动。
然而随着新技术的不断发展,人们逐渐发现这些门户网站大而全的背后隐藏的弊端是人才筛选成本的逐渐上升,HR每天都会接到无数的投递简历,虽然系统能够自动根据匹配度筛选掉一部分,但是HR仍然会面临数不清的简历纷至沓来。资源的不足和资源的过剩都会让HR痛苦不堪,大量拥挤的人群会让真正的人才淹没。同时HR仍然被困扰的一个终极难题是:仅凭一张简历和短短的几十分钟面试,我如何判断这个人就是我想找的那个人,就算是非常有经验的面试官也没有百分之百的把握说自己满意的人就是最合适的人才。
如何找到足够多的人,到如何在足够多的人中找到那个最适合人,这成为HR再次需要解决的问题,而关键是要找到新的招聘渠道,例如垂直化和细分化的互联网平台,社交化招聘也是另一个发展的趋势,社交网络和移动互联网的异军突起彻底改变了人们的生活方式,现在你还能想起来在微博微信没有出现前,你每天上网都干嘛吗?如果你需要想一下的话,就说明你已经完全进入了社交时代。
调查显示,52%的企业认为社交网络是他们吸引求职者的重要平台。60%的受访者表示,通过Facebook等社交网站寻找更多高质量的职位候选人,将成为他们招聘策略中的关键举措。由此可见通过社交网络特别是职业社交网站寻找求职者已经成为招聘方,起码是国际企业的一个重要招聘形式。
社交招聘的真正价值在于,通过与社交网络用户的互动,招聘双方可以获得更多更全面更真实的信息。求职者可以了解企业的文化、需求偏向、实时动态等,可以更加准确的判断企业需求与自身条件是否匹配。用人单位通过求职者在社交网络上的活动可以获得全面、真实的求职者信息,而不再局限于一张简历,这样才能招到更高质量、更符合企业要求的人才。
(原标题:如何利用招聘趋势选拔卓越人才?)
【文章作者:董莹】
-
观点
大数据流程处理“三要”“三不要”
大数据时代处理数据的三大转变:要全体不要抽样,要效率不要绝对精确,要相关不要因果。
具体的大数据处理方法确实有很多,但是根据笔者长时间的实践,总结了一个普遍适用的大数据处理流程,并且这个流程应该能够对大家理顺大数据的处理有所帮助。整个处理流程可以概括为四步,分别是采集、导入和预处理、统计和分析,最后是数据挖掘。
大数据时代处理之一:采集
大数据的采集是指利用多个数据库来接收发自客户端(Web、App或者传感器形式等)的数据,并且用户可以通过这些数据库来进行简单的查询和处理工作。比如,电商会使用传统的关系型数据库MySQL和Oracle等来存储每一笔事务数据,除此之外,Redis和MongoDB这样的NoSQL数据库也常用于数据的采集。
在大数据的采集过程中,其主要特点和挑战是并发数高,因为同时有可能会有成千上万的用户来进行访问和操作,比如火车票售票网站和淘宝,它们并发的访问量在峰值时达到上百万,所以需要在采集端部署大量数据库才能支撑。并且如何在这些数据库之间进行负载均衡和分片的确是需要深入的思考和设计。
大数据时代处理之二:导入/预处理
虽然采集端本身会有很多数据库,但是如果要对这些海量数据进行有效的分析,还是应该将这些来自前端的数据导入到一个集中的大型分布式数据库,或者分布式存储集群,并且可以在导入基础上做一些简单的清洗和预处理工作。也有一些用户会在导入时使用来自Twitter的Storm来对数据进行流式计算,来满足部分业务的实时计算需求。
导入与预处理过程的特点和挑战主要是导入的数据量大,每秒钟的导入量经常会达到百兆,甚至千兆级别。
大数据时代处理之三:统计/分析
统计与分析主要利用分布式数据库,或者分布式计算集群来对存储于其内的海量数据进行普通的分析和分类汇总等,以满足大多数常见的分析需求,在这方面,一些实时性需求会用到EMC的GreenPlum、Oracle的Exadata,以及基于MySQL的列式存储Infobright等,而一些批处理,或者基于半结构化数据的需求可以使用Hadoop。
统计与分析这部分的主要特点和挑战是分析涉及的数据量大,其对系统资源,特别是I/O会有极大的占用。
大数据时代处理之四:挖掘
与前面统计和分析过程不同的是,数据挖掘一般没有什么预先设定好的主题,主要是在现有数据上面进行基于各种算法的计算,从而起到预测(Predict)的效果,从而实现一些高级别数据分析的需求。比较典型算法有用于聚类的Kmeans、用于统计学习的SVM和用于分类的NaiveBayes,主要使用的工具有Hadoop的Mahout等。该过程的特点和挑战主要是用于挖掘的算法很复杂,并且计算涉及的数据量和计算量都很大,常用数据挖掘算法都以单线程为主。
整个大数据大数据时代处理的普遍流程至少应该满足这四个方面的步骤,才能算得上是一个比较完整的大数据处理。
【文章来源:199IT】
-
观点
社交网络时代,HR要做个微招聘高手?
“100份简历里面99个用不上,应届生也投总监职位的有木有?!”
“找猎头不交预付招不到人,交了预付找不到合适的人有木有!那么高的猎头费,你比贩人要价还狠啊有木有!”
……
以上这段痛苦的“咆哮”,来自于一段近期网上热传的小视频“痛苦的HR”。据说,“痛苦的HR”被点击了200多万次。
招聘永远是HR面临的难题,为了满足公司急需人才的需要,HR往往需要快速发布简历、参加招聘会,并从海量的简历中苦苦筛选,但这些简历有很多并不能反映应聘者的真实情况,更让HR哭笑不得的是,甚至会出现城建工人应聘互联网高管的现象。通过简历筛选、笔试、面试等环节,脱颖而出的应聘者在入职后很可能会在短时间内离职,以前的准备与努力全然成为徒劳。在传统招聘中的种种弊端引起了企业管理人员的思考。
招聘与被招聘简直是一对冤家,找不到工作焦虑,但招不到人的也一样焦虑。而现在应届毕业生、大龄失业青年以及自由工作者彼此较劲的战场又多了一个:微招聘。每年毕业生们整天搬着厚厚一叠包装精美的简历进出宿舍,又花钱、又费力,很多同学把求职当成跑各个招聘会撒简历,微招聘通过社交网络的方式就可以将自己推销出去,为何不一试。
微招聘可以说是一个一石二鸟的过程,其同时可以是一种营销,企业可以在社交网络上以一种有趣和可亲的姿态聚拢人气,宣传企业的文化,树立产品的品牌和企业的良好形象。
Amy需要招一位软件工程师,于是她选取了JD中的两个关键词SAP和SD模块在LinkedIn上搜索候选人,通过Profile初步选定了20位候选人后,并在加对方为联系人时即注明“我有个工作机会与你沟通”,以防被拒。最后Amy通过电话和其中一位反馈及时的候选人进行了深入沟通,并成功地将这位候选人推荐给了领导,给出了Offer。Amy介绍说:“我一直用LinkedIn,快两年了,有时加联系人后反馈较慢,不如通过简历上的公司和职位名称用Cold Call联系候选人,看看候选人是否还在简历上所写的公司工作,这样往往可以达到事半功倍。”
社交网络让企业透明起来,主动展示相关信息,与粉丝一同分享企业的观点。粉丝们对企业了解越多,越容易培养出信任感,企业的雇主品牌应运而生。可以跨越地域、时间的限制,拉近彼此的距离。看着微博上你关注的、和关注你的人每天与日俱增,不由得你不信服网络的魅力,正在呈几何倍数地放大企业的一举一动。同时也提高着你的招聘效率。
在中国市场上,社交网络正以其独特的优势,将“信任+推荐”大范围、低成本地迅速铺开。
Vivian是一家本土快消品公司的研发经理,在过去4年中,一直负责公司主要新品研发,看起来一切都驾轻就熟。但她一直渴望到全球顶级的公司中接触领先的研发平台和国际化的视野。可这种企业往往从高校直接选拔,或从同类型竞争对手中挖角。多次主动投送的简历都石沉大海。最近通过朋友介绍,Vivian加入了一个社交网络的研发类论坛,她觉得在这里与大家分享研发管理的文章及心得很有意义。而她的观点和工作经历引起同论坛的一位研发总监的注意,这位总监在全球领先的快消公司中负责研发,他的部门正准备招聘研发职位。双方经过对工作深入的沟通后,Vivian顺利的拿到了offer。
在国外,微招聘已经成为日常招聘模式。据社会化招聘网站JobVite在2012年8月的报告显示,有大约89%的美国公司都使用网络媒体进行招聘,在这些公司中,有80%的人使用Linkedin,使用Facebook和Twitter的人分别是50%和45%。
Linkedin是目前最引人注目的社会化招聘网站,它成立于2002年,是专业商务人脉社交服务平台,自2006年起成为美国主流招聘方式。Lindedin的精准匹配度很高,甚至可以将候选人“推到”符合预置标准的雇主面前。该网站创始人霍夫曼认为,“对人们来说,未来如何更加有效地利用自己的关系会越来越重要。如果一个人二三年换一次工作,就需要持续维护自己的社交网络来找到新的机会。在线交流恐怕是现在最容易维护社交网络的方式了。你不用一个个地打电话、找话题跟对方硬套近乎,更不用买了礼品厚着脸皮登门拜访,只要利用线上的共享功能,就能假装不经意地与对方搭茬儿。”在他看来,Linkedin这样的在线职业人社交网站的价值就在于“注重于少量但是高价的瞬间”。
微招聘的优势
1.招聘信息的有效传播
社交网络可以充分发挥企业、企业员工的人脉关系,招聘信息可以有效扩散,到达企业需要的人群,这种有质量的传递,效果要好于盲目扩散。尤其是大公司一般拥有众多的粉丝,因此招聘信息也必然会得到关注、转发和评论,目标受众非常准确,几乎可以说没有成本。
2.信息更真实、对称、透明
通过网络媒体推荐过来的人,企业既可以通过简历获取相关信息,也可以通过其人人网状态、博客文章、微博内容、微博关系等考察应聘者的真实情况。另外,应聘者也可以通过转发过程中对该企业的评价、与企业的互动获得较充分的信息。
在社会化网络里,一个人的博客、微博等,比简历更能真实地展现一个人。通过他博客的内容、与别人进行的互动,可以了解这个人的性格、兴趣、工作风格、行为习惯、业内口碑等,他关注什么话题,他对事物的看法,他交往什么样的朋友,一目了然。招聘者可以通过浏览其内容,辅助进行面试和录用与否的决策。
3.全员招聘成为可能
微招聘,充分发挥了社会化的有效、快速传播及辐射特性,企业的创始人、管理层、员工、关注者都可以转发、推荐,通过共同参与,使企业凝聚力增强。对于一些创业公司和缺少名气的公司来说,在招人方面相比名企缺乏天然优势,而微招聘可以带来更多机会。
对于一般职位招聘,可以采用广发招聘的方式。通过微博、微信公众号、人人网、博客、分类信息网站等,使招聘信息尽可能广泛传播。
【文章来源:招聘新视野】
-
观点
专访朗播网CEO杜昶旭:立足“在线练习”,打造线上线下教育闭环
六年前,还没有高铁,我坐着小卧铺,去北京学托福;六年后,学弟学妹们居然可以足不出户,打开电脑就能轻松搞定雅思托福 GRE 了。六年的时间,生活悄悄地发生了天翻地覆的变化,教育行业亦是如此。
在互联网盛行的今天,朗播网便是在线教育家族的一员,是一个主推“在线练习”的英语学习平台。早在 2007 年,朗播网的 CEO 杜昶旭还是新东方北美部的老师,每个周末和寒暑假都穿梭在海淀以及北京各种五六环以外的校区,传播着各类考试的学习方法。但作为一名有着计算机背景的英语老师,一个偶然的机会,让他萌生了将互联网与英语教学结合的念头。
朗播网于 2008 年低调上线,几经改版,如今已拥有 10 万用户数据。目前,它主要以成人英语教育为主,产品分为“授课”“练习”和“答疑”三部分。与多数在线教育平台主打“线上授课”不同,朗播的落脚点却是“在线练习”。新用户注册登陆后,会经历“用户学习状况调查”,“学习问题分析环节”。最后,根据个人能力水平、备考时间长短,获取相应的学习建议,和专属的学习计划。学生根据个人情况,可有针对性的选择学习方案,包括短期、中期、长期套餐等。
从“在线练习”出发
朗播的切入点不是“授课”,而是“练习”。
网站首页内容主要分为三部分:“我要上课”“我要练习”和“我要提问”。以练习为例,初次登陆的学生,可以先行进入“学习计划”环节。鉴于学生有着不同的时间规划,每个人都可以选择动态的学习计划,并自行调整起止时间,从而减少学习压力;配合相应的激励机制“我的愿望”,学生根据自己最初设立的目标,在完成学习计划、实现愿望时,获得相应的回馈作为鼓励。制定计划后,学生便可以进入“词汇”“阅读”“写作”“听力”“语法”平台,根据个人情况,展开定制化学习。与弹性的时间计划相同,学生也可以根据不同的学习水平和需求,选择不同难易度的练习。
除了“弹性”这一特点,朗播的练习注重“基础培养”,从而逐步提升能力。目前的学习套餐以雅思、托福、GRE 课程为主,套餐内的练习根据考试要求的能力而制定。假设我是一名托福考生,距离考试还有两个月,希望重点提高英文写作能力。由于我没有时间奔波异地上课,我可以选择朗播的“写作”平台,购买“托福写作”套餐。随后,遵循个人练习周期,每天按时完成“模仿造句”“作文训练”“话题讨论”的相关任务。“模仿造句”“作文训练”强化写作基础的硬实力,“话题讨论”则以考试题目的头脑风暴为主,侧重思维方式的软实力。经过多年的沉淀,平台内积累了大量 UGC(User Generated Content , 用户生产内容)。学生在完成自己的练习后,还能通过平台参考其他考生的练习样本,实现多角度思考。
换言之,朗播的练习平台将传统的红宝书、剑桥 3 到 8,ETS 题库进行了处理,实现了“线下练习线上化”。如果我们不参与线下课程,依然可以按照练习的指导,完成一个雅思、托福或者 GRE 的复习周期。
朗播网面向成人语言类短训,而成人学生的诉求大致分为三类:教学诉求,课后练习诉求,课后咨询诉求(咨询又可细分为教育问答,留学申请咨询等)。杜昶旭认为,这三类需求中,由于资源有限、缺乏互动,学生的“练习需求”往往最难被满足。题海战术解决不了全部,学生需要的是一步步的分析指导。因此,朗播选择将“练习环节”作为切入点。
在线教育新模式:直播授课+在线练习套餐
在授课环节,朗播倾向于“直播授课”。杜昶旭认为,直播授课能够增强师生互动性,实现随时提问、随时解答。目前,朗播开发出相关的系统,帮助老师即使在面对电脑上课时,也能通过后台数据,及时收集学生反馈,从而将线上授课营造出线下的场景。此外,与资深老师的合作,可以保证课程标准化,使得课程不因直播而影响质量。当然,直播授课仍存在问题,例如缺乏师生的肢体语言和眼神交流,有待进一步打磨。
明明是主打“线上练习”的内容平台,为什么又要拓展“在线授课”领域?
随着教育领域的变化,独立创业和独立授课的老师人数逐渐增加。教师的独立,意味着他们不再从属于任何教育机构。一方面,学生选择课程遇到了极大的挑战,他们不知道去哪里才能找到优秀的老师和高质量的课程;另一方面,教师在与不同平台合作时,均要缴纳一定的课时费分成。而朗播的“直播授课 + 在线学习套餐”的模式,先是帮学生们找到名师,凑齐“听说读写”全套课程;同时,平台仅通过“在线练习”套餐盈利,课时费收益全部交还给授课教师。此外,参与合作的教师,还将提供线上预约答疑服务,从而形成了“直播授课—课后练习—练习答疑”的线上教育闭环。
在线教育的未来
流动化的教师合作加上自主研发的练习套餐,朗播抛却了依赖“教师课时费”的传统盈利模式。被赋予更多自由的教师,也可以随意选择合作机构。而在线教育并非要彻底“颠覆”线下教育,两者结合才是新的方向。
未来,朗播期待与中小型教育机构合作,进行精细化落地服务。在二三线城市中,中小型教育机构缺乏优质教师资源,难以开展相关课程。一旦合作后,朗播可以提供师资,而中小型教育机构提供线下场地和助教资源,督促学生完成课后的线上练习,并提供答疑服务。从而实现了线上与线下教育一体化。
在线教育刚刚开始,每一种模式背后,都是一种全新的教育图景。六年后,又会怎样?
[36氪原创文章,作者: 林西抹抹茶]
-
观点
关于移动学习的7个小数据
移动学习由于其灵活性及易用性已经开始逐渐成为教学的标配。既然如此,那么每年都有越来越多的地区及学校鼓励他们的教师们更加“移动化”。现在许多员工也加入到了移动学习的行列中。让学习更随时随地。
如果你对这个情况存有质疑,那么以下这几个数据可能会说服你,移动学习确实越来越火爆:
·今年,56%的学校和图书馆都预计开始向电子图书转变
·45%的学校级图书馆预计扩大移动设备的使用范围
·73%的教师通过手持移动设备访问数字资源
·超过1/3的教师表示曾经在教室里使用平板电脑或者ereader
·到2016年,100%的K12学生将移动设备用于教育
·25%的六年级学生使用ereader
·74%的家长访问课程资料及在线教材作为在家辅导孩子学习的工具,以获取孩子在学校课业的成功。
随着访问资料的设备越来越普及,因此移动学习在教育中的应用也将越来越普及。
情况就是如此,越来越多的平台开始必须兼容于移动设备。不幸的是,许多LMS系统在移动设备上并不能很好的运行。
学习管理系统急需更新,否则就会过时。尤其是到2017年全球将有20亿人通过移动设备访问网络。
如果你恰好服务于学习管理系统公司,那么你首先要做的就是确保你们公司提供的系统能够在移动设备上兼容。
【文章来源:小崔编译】
-
观点
HR招人新招:社交网站考察求职者
编者按:找工作过程中,有时候在Facebook的所作所为可能比简历更管用。对于求职人员而言,伯顿将他们在社交网站上的个人情况分解出三类信息:联系方式、所处地点以及有何兴趣和爱好。他认为,通过这些信息了解一个求职者比通过传统简历和求职信要靠谱得多。
在线招聘平台HiringSolved创始人兼CEO肖恩•伯顿(Shon Burton)认为,在找工作过程中,有时候在Facebook的所作所为可能比简历更管用。
对于求职人员而言,伯顿将他们在社交网站上的个人情况分解出三类信息:联系方式、所处地点以及有何兴趣和爱好。他认为,通过这些信息了解一个求职者比通过传统简历和求职信要靠谱得多。
伯顿表示:“简历信息太集中、通常不具有可读性,且很多东西容易被忽略。不过,通过Facebook、LinkedIn、Twitter、YouTube、Instagram、Tumblr、Pinterest甚至Spotify,你可以很容易了解一位求职者在工作上的真正兴趣以及他们的各种能力。”
包括Twitter、LinkedIn和Facebook等沟通网站在内的第一类社交媒体,他们有助于雇主或是招聘经理以一种求职者未曾预料到的方式与他们接触交流。
第二类则是地点追踪网站,例如Yelp和Foursquare。这些信息将帮助雇主精确定位求职人员所处地点以及其旅行过的地方。这些网站对地点的定位还会透露出求职者经常把时间花在哪里。
最后一种,包括LinkedIn和Facebook,此外还有Quora和GitHub。这一类型社交网站将帮助雇主了解求职者的知识构成以及对学习哪种事物感兴趣。在最后这一类社交媒体中,如果表现出专业素质并突出对所选择的领域有明确的兴趣,将大大提高得到offer的几率。
伯顿说,现在与五年前相比发生了巨大的变化。如今一位软件工程师没有在GitHub等网站上展示过作品的话,就很难成为谷歌(微博)、苹果或是Twitter等顶尖科技公司的一员。
【文章来源:腾讯科技】
-
观点
大数据,还是大错误?
大数据是对于大规模现象的一种模糊的表达。这一术语如今已经被企业家、科学家、政府和媒体炒得过热。
五年前,谷歌的一个研究小组在全球顶级的科学杂志《自然》上宣布了一个令人瞩目的成果。该小组可以追踪美国境内流感的传播趋势,而这一结果不依赖于任何医疗检查。他们的追踪速度甚至比疾控中心(CDC)要快的多。谷歌的追踪结果只有一天的延时,而CDC则需要汇总大量医师的诊断结果才能得到一张传播趋势图,延时超过一周。谷歌能算的这么快,是因为他们发现当人们出现流感症状的时候,往往会跑到网络上搜索一些相关的内容。
”谷歌流感趋势“不仅快捷、准确、成本低廉,而且没有使用什么理论。谷歌的工程师们不用费劲的去假设哪些搜索关键字(比如”流感症状“或者”我身边的药店“)跟感冒传染有相关性。他们只需要拿出来自己网站上5000万个最热门的搜索字,然后让算法来做选择就行了。
谷歌流感趋势的成功,很快就成为了商业、技术和科学领域中最新趋势的象征。兴奋的媒体记者们不停的在问,谷歌给我们带来了什么新的科技?
在这诸多流行语中,“大数据”是一个含糊的词汇,常常出现于各种营销人员的口中。一些人用这个词来强调现有数据量的惊人规模——大型粒子对撞机每年会产生15PB的数据,相当于你最喜欢的一首歌曲重复演奏15000年的文件大小。
然而在“大数据”里,大多数公司感兴趣的是所谓的“现实数据”,诸如网页搜索记录、信用卡消费记录和移动电话与附近基站的通信记录等等。谷歌流感趋势就是基于这样的现实数据,这也就是本文所讨论的一类数据。这类数据集甚至比对撞机的数据规模还要大(例如facebook),更重要的是虽然这类数据的规模很大,但却相对容易采集。它们往往是由于不同的用途被搜集起来并杂乱的堆积在一起,而且可以实时的更新。我们的通信、娱乐以及商务活动都已经转移到互联网上,互联网也已经进入我们的手机、汽车甚至是眼镜。因此我们的整个生活都可以被记录和数字化,这些在十年前都是无法想象的。
大数据的鼓吹者们提出了四个令人兴奋的论断,每一个都能从谷歌流感趋势的成功中印证:
数据分析可以生成惊人准确的结果;
因为每一个数据点都可以被捕捉到, 所以可以彻底淘汰过去那种抽样统计的方法;
不用再寻找现象背后的原因,我们只需要知道两者之间有统计相关性就行了;
不再需要科学的或者统计的模型,”理论被终结了”。《连线》杂志2008年的一篇文章里豪情万丈的写到:“数据已经大到可以自己说出结论了“。
不幸的是,说的好听一些,上述信条都是极端乐观和过于简化了。如果说的难听一点,就像剑桥大学公共风险认知课的Winton教授(类似于国内的长江学者——译者注)David Spiegelhalter评论的那样,这四条都是“彻头彻尾的胡说八道”。
在谷歌、facebook和亚马逊这些公司不断通过我们所产生的数据来理解我们生活的过程中,现实数据支撑起了新互联网经济。爱德华.斯诺登揭露了美国政府数据监听的规模和范围,很显然安全部门同样痴迷从我们的日常数据中挖掘点什么东西出来。
咨询师敦促数据小白们赶紧理解大数据的潜力。麦肯锡全球机构在一份最近的报告中做了一个计算,从临床试验到医疗保险报销到智能跑鞋,如果能把所有的这些健康相关的数据加以更好的整合分析,那么美国的医疗保险系统每年可以节省3000亿美金的开支,平均每一个美国人可以省下1000美元。
虽然大数据在科学家、企业家和政府眼里看起来充满希望,但如果忽略了一些我们以前所熟知的统计学中的教训,大数据可能注定会让我们失望。
Spiegelhalter教授曾说到:“大数据中有大量的小数据问题。这些问题不会随着数据量的增大而消失,它们只会更加突出。”
在那篇关于谷歌流感趋势预测的文章发表4年以后,新的一期《自然杂志消息》报道了一则坏消息:在最近的一次流感爆发中谷歌流感趋势不起作用了。这个工具曾经可靠的运作了十几个冬天,在海量数据分析和不需要理论模型的条件下提供了快速和准确的流感爆发趋势。然而这一次它迷路了,谷歌的模型显示这一次的流感爆发非常严重,然而疾控中心在慢慢汇总各地数据以后,发现谷歌的预测结果比实际情况要夸大了几乎一倍。
问题的根源在于谷歌不知道(一开始也没法知道)搜索关键词和流感传播之间到底有什么关联。谷歌的工程师们没有试图去搞清楚关联背后的原因。他们只是在数据中找到了一些统计特征。他们更关注相关性本身而不是相关的原因。这种做法在大数据分析中很常见。要找出到底是什么原因导致了某种结果是很困难的,或许根本不可能。而发现两件事物之间的相关性则要简单和快速的多。就像Viktor Mayer-Schönberger 和 Kenneth Cukier 在《大数据》这本书中形容的那样:“因果关系不能被忽略,然而曾作为所有结论出发点的它已经被请下宝座了。”
这种不需要任何理论的纯粹的相关性分析方法,其结果难免是脆弱的。如果你不知道相关性背后的原因,你就无法得知这种相关性在什么情况下会消失。谷歌的流感趋势出错的一种解释是,2012年12月份的媒体上充斥着各种关于流感的骇人故事,看到这些报道之后,即使是健康的人也会跑到互联网上搜索相关的词汇。还有另外一种解释,就是谷歌自己的搜索算法,在人们输入病症的时候会自动推荐一些诊断结果进而影响到了用户的搜索和浏览行为。这就好像在足球比赛里挪动了门柱一样,球飞进了错误的大门。
谷歌将使用新的数据再次校准流感趋势这个产品,重新来过。这当然是正确的做法。能够有更多的机会让我们简捷的采集和处理大规模的数据,这当然有一百个理由让人兴奋。然而我们必须从上述例子中汲取足够的教训,才能避免重蹈覆辙。
统计学家们过去花了200多年,总结出了在认知数据的过程中存在的种种陷阱。如今数据的规模更大了,更新更快了,采集的成本也更低了。但我们不能掩耳盗铃,假装这些陷阱都已经被填平了,事实上它们还在那里。
在1936年,民主党人Alfred Landon与当时的总统Franklin Delano Roosevelt(富兰克林.罗斯福——译者注)竞选下届总统。《读者文摘》这家颇有声望的杂志承担了选情预测的任务。当时采用的是邮寄问卷调查表的办法,调查人员雄心勃勃,计划寄出1000万份调查问卷,覆盖四分之一的选民。可以预见,洪水般寄回的邮件将超乎想象,然而《文摘》似乎还乐在其中。8月下旬的时候他们写到:“从下周起,1000万张问卷的第一批回执将会到达,这将是后续邮件洪峰的开始。所有这些表格都会被检查三次,核对,交叉存档五份,然后汇总。”
最终《文摘》在两个多月里收到了惊人的240万份回执,在统计计算完成以后,杂志社宣布Landon将会以55比41的优势击败Roosevelt赢得大选,另外4%的选民则会投给第三候选人。
然而真实选举结果与之大相径庭:Roosevelt以61比37的压倒性优势获胜。让《读者文摘》更没面子的是,观点调查的先创人George Gallup通过一场规模小的多的问卷,得出了准确得多的预测结果。Gallup预计Roosevelt将稳操胜券。显然,Gallup先生有他独到的办法。而从数据的角度来看,规模并不能决定一切。
观点调查是基于对投票人的的大范围采样。这意味着调查者需要处理两个难题:样本误差和样本偏差。
样本误差是指一组随机选择的样本观点可能无法真实的反映全部人群的看法。而误差的幅度,则会随着样本数量的增加而减小。对于大部分的调查来说,1000次的访谈已经是足够大的样本了。而据报道Gallup先生总共进行了3000次的访谈。
就算3000次的访谈已经很好了,那240万次不是会更好吗?答案是否定的。样本误差有个更为危险的朋友:样本偏差。样本误差是指一个随机选择的样本可能无法代表所有其他的人;而样本偏差则意味着这个样本可能根本就不是随机选择的。George Gallup费了很大气力去寻找一个没有偏差的样本集合,因为他知道这远比增加样本数量要重要的多。
而《读者文摘》为了寻求一个更大的数据集,结果中了偏差样本的圈套。他们从车辆注册信息和电话号码簿里选择需要邮寄问卷的对象。在1936年那个时代,这个样本群体是偏富裕阶层的。而且Landon的支持者似乎更乐于寄回问卷结果,这使得错误更进了一步。这两种偏差的结合,决定了《文摘》调查的失败。Gallup每访谈一个人,《文摘》对应的就能收到800份回执。如此大规模而精确的调查最终却得出一个错误的结果,这的确让人难堪不已。
如今对大数据的狂热似乎又让人想起了《读者文摘》的故事。现实数据的集合是如此混乱,很难找出来这里面是否存在样本偏差。而且由于数据量这么大,一些分析者们似乎认定采样相关的问题已经不需要考虑了。而事实上,问题依然存在。
《大数据》这本书的联合作者,牛津大学互联网中心的Viktor Mayer-Schönberger教授,曾告诉我他最喜欢的对于大数据集合的定义是“N=所有”,在这里不再需要采样,因为我们有整个人群的数据。就好比选举监察人不会找几张有代表性的选票来估计选举的结果,他们会记点每一张选票。当“N=所有”的时候确实不再有采样偏差的问题,因为采样已经包含了所有人。
但“N=所有”这个公式对大多数我们所使用的现实数据集合都是成立的吗?恐怕不是。“我不相信有人可以获得所有的数据”,Patrick Wolfe说,他是伦敦大学学院的一名计算机学家和统计学教授。
推特(Twitter)就是一个例子。理论上说你可以存储和分析推特上的每一条记录,然用后来推导出公共情绪方面的一些结论(实际上,大多数的研究者使用的都是推特提供的一个名为“消防水龙带”的数据子集)。然而即使我们可以读取所有的推特记录,推特的用户本身也并不能代表世界上的所有人。(根据Pew互联网研究项目的结果,在2013年,美国的推特中年轻的,居住在大城市或者城镇的,黑色皮肤的用户比例偏高)
我们必须要搞清楚数据中漏掉了哪些人和哪些事,尤其当我们面对的是一堆混乱的现实数据的时候。Kaiser Fung是一名数据分析师和《数字感知》这本书的作者,他提醒人们不要简单的假定自己掌握了所有有关的数据:“N=所有常常是对数据的一种假设,而不是现实”。
在波士顿有一款智能手机应用叫做“颠簸的街道”,这个应用利用手机里的加速度感应器来检查出街道上的坑洼,而有了这个应用市政工人就可以不用再去巡查道路了。波士顿的市民们下载这个应用以后,只要在城市里开着车,他们的手机就会自动上传车辆的颠簸信息并通知市政厅哪里的路面需要检修了。几年前还看起来不可思议的事情,就这样通过技术的发展,以信息穷举的方式得以漂亮的解决。波士顿市政府因此骄傲的宣布,“大数据为这座城市提供了实时的信息,帮助我们解决问题并做出长期的投资计划”。
“颠簸的街道”在安装它的设备中所产生的,是一个关于路面坑洼的地图。然而从产品设计一开始这张地图就更偏向于年轻化和富裕的街区,因为那里有更多的人使用智能手机。“颠簸的街道”的理念是提供关于坑洼地点的“N=所有”的信息,但这个“所有”指的是所有手机所能记录的数据,而不是所有坑洼地点的数据。就像微软的研究者Kate Crawford指出的那样,现实数据含有系统偏差,人们需要很仔细的考量才可能找到和纠正这些偏差。大数据集合看起来包罗万象,但“N=所有”往往只是一个颇有诱惑力的假象而已。
当然这个世界的现实是如果你能靠某个概念挣到钱,就没人会关心什么因果关系和样本偏差。全世界的公司在听到美国折扣连锁店Target的传奇式成功(由纽约时报的Charles Duhigg在2012年报道出来)以后估计都要垂涎三尺。Duhigg解释了Target公司是如何从它的顾客身上搜集到大量的数据并熟练的加以分析。它对顾客的理解简直是出神入化。
Duhigg讲的最多的故事是这样的:一名男子怒气冲冲的来到一家明尼苏达附近的Target连锁店,向店长投诉该公司最近给他十几岁的女儿邮寄婴儿服装和孕妇服装的优惠券。店长大方的向他道了歉。可不久后店长又收到这名男子的电话要求再次道歉——只是这一次对方告知那个少女确实怀孕了。在她的父亲还没有意识到的时候,Target通过分析她购买无味湿纸巾和补镁药品的记录就猜到了。
这是统计学的魔法吗?或许还有更世俗一点的解释。
Kaiser Fung在帮助零售商和广告商开发类似的工具上有着多年的经验,他认为“这里面存在一个严重的虚假正面效应的问题”。他指的是我们通常都没有能够听到的无数的反面故事,在那些例子里没有怀孕的妇女们也收到了关于婴儿用品的优惠券。
如果只听Duhigg讲的故事,你可能很容易就觉得Target的算法是绝对可靠的——每个收到婴儿连体服和湿纸巾购物券的人都是孕妇。这几乎不可能出错。但实际上孕妇能收到这些购物券可能仅仅是因为Target给所有人都寄了这种购物券。在相信Target那些读心术般的故事之前,你应当问问他们的命中率到底有多高。
在Charles Duhiggs的描述中,Target公司会在给你的购物券中随机性的掺杂一些无关的东西,比如酒杯的券。否则的话孕妇们可能会发现这家公司的计算机系统在如此深入的探测她们的隐私,进而感到不安。
Fung对此则有另外的解释,他认为Target这样做并不是因为给孕妇寄一份满是婴儿用品的购物手册会让人起疑,而是由于这家公司本来就知道这些手册会被寄给很多根本没有怀孕的妇女。
以上这些观点并不意味着数据分析一无是处,相反它可能是有高度商业价值的。即使能够把邮寄的准确度提高那么一点点,都将是有利可图的。但能赚钱并不意味着这种工具无所不能、永远正确。
一位名叫John Ioannidis的传染病学家在2005年发表了一篇论文,题目叫“为什么大多数被发表的研究结果都是错误的”,标题言简意赅。他的论文中一个核心的思想就是统计学家们所称的“多重比较问题”。
当我们审视数据当中的某个表象的时候,我们常常需要考虑这种表象是否是偶然产生的。如果这种表象看起来不太可能是随机产生的时候,我们就称它是“统计上显著的”。
当研究者面对许多可能的表象时,多重比较错误就可能发生。假设有一个临床试验,我们让部分小学生服用维他命而给其他小学生安慰剂。怎么判断这种维他命的效果?这完全取决于我们对“效果”的定义。研究者们可能会考察这些儿童的身高、体重、蛀牙的概率、课堂表现、考试成绩甚至是25岁以后的收入或者服刑记录(长期追踪观察)。然后是综合比较:这种维他命是对穷困家庭的孩子有效,还是对富裕家庭的有效?对男孩有效,还是女孩?如果做足够多的不同的相关性测试,偶然产生的结果就会淹没真实的发现。
有很多办法可以解决上述的问题,然而在大数据中这种问题会更加严重。因为比起一个小规模的数据集合来说,大数据的情况下有太多可以用作比较的标准。如果不做仔细的分析,那么真实的表象与虚假表象之比——相当于信号噪声比——很快就会趋近于0.
更糟的是,我们之前会用增加过程透明度的办法来解决多重比较的问题,也就是让其他的研究者也知道有哪些假设被测试过了,有哪些反面的试验结果没有被发表出来。然而现实数据几乎都不是透明的。亚马逊和谷歌,Facebook和推特,Target和Tesco,这些公司都没打算过跟你我分享他们的所有数据。
毫无疑问,更新、更大、更廉价的数据集合以及强大的分析工具终将产生价值。也确实已经出现了一些大数据分析的成功实例。剑桥的David Spiegelhalter提到了谷歌翻译,这款产品统计分析了人类已经翻译过的无数文档,并在其中寻找出可以自己复制的模式。谷歌翻译是计算机学家们所谓的“机器学习”的一个应用,机器学习可以在没有预先设定编程逻辑的条件下计算出惊人的结果。谷歌翻译是目前所知的最为接近”无需理论模型、纯数据驱动的算法黑盒子”这一目标的产品。用Spiegelhalter的话来说,它是“一个令人惊讶的成就”。这一成就来自于对海量数据的聪明的处理。
然而大数据并没有解决统计学家和科学家们数百年来所致力的一些难题:对因果关系的理解,对未来的推演,以及如何对一个系统进行干预和优化。
伦敦皇家学院的David Hand教授讲过一句话,“现在我们有了一些新的数据来源,但是没有人想要数据,人们要的是答案”。
要使用大数据来得到这样的答案,还需要在统计学的方法上取得大量长足的进展。
UCL的Patrick Wolfe说,“大数据就好像是蛮荒的美国西部。那些头脑灵活野心勃勃的人会想尽办法利用一切可能的工具,从这些数据中淘出点值钱的东西来,这很酷。但目前我们做的还有些盲目。”
统计学家们正争先恐后的为大数据开发新的工具。这些新的工具当然很重要,但它们只有在吸取而不是遗忘过去统计学精髓的基础上才能成功。
最后,我们再回头来看看大数据的四个基础信条。
其一,如果简单的忽略掉那些反面的数据,比如Target的怀孕预测算法,那么我们很容易就会过高的估计算法的精确度。
其二,如果我们在一个固定不变的环境里做预测,你可以认为因果关系不再重要。而当我们处在一个变化的世界中(例如流感趋势预测所遇到的那样),或者是我们自己就想要改变这个环境,这种想法就很危险了。
其三,“N=所有”,以及采样偏差无关紧要,这些前提在绝大多数的实际情况下都是不成立的。
最后,当数据里的假像远远超过真相的时候,还持有“数据足够大的时候,就可以自己说出结论了”这种观点就显得过于天真了。
大数据已经到来,但它并没有带来新的真理。现在的挑战是要吸取统计学中老的教训,在比以前大得多的数据规模下去解决新的问题、获取新的答案。
via: 199it.com 摘自: 译言
扫一扫 加微信
hrtechchina