创业公司如何设置一个完美的绩效评估体系?

转载2018-05-25

当下的创业公司,已经越来越意识到“在特定阶段需要引入新血”这件事情了。但随之而来的问题是,无论是靠谱的老员工,还是新的优秀人才引进后,是否留得住?这会影响到组织建设中“选用育留”的后三者。

绩效评估和薪酬分配,这是所有公司,无论是大公司还是初创企业都要面对的问题,也是一个永恒的挑战。传统公司倾向于分析和处理问题,他们已经有了一套成熟的“丛林生存法则”;而初创公司更侧重于创造性地解决问题,灵活性更强。当然,在商业生命周期的不同阶段,这两种要素都是必要的。

好的组织体系,一定是融合所有人的力量:这既包括个体在组织愿景下不断往前奔跑,也当然包括个体的贡献被合理认定。

如何才能做好绩效评估?究竟有没有一个完美的绩效评估体系?今天分享的文章,通过分析绩效评估的5个现实、10个属性的基础上给出了3点应对之道。以下,Enjoy:

(本文作者:Steven Sinofsky /  编译:36氪)

关于大型公司和成功企业的绩效评价和管理的文章不少。Amazon采用的是OLR,也就是组织和领导力评估(organization and leadership reviews),目标是对组织里面效率最低的10%采取适当行动。Yahoo则引入了著名的QPR,也就是季度绩效评估,以“未达目标”或者“偶尔未达目标”等来对人员进行评价。

当然,我们并不认为这是技术圈独有的,每到年底华尔街的机构都要进行年度的奖金发放流程,鉴于牵涉到的金额数量巨大,这个过程里面充斥着各种的功能失调。甚至美国空军也有也有一个有关反馈和评估的传奇流程。

就像很多的公司流程一样,当公司做得“好”时,这个流程就是对的、神奇的;当公司做得不那么“好”时,则每一个流程要么是现状的症状,要么是其根源。

这篇文章审视的是大型组织绩效考核的挑战。其主要目的,是帮助分享一些现实情况,也就是孤立地看的话,为如此敏感的话题设计和实现一个系统是一个巨大挑战。

如果你把组织的环境(股价、公众认知、收入或利润、本地人才竞争等)叠加上去的话,则任何系统在一段时间内,都会被视为蛮横或者公平或者粗暴,然后当环境改变时又会摆向另一头。就像很多的公司流程一样,当公司做得“好”时,这个流程就是对的、神奇的;当公司做得不那么“好”时,则每一个流程要么是现状的症状,要么是其根源。

就像很多人也许希望把绩效管理看成是数字,进而可完美量化一样,其实它也像是我们设计和开发的产品,只不过是环境和社会科学的产品。我们想要定量、确定性和简单性,但环境很关键却是不固定且是定性的;我们渴望公平,这是相对的,但又坚持以事实为依据,这个又是绝对的。

尽管对简单性有着不懈的追求,但就像机票、车票或者免税代码一样,以为可以真正实现并维护好简单性是幼稚的想法。但这个挑战并不能改变简单性这个普遍共享的目标(相信我,人力对复杂系统的喜好程度不会超过其他人),但从实践上来讲这种纯粹性是无法实现的。将任何系统与某些理想系统相比,只会拉大渴望与实现之间的鸿沟,进而加剧对系统的沮丧甚至是恐惧。

如果这个话题简单的话,在Amazon美国书籍网站上查询“绩效评估”时就不会有2500多本书的查询结果了。更糟的是,畅销书都是那些有关如何写评语、如何操控系统、如何给老板留下好印象,或者如何在雇员表现不佳告诉对方你做得很好的书。

只有把那个列表拖到很后面的位置,才能找到尝试对评估系统进行定义的书,甚至那些书里面处处也都是警告。我个人的观点是这个主题最好的一本书是《衡量与管理组织的绩效(Measuring and Managing Performance in Organizations)》。

里面讲的不是完美的评估体系,而是通常在衡量员工时会遇到哪些陷阱和误区。我很喜欢这本书,因为它提醒了你有关衡量的一切,包括“三思而后行(measure twice, cut once)”、“衡量可以改变的”以及“衡量什么就能提高什么”等等。

注:我不是HR专业人士,对“绩效评估”、“绩效管理”或者“绩效评价”之类的微妙差别并不感兴趣。我认识并尊重它们之间的差异,但出于讨论的目的我倾向于混用这些术语。同时我也意识到,大家在执行这样一套体系的时候往往不区分这些词之间在学术上的细微差别。同时我也不是律师,所以我在这里说的话,在你的业务领域(地理位置、公司规模、业务板块)在法律上未必是可以的。

最后,这篇文章讲的不是任何过去或现在的实践,如有雷同纯属巧合。本文说的有些事情可能会引起争议,或者在某些人看来根本就是错误的。

一、5个现实

绩效评估有若干现实:

1.绩效体系融绩效、晋升/头衔、奖金与组织预算于一体。

不管你怎么看,一个人都无法按孤立的预算进行评估并提供报酬。公司作为整体对人力方面需要支付多少有自己的预算(工资、奖金、股票、晋升等)。这套体系绝大部分机械或量化的努力决定的并不是个人的绩效,而是在预算范围内如何分配给每个人。

尽管大家总想把职业发展和薪酬区分开来,但一旦个人看到自己的薪酬或者经理必须给出评分时就没法分开了。当你试图把这些元素(为了“公平”起见)分离时,你就会贬低了那些个人最不关心的东西的价值,但是通常大家在职业生涯的不同阶段会关心不同的东西,所以这就变成了一种猜谜游戏,很难知道什么才是一个人想要的奖励(让预算发挥最大影响)。

任何有关如何更公平、更灵活、提供更加绝对的评价,或者将绩效与薪酬分开的建议最后都得想办法跟预算挂钩。预算的存在推动了体系的存在。总会有预算(限制),别被“外快”给糊弄了,因为这只是个预算技巧罢了。

2.任何群体无论大小都有绩效分配问题。

到了一定时候,一群致力于类似模板的人在绩效上面就会体现出不同的分布。我们早在上学时就会从作业看到这种不同。

在工作场所有无数变量会影响到任何个人的表现,但这种可变性是存在的。在理想系统里面,你是可以将所有的变量与一些先天的“纯贡献”或“纯技能”隔离开来从而对某人进行评估。但现实当中你是没有办法这么做的,所以这种分配其实是掺杂了很多绩效相关的变量因素的。

一个变量驱动的绩效分配典型的例子就是工作的“重要性”,对此个人是没有话语权的,更糟的是重要性变了他们可能也不知道。如果什么事情失去了重要性或者因为某些外部原因变成关键,就总会影响到绩效。

3.在一个绩效有m个标签的体系里,除了拿到最高奖励的人,其他的人都认为自己离更高一级的人是“那么的接近”。

在学校,老师会把考试成绩分成不同的字母或数字等级。在职场,绩效体系一般也会按照一定的等级或者评分分配到每个人身上。

就像物理实验里面的力曲线一样,这套体系说只有一定比例的人能拿到最高绩效评定,类似的团队中也会有一定比例的人只能拿到最低分数。结果是组织几乎每个人都相信自己离下一级非常接近,就像你看着考试评级以为自己只用多得一分就能提高一个等级。

由于人性使然,几乎任何一个此类体系都必定遵循一个推论,那就是经理可能会暗示或者被管理的人可能会听到自己的评分距离下一个等级是多么的接近。所以推论是:“每个人都以为自己高于平均水平”。

4.在任何群体集合之中,几乎所有群体都认为自己的贡献比其他的群体大。

在一家有着很多群体的公司里,经理往往相信自己的群体按照相关衡量整体上表现要更加出色,不应该这样分配或者应该拿到更大的预算。群体往往认为自己的工作更艰苦、更有战略性,或者就是更有价值,但又低估别的群体的贡献。

一旦群体意识到预算固定,一些群体就会想设法争取到更大的预算,而这就会对整体预算构成挑战。其手段包括改变绩效分布的方式(增加高分档人数)或者干脆提高组内人员的薪酬。如果是这样的话组织就必须就群体的整体绩效(相对于彼此,这是很恶心的,跟个人绩效相对彼此的衡量方式很像)如何进行衡量提供指南。针对初创企业可以得出一条推论:“我们只招最好的人,所以我们全都超过平均水平。”

5.衡量不是绝对而是相对的。

要想衡量绩效必须有参照物。销售是“最容易”的,因为你有销售额度,然后你的酬金只是超过配额多少的衡量手段。这种简单性掩饰了围绕着额度设定进行的争执以及奖金表的制定过程,但这仍然是个相对的指标。

大多数产品都会有一些更模糊的目标,比如“完成该产品”或者“推销该产品”。公司越大这些目标越重要,但是个人的日常活动直接相关性越弱(“如果我解决了这个bug是不是就可以达成这笔销售?”)。

在大公司,目标设定(“OKR”)变得日益徒劳,因为“完成我的工作”似乎要跟别人发生关系,而他们的工作几乎简直没办法写出来。而写绩效评估大部分都聚焦在目标设定上,不幸的是,编目标的技巧你随时都可以炫耀。所有这些相对于聚焦在敏捷性上的评估方式是相当大的转变,提前数月描述成功会是什么样,几乎就是经营有方的对立面。

因此,衡量自己相对于同行的做事表现要可靠得多,但不好的是大目标都落到最高管理层身上了。所以这个话题主要是谈大公司的——在初创企业或者小公司,行动都转化为销售、营销、产品以及客户等非常直接的东西上面。

那些把年度绩效评定视为了解员工工作表现,如何或者跟员工分享反馈的地方的人完全搞错了——这个过程当中根本不应该有什么意外。

二、10个属性

一旦你接受了这些现实就会意识到某类系统的确如此。这种系统的目标就是要找出该付给大家多少钱——公司就得干这事儿。至于什么职业管理、反馈等等,其实都不是大家在查看自己“分数”的那一刻关注的东西。这肯定也不是想办法让自己的团队符合系统规则的经理,真正关注的事情。

那些把年度绩效评定视为了解员工工作表现如何,或者跟员工分享反馈的地方的人完全搞错了——这个过程当中根本不应该有什么意外。如果其中有什么意外,那一定是个没有任何系统能修复的错误。对于绩效来说,没有任何东西能够取代具体的、可行动且持续的反馈。如果你得到的不是这个那就得去问问了。

与此同时,你也不可能每天/周对自己的工作表现进行打分。这是因为你的表现要有参照物,但是那个参照物又不是一天就能确定的。找到合适的比较物,无论对个人还是经理都是一个挑战,因为要避免给双方带来意外,这是一个负担。就像你希望经理要沟通得当一样,个人也必须用心倾听。

安插一个合适的系统来分配薪酬是个巨大挑战。对公司、团队、经理以及个人利害攸关的东西太多了。讽刺的是,因为会对大家生活产生实质性影响的利害攸关实在太多,所以这套流程走下来需要好几个月,并且比组织的外向型工作还要消耗更多的脑子的情况不在少数。

更加讽刺的是,你越是想把流程往HR的关注点去靠,它跟工作脱节的程度就越大,给人的压力就越大。其结果是,绩效管理消耗了大型组织太多的时间和精力。

因为这个,公司的每个人都对这套体系积累了足够多的怨气,人人都有对它进行改进的主意。就像公司在打广告时会征求大家的意见一样——因为我们整天都看广告并且会买东西——在绩效评估的事情上我们也都要工作并且被考核,所以我们都能提供对这套体系的洞察和看法。跟对现有体系的各种奇闻异事心怀不满相比,从头设计一套体系就很不一样了。

鉴于厉害攸关的东西太多,而且对于如何改进这套体系人人都有想法,实际的事实是非常复杂的。你可以编撰一套规则出来,但是大家实施规则的方式你是写不出来的。

你可以迭代,追加越来越多的规则,越来越多的检查和平衡,但最终一套已经花费太多时间的流程会变成令人崩溃的负担。甚至在此之后,从统计上来说也会有很多人不会满意。到头来,经过几个周期等大家都有经验之后,绩效评估体系本身就变成了一场庞大的、会牵涉到金钱、士气、职业生涯等利害的多人游戏。

因此,任何系统最好的办法是定义变量,并且要认识到,按照定义,无论做出什么样的选择、无论在系统内工作的是什么人都不会是完美的。如果某人认为其结果不是朝着好的方向倾斜的话,他可以视为在作弊。或者一个人也可以视之为做对的事情,如果他认为结果是朝着正确的方向倾斜的话。

我自己的经验,是这里面太复杂了,想完整编纂出一套体系来是毫无意义的。相反,每个人只需用开放的心态和现实的眼光去审视其挑战性程度,然后在整个对话过程中反复掂量这些变量即可。如果光考虑其中一个而排除掉其他的,这套体系最终就会崩溃。

在建立一套绩效评估体系时,以下是必须考虑的10个最常见的属性:

➀ 确定团队规模。

“类似”员工(工作职能、资历、精通程度、责任)数需要有个临界值,达到这个临界值任何体系才有可能。如果人员不到100的话任何体系都不会真正见效。

与此同时,人数达到100的话就有了足够大的样本数量可看出绩效的差异性。在认为唯一公平的评估方式,是熟悉他们的工作的员工与一个需要很多数据点的体系之间总是会有冲突的。实际上,大概会有1到5个人对某人的工作非常熟悉,不过换种说法任何一位经理大概都能熟悉5到50人的工作。

到了一定时候,这套体系需要每一级管理层都基于不完整信息交流来对人进行公正的评估。团队规模也很重要,因为小小的“取整”工作也会变得非常棘手。想象一下如果你需要找出10%的人,而你的团队只有15个人是什么情况。

你显然要么选1个要么选2个人(如果这10%是“坏”的话就取1,如果是“好”的话就选2)。然后想象规模变成15000人。那么筛选的就不是1500人,而是1000或者2000人。这种取整相对预算来说不是太抠就是太贵了。

最佳实践:把系统根据资历和角色按100人分组。

➁ 综合考虑资历、工作职能以及项目并不能创建出一个同等群体。

想定义一个刚毕业的新员工相对于一位工作已经10年的老手的贡献,或者设计师相对于QA工程师的,经理相对非经理的,或者前端相对于运营工具的贡献——这些都是极其困难的。

当整个评估流程顺着管理链往上走时,总是会出现这种功能紊乱,总是会出现偏见——曝光率最高的人、工资最高的人或者工作、最稀缺的人才、比较了解的工作等等。

在这一点上,没有什么东西是天生邪恶的,但是如果那些沟通的结果是这些维度上的人获得更高的评价/薪酬的话,事情就会迅速变得棘手起来。如果这些群体规模达不到上面一点的要求的话,处理起来就比较有挑战性了,你得找到必要的平衡。

最佳实践:尽可能在项目团队内基于资历和工作职能定义同等群体。

➂ 针对目标衡量。

基于预定义的目标,来设定评估和薪酬系统是完全有可能的。这么做有两件事情是一定的。

首先,无论你认为评估流程可以节省多少时间,你都需要预先花时间走一个精心设计的目标设定流程;

其次,任何复杂度的任何努力都没有办法设定独立的目标,所以一旦不能实现目标,事情就变成了记录什么地方出了问题。

一旦每个人都意识到自己的薪酬要取决于其他人时,整个工作流程就被乌云笼罩,被无休止的责任、期望设定等跟实际工作没有关系的讨论占据了。更糟的是,管理层总是会说:“目标是你定的,所以你应该搞定它。”

评估流程中再也没有比实际设定目标但是目标又是包含了各种复杂构成更具挑战性的了——如果这是一个需要创意的目标,则敏捷性、Pivot(转型)和学习都会是过程的一部分。

最佳实践:让个人和经理达成可培养技能的熟练感以及项目成功感的目标,同时把评估聚焦在对更大使命的相对(量化的)贡献度上面。

➃ 理解跨组织的绩效。

绩效评估总是相对的,哪怕对比的是职能类似的组织(比如工程师)。如果一支团队刚刚做完一个版本,而另一支刚刚开始一个新版本的工作;或者一支团队做的时原有业务,而另一支做的是新业务;又或者一支团队没有竞争对手,而另一支跟别人打得头破血流;一支有很多销售支持,而另一支没有等等……

很多情况下,都没有明显的“比较”不同团队的手段,但你又需要在不同程度上进行这种比较。此外,评估到了某个时候,相对比较的基础可能会发生极大变化——比方说,某个管理层对不同团队完成情况的考核角度,可能根本就不是那些团队成员在日常工作中能够发挥影响的。

最佳实践:不要让不同组织陷入到为了薪酬互相争夺的情况,应该通过共同规划和执行相同的目标来培养跨团队协作的氛围。

➄ 维护一个融评分和奖励于一体的体系。

一般情况是评分体系有一套,奖励体系又一套。有人认为这是必要的。有人认为这纯属多余;有人非常关心其中一套,但只有对另一套非常满意,或者非常不满意的时候才会这样。

其实,可以形成一套让这两者完美关联到一起的体系,这样的话他们就可以说分设两套是多余的了。一套相关性很弱的体系倒不如让它脱钩,因为无论是牵涉到的个人,还是经理听到的,都是他们想听的或者说一套做一套。

与此同时,我们都习惯于“分数”,但9.67%的奖金感觉就不像是分数,因为你不知道它的相对意义是什么(所以即便大家想要按绝对来打分,要不了多久他们就想知道自己的相对位置在哪里)。

最佳实践:评价要清晰,让个人知道自己相对于同等群体站在什么位置,薪酬也要基于此来分配,经理要非常熟悉工作,能够在一定的既定评价范围内调整薪酬分配。

➅ 写绩效评估不是断案。

Amazon上面几乎所有关于绩效评估的书,关注的都是评估的艺术。你的绩效评估不是审判,写出有力或者有创意的报告并不能决定过去1年/月/季度的成败。对于希望让自己的绩效亮丽的个人如此,更重要的是对于希望弥补缺乏反馈/行动的经理来说更是如此。

绩效评估过程最糟糕的时刻是,当员工仔细分析经理的点评并且试图反驳,或者当经理拿出一堆举证某事的新例子(事情发生的时候经理当时却没有说)时。

最佳实践:降低这份文档本身的作用,明确它不是该流程的决策工具。

➆ 排名和标定是不一样的。

关于“员工排名”的概念说得已经够多了,也就是给一个群体的每个成员一个排名分数的过程。这样的流程永远永远都是非常糟糕的流程。

这样一套体系根本就不会有那种程度的精确性。你怎么去解释一支百人团队中排名第63和排名第64之间有什么区别?标定的做法,则是上述在同等群体额度成员之间的相对绩效。这群人的规模和数量是固定的,只要人员规模充分,几乎可以确定能够避免对边界情况无休止的讨论。

最佳实践:定义绩效组将团队成员划入,但是就不要再跟其他组别一起进行大排名了。

➇ 鼓励卓越团队。

大多数经理,都认为自己的团队是卓越团队,而且是唯一卓越的一个。表现出色已经被被招进团队。表现不佳的不管当时是怎么进来的,自然也会被踢走。结果表明如此。实施绩效评估系统变得越来越难,因为组织变得越来越强大越来越高效——理论上应该是这样的。

与此同时,这种情况不可能一直都这样(引进了新球员的球队也不可能在整个赛季都一帆风顺)。在一个动态的系统里面,会有些年是某支团队表现非常出色,而有的年份就不怎么样,但是从绝对意义上你是没法知道的。

绩效评价最僵化的元素就是,假设特定的团队或者个人已经达到了高峰,他们就是表现卓越的,因此这套体系已经不再适用了。不管这个团队是100人的工程师还是火力全开的执行团队,说这套体系不再适用是很诱人的。

但如果这套体系不适用的话其实你就没有体系。也许你的组织会有“终身职位”的概念,或者你的工作职能,主要是按照基于量化指标的配额提供薪酬——这些都是采用不同体系的办法。

最佳实践:做一套适用所有人的体系,或者做多套体系,制定清晰的规则规定哪些人适用哪一套体系。

⑨ 允许例外就会制造出一个以例外为基础的流程。

当团队把所有可能的约束都加进去,并且尝试对一个人的绩效进行最终评定时,往往会有感受到所有规则的痛苦之倾向,然后就去建立一个例外的模型。

比方说,你可以或有个10%的组但是允许有1%的例外。这样就总是会得到了一个9%或者11%的组,结果要取决于增加例外或者排出例外哪个更好。如果经理有权给排名低的人额外的钱,同时少给排名高的人一点钱的话,大多数人都会感受到这种自相矛盾的信息。所有这些例外会迅速渗透到组织和个人,最终例外就会成为流程的正常部分。

最佳实践:如果制订了一套体系,那就坚持原则,不鼓励有特例。

⑩ 全方位拥抱多元化。

在绩效评价和奖金的发放方面,甚至在同等群体里面出现千篇一律的倾向太常见了。这些,都可以通过任意数量的职业特点(这些特点可以视为风格或者实际表现特质)表现出来。

这方面我听过的最早故事之一,讲的是一名经理,他喜欢让大家为增加功能制订比较激进的目标——不幸的是缺乏衡量工作质量的手段。团队的其他成员会同时关注功能和质量。相对于bug数量很高的那个人,落后组的成员感觉自己很不利(因为前者只有数量没有质量)。

与此同时,这种团队往往是做出了很多功能,但是收尾工作很长的那种。绩效评估的完成时间不一样,这个故事的结局也会不一样。可能这两种工作风格都可以接受,但是不欣赏“稳扎稳打”的风格,就是经理接受风格多元化的失败。同样地,个人特质也总会有安静与大声,口头与书面等等之别。

最佳实践:任何强大且可持续的团队在各个维度上都是多元化的。

三、3个应对技巧

关于适用于组织的绩效评估,和薪酬分配办法还有很多东西可以说。说过的东西里面有太多都是负面的,而且都是一种“我们 v.s 你们”占主导的口吻,或者更糟,就认为这一切都是经理的错。

就像商业世界的很多事情一样,其实很多时候都没有合适的答案或者完美的办法。如果有的话,那就会有一套人人都会使用且时时适用的的绩效体系了——但,事实上并没有这样的体系。

有人建议这个问题唯一的解决办法,是给出一个薪酬预算然后让一定层级的经理负责。也就是经理根据自己的标准,来确定团队每个成员的薪酬。这也是一套体系——没有体系,本身就是体系。实际上这不是一套体系而是多套体系,每位经理一套。

每一个群体,都会达成某种满足团队需求的金钱分配和评价办法。会有“花生奶油”团队,会有“发大红包”的团队等等。甚至还会有利用这套体系作为招聘工具的团队。

尽管这样的体系被说了很多坏话,但是有一套可视、有一些框架以及一定的跨组织一致性的体系对组织整体是会带来很多好处的。即便存在挑战,但这些好处依然可以累积。

文章最后给大家(个人和经理)提供三个生存技巧,我们来看看似乎不公平、不透明或者疯狂的绩效流程应该如何应对:

1.没人掌握所有的数据。

个人,喜欢提醒管理层:你并不掌握特定员工的所有数据;经理,则喜欢提醒大家,自己比任何个人看到的数据点都要多;HR,喜欢提醒大家,他们掌握了业界的竞争性薪酬数据;高管,则喜欢提醒大家,自己有很多团队的数据。

归根结底,没人掌握流程的全貌。这意味着每个人都是在信息不完备的情况下做事的,但这并不意味着大家都做得不好。

2.分享成功,分担责任。

无论在什么样的背景下发生了什么,当大家一起分享成功分担责任时,人人皆可受益。

哪怕体系不完美,如果你做得好的话,一定要考虑一下别人有什么贡献,并且尽可能公开感谢对方。如果你认为自己得到了不好结果,不要把责任往别人身上推或者指责别人,多从自己身上找找原因把事情做好。

3.一切都会好起来的。

既然没有一个体系是完美的,很容易就会以为一个数据点的不完整是个永恒的难题。尽管很少被谈论,但我们要承认,有时候某些人,会得到比自己应得的高得多的排名和报酬。

事后,这些人可能会因为发现自己不值这么高的评价而内疚一阵子。不过在知识经济里,最后胜出的一定是人才。经理没有理由总是针对偶尔犯过一次错误的人才(因为经理自己也经历过类似的事情)。在一套复杂而不完美的体系里面,工作是需要受纪律并付出努力的——这其实是每个人在职业生涯当中都要掌握的技能之一。

无论是项目规划、绩效管理、战略选择、管理流程等等,这些都是社会科学,都会受到背景、错误率的影响,更重要的是都需要学习和迭代。

文章本文作者:Steven Sinofsky /  编译:36氪如有侵权,请联系删除。

疯狂BP免费在线商业计划书制作工具,提供各行业海量风格模板,创业计划书范文教程,此外还有专门团队提供商业计划书定制优化融资对接等服务。