范玮卫,范丽萍,马铭阳
(1.河南工学院 车辆与交通工程学院,河南 新乡 453003;2.河南工学院 理学部,河南 新乡 453003)
近年来随着AIGC[1]逐步进入各个领域,人工智能对于经济社会的影响已经迫使各行业必须考虑利用类似方案推进效率提升。由于在数据统计和模型运算等方面的优势,人工智能能够快速契合各种具备大样本量的社会领域[2],这使得在人才管理领域运用人工智能进行建模分析也成为最新的研究焦点。
特别是在人才评价指标体系的构建和运行方面,建模分析具备一些天然优势。随着模型运算技术的发展,人才管理与数理统计方法的结合越发紧密,相应的各种指标评价体系也被学者广泛研究[3]。在当今人工智能开始逐步取代传统衡量机制的时代,如何确定更具分析价值的指标数据成为衡量人才价值的关键。此类指标不能是简单罗列,需要区分优先级,并能够自洽地处理既定目标和各类问题。从管理层面看,评价指标体系应具备相当的统计属性,能够体现复杂状况下相对精准的数值变化和总体趋势。因此需要在研究中将各类复杂指标相互耦合,整理形成具备实用性和复合性的指标体系。
本研究根据层次分析法[4]提炼和归纳的核心指标要素对同属性指标进行归类。并依据各指标要素类型,逐一研究适配的拟合函数和程序,以及复合函数的耦合算法,最终通过得到的复合指数模型[5],研究不同指标权重变化及所反馈的人才评价信息。
本研究针对前期由层次分析法将传统人才评价体系无法体现的定性指标与传统定量数据有机结合,所获分级指标进一步提炼核心要素,将相同要素与对应的运算方法,依照判断标准(判断层)和适配算法(执行层)进行建模运算。由于执行层中函数方案可以匹配具备相同要素的评价指标,因此只需将合适的指标子项归纳于总指标类型,即可采用总指标对应的执行方案运算,能够省略指标子项多层分级,极大地简化各类指标筛选拟合函数并求解的运算过程。
基于前期工作已分级的评价指标数据,本节将各指标根据影响人才评价(目标层)的不同维度,通过一致性检验判断要素归类,从而获得高度归纳的五个总指标项(见表1)。而前期分析的一级指标多数作为核心子项保留。例如,归属个人能力的隐性属性,在后续研究中又以潜力值、发挥度等二级细分指标体现。同时,由于管理导向倾斜,部分具备高加权赋值[6]的二级指标,例如横纵向项目,因其影响人才评价强度值超出设定阈值,也作为核心子项归于总指标项目资源类。判断层通过指向性分析,完成各核心指标在判断层的要素归类,而后在执行层中寻求与之匹配的执行方案。而执行层在获得各指标拟合函数后,又进一步完成函数间复合运算,求解具备复合属性指标数值,并根据测算数据反馈人才评价信息。执行层的算法实现为本文重点研究内容。
表1 人才评价分层架构
3.1 复合模型算法基础
在常规意义下,可以将部分具备一定规律的评价指标转化为某一变量的函数1。而该函数解u可作为另外一个函数2的变量。那么两者可以耦合为新的函数3。由于函数3是由函数1和2复合构成的,那么函数3就具备了特殊映射能力。从人才管理角度,新的复合函数同时具备了原有函数的特性,并进行了耦合。比如,原有论文成果仅能表现个体在该成果中体现的能力,将其量化为初等函数即为传统管理体系中表现出的简单量化积分,不论是否线性,该函数仅体现该文章在该专业领域学术信息分享层面的受关注度,很难进行横向比较。如果将作者自身特定属性,如年龄、学科等信息进行统计,形成新的初等函数,而将论文成果作为新的变量输入后,能够将简单的论文信息附加在个人社会属性之上,形成了能够提供更精确指导的复合指数模型。
针对部分传统可量化指标的耦合,能够体现出新的管理思维,特别是多元化和平衡性。比如,原定项目业绩函数分为纵向项目函数和横向项目函数,两者体现的核心不同,前者以项目层级为变量进行计算,后者以合同经费作为变量进行计算。但是从管理层面来看,需要同时保有高级别项目和高额进账以反馈单位科创业绩。因此将两者耦合,采用项目级别和合同经费的复合指数作为新指标项目资源的数据体现,就能够在评价人才时充分平衡横纵向项目的科创业绩。同时,如果作为变量的函数本身与新函数存在相同因素,则可以放大该因素效果,从而实现管理层面隐性影响的显性化。
(4)
其中,S为最终可用于人才管理评价的复合指数;T为经过多指标函数耦合得到的初级复合函数;α为各指标的权重;i代表第i项。
通过函数的复合,本研究将得到的新指数作为评价人才属性的核心管理信息,并通过调整加权赋值(公式4)[7],进一步优化管理策略。同时,调整过加权值的指数,还可以进一步耦合组成更具复合属性的进阶指数,最终形成不断完善的指数模型。
3.2 分指标函数拟合
本研究模型构建的关键在于如何对各项初始指标进行拟合,然后利用合理耦合算法将多指标拟合函数耦合成为合适的复合函数,其得到的结果就是本研究需要的复合指数,可用于人才管理中的价值评价、导向引导等。
3.2.1 量化指标拟合
通常传统人才评价指标均为量化指标,比如项目数量、论文数量、经费数量等。此类指标无需复杂计算即可获得较为理想的线性函数。又或者类似奖项级别、平台级别、采纳层级等,虽然此类指标不能直接进行量化,但是在传统量化指标中也已应用多年,具备一套自洽的量化体系,所以本研究基本沿用原有体系即可获得理想的拟合函数。
对于上述量化指标,本研究采用基本拟合函数的最小二乘法(公式5)进行比较来确定最佳函数。
(5)
其中,f(xi)为第i个指标点对应的拟合函数值;yi为第i个指标点对应的实际值;M表示第i个点的拟合函数模拟误差。
通常此类函数以采样法进行拟合:首先假设所得数据均为有效样本数据;其次选择主要变量列表或制图;然后根据数据分布选取适当算法函数进行拟合;最后对比确定最佳拟合函数。以相对复杂的人才荣誉级别为例,虽属于传统指标体系核心,但由于荣誉系统相对复杂,层级庞杂,评价制度也很难界定。因此本研究假设该数据与人才能力之间的关系属于非唯一解函数,最终以最小二乘解为最佳解。同时由于此类指标能够进行大量采样,根据算法列式,可得如下矩阵。
(6)
其中,n>m。
由矩阵6形成的方程组可以保证方程大于解。由于此类指标具备传统量化属性,通常可以假设为线性关系。例如假设人才经费多少直接与个人能力相关,根据上述算法,可以认为两者关系成线性(公式7)。
u=ax+b
(7)
其中,u代表个人能力;x代表经费数量;a和b为拟合函数参数。
因此本研究基于项目经费的初等函数可以转化为矩阵8,然后利用矩阵转置运算求解a,即可得到对应经费与能力之间的线性函数。利用同样算法可以求解二阶拟合以及更高阶曲线拟合。不过考虑此类指标经过传统评价体系长期运行,基本符合线性关系,为降低整体运算量,本研究对其采用一阶线性拟合。
(8)
(9)
3.2.2 时间指标拟合
通常而言,如果在人才评价体系中加入时间元素,往往最便捷的方法就是进行简单的时间平均,即假设某一变量在一段时间内的变化Ti+1,等于上一个阶段变化量与时间增量之和。但是单纯的增量拟合受时间段n的限制,n越大计算越准确但也越慢;n越小数据间波动越明显。因此,这样的拟合受限制较多。
=Ti+(Ti+1-Ti+1-n)/n
(10)
其中,某一变量在一段时间内的变化为Ti+1;上一个阶段该变量变化量为Ti;n代表一段时间内均分数值;i为第i个时间节点。
通常在处理此类因素时多采用简单的指数函数进行处理。处理方法是首先假设一个在(0,1)区间的常数作为变量参数K,那么在统计Ti+1时只需要满足公式11的算法,就可以根据Ti+1和Ti两个参数就可以完成拟合。而拟合精度又与变量参数K的选取有关,同样可以用公式5进行对比筛选。
Ti+1=KTi+Ti+1(1-K)
(11)
其中,K为拟合时间变量平滑参数。
同时,用公式11逐层递推,最终可以获得一个与时间变量呈指数关系的函数,因此也可以称为指数拟合。但是这种简单指数函数处理,往往在长时间人才评价数据分析时有所滞后。因此研究中还可以通过增加属于时间趋势的参数变量Li,进行两次指数函数拟合可得公式12,可以更方便地预测与时间有关的变量变化趋势。只需要将时间趋势变量与时间增量耦合就可以得到相应的时间变量在一段时间以后的变量。当然,如果时间、算力足够还可以进一步叠加指数函数。但综合考虑研究时间和计算资源,本研究仅尝试二次指数函数处理为止。
Ti+1=K(Ti+Li)+Ti+1(1-K)
(12)
3.2.3 社会属性拟合
前面两类指标一个是最简单的数字指标,具备良好的线性特性;另一个则至少能够转化为以观测点为数值的量化指标,从而体现其本身规律。但本节所涉及的社会属性则相对复杂。在人才评价体系里,通常将此类属性孤立出来进行评判,并且很少能获得对应的数据支撑。比如在传统意义上海归博士往往具备更佳的资源匹配,应该有更好的业绩产出。这一点在本研究的调研数据中无法获得良好的支撑,说明此类人才来源并不能很好地与个人能力形成规律性、可量化的指标。此类目标很难简单归纳为某种数值,往往需要依靠大量冗余的相关数值,通过大数据分析才能探索出个别关键信息。但本研究前期基于大数据建模分析工作,难以获得此类复杂信息的精确拟合函数。同时,因其没有特别准确的量化参数,此类指标的函数拟合需要一个不需要先验性的假定,这也导致建模时不能过分依赖可测度的数值。针对这种无法参标化,或者说不能取得参标共识的情况,本研究借用经济学常用的Malmquist指数模型(公式13)处理此类指标的初始拟合。经原毅军等人[8]证实此类模型可以相对准确地处理非参数化的数据体系分析。但是研究表明,对于此类特殊指标,仅采用Malmquist指数处理数据可能会遇到无解的情况。因此,本研究通过变换参法测试合理的模型求解方法,最终采用全局效应算法耦合Malmquist指数函数(公式14),称为Global-Malmquist(GM)指数模型,以保证Malmquist指数函数不存在无解情况,且大幅简化整体运算消耗。
(13)
(14)
本研究不关注GM指数的Fare分解[9]和RD分解[10]的区分,所用GM指数模型是在前期经过层次分析法处理过的不同参数基础上,根据适配原则对不同参考指标采用上述两种解法之一求解,因此对GM指数的两种主要分解方法都可能用到,具体由涉及参数的性质决定。
3.2.4 其它指标拟合
此处计算以研究中遇到的难以归类的特殊指标为拟合目标。对此类指标比较难以界定输入和输出参数,甚至不好定义其对人才能力估算或业绩评价是否有正向意义。因此,在研究中采用的处理方式是尝试筛选对比不同适配的参标范畴,利用特定软件具备的简单拟合函数测试阶段拟合精度,进行拟合匹配。通常采用指数函数的不同算法进行简单尝试,主要判断该参标是否具备保留意义,对精度不做过多要求。
4.1 量化指标程序实现
通常此类指标以线性拟合函数求解,因此本研究利用regress函数或ployfit函数进行简单拟合求解。
regress函数程序:
x=[x1x2… xn];
y=[y1y2… yn];
a=[ones(i,j),x’];
b=y’;
r=regress(a,b,h)
ployfit函数程序:
x=[x1x2… xn];
y=[y1y2… yn];
a=[ones(i,j),x’];
b=y’;
p=ployfit (a,b,h)
利用上述程序计算出函数参数a和b即可得到拟合函数用于后续耦合计算。
4.2 时间指标程序实现
根据前述研究分析,此类指标仅采用简单指数拟合函数进行计算。
一次指数程序
from statsmodels.tsa.api import Simp1e ExpSmoothing
y-hat-avg=test.copy()
fit=SimpleExpSmoothing np.asarray(train["Count"])).fit(smoothing-leve1=0.6, optimized=False)
y-hat-avg["SES"]=fit.forecast(len(test))
二次指数程序
from statsmodels.tsa.api import Holt
y-hat-avg=test.copy()
fit=Holt(np.asarray(train["Count"])).fit(smoothing-leve1=0.3, smoothing-slope=0.1)
y-hat-avg["Holt-linear"]=fit.forecast(len(test))
程序校验
plt.figure(figsize=(X, Y))
plt.plot(train["Count"], labe1="Train")
plt.plot(test["Count"], labe1="Test")
plt.p1ot(y-hat-avg["SES"], 1abel="SES")
plt.legend(loc="best")
plt.show()
4.3 社会属性程序实现
由于本特性需要采用GM指数模型,同时还需要结合不同DEA模型进行运算,因此本节实用代码通常采用常规DEA程序结合GM指数程序进行运算,前者不再累述,后者根据软件自带功能进行调用实现。主要根据Malmquist指数面板设置xtset,然后选择不同的分解方案即可。
GM指数程序执行:
xtset dmu W
pancl variable: dmu (strongly balanced)
time variable: W, x to y
delta: n unit
malmq2 1 k=g, dmu(cit) sav(malm)
Malmquist Productivity Index Results:
(Row: Row # in the original data; Pdwise: periodwise)
其中,W代表测算参标;x和y分别为该参标上下限;代码第5行如执行malmq2 1 k=g, dmu(cit) sav(malm) rd则为RD分解,如执行malmq2 1 k=g, dmu(cit) sav(malm, replace) global则为GM分解。
4.4 其他指标程序实现
本节研究采用常规集中算法进行测试拟合,下述仅列举个别简单算法。
指数函数程序:
function zhishunihe
%y-nh=a*e^(b*x)
% lny=lna+bx
clear
clc
x=[x1x2… xn];
y=[y1y2… yn];
% plot(x,y,"*");
m=length(x);
% n=l1;
s-x=l2;
s-xx=l3;
s-y=l4;
s-xy=l5;
pc=l6;
for i=1:m
s-x=s-x+x(i);
s-xx=s-xx+x(i).*x(i);
s-y=s-y+log(y(i));
s-xy=s-xy+x(i).*log(y(i));
end
X=[m,s-x,;s-x,s-xx];
Y=[s-y,s-xy]";
A=pinv(X)*Y;
a=exp(A(1,1));
b=A(2,1);
for i=1:m
pc=pc+(a.*exp(b.*x(i))-y(i)).^2;
end
最小二乘法拟合指数函数程序:
本研究采用Python中NumPy库中的polyfit函数来进行最小二乘拟合。下例代码用于拟合指数函数y=ae^(bx)。
首先,将指数函数转化为线性函数,以便进行线性最小二乘拟合,从而通过两边取对数来实现这一点,即ln(y)=ln(a)+bx。
注意:以下程序假定数据在列表x-data和y-data中,并且已经导入了numpy库。
import numpy as np
x-data=np.array([x1 x2 … xn])
y-data=np.array([y1 y2 … yn])
lnx-data=np.log(x-data)
lny-data=np.log(y-data)
coefficients=np.polyfit(lnx-data, lny-data, 1)
a=np.exp(coefficients[0])
b=coefficients[1]
print(f"拟合的指数为: a={a}, b={b}")
这个程序将输出拟合的指数函数的参数a和b。上例仅示意线性拟合,因此结果可能并不完全准确,后续研究取决于数据符合何种指数函数形式,可据此进行适当调整。
5.1 加权分析
通过上述耦合计算和分析建模后,本研究大致整合出满足调研单位人才管理重点导向的一级指标,如表1中项目资源等。而后根据人才管理阶段不同,本研究又利用复合指数模型计算获得以科创潜力、发挥度等指数为主的十余类具备隐藏属性的次级指标。此类指标将根据研究和单位导向需要不断完善,且在特定阶段具备优于首要指标的加权赋值。最后,考虑传统指标,包括论文、专利、著作和奖励,体现人才成果业绩等,结合新增复合指标,本研究构建了涵盖专业属性、个人荣誉、人才培养、社会认可和职能属性等能够反应人才社会认可度和影响力的14个核心指标,并依据层次分析法进行权重赋值,结果汇总如表2。
表2 重要指标权重赋值
表2反馈了本研究调研单位在不同时期对人才管理导向的变化对各类指标加权赋值的影响。表中指标为已经经过模型验算后的复合指标,不过部分具备相当重要性的单一指标依然保留。在单位开始引进人才阶段,以潜力指标和毕业院校为执行核心,部分指标无法体现。在引入人员后,单位首要引导人才熟悉教学和科研,同时要求在项目层次上取得突破,所以有所侧重。而后当具备足够的项目积累和教学经验后,人才管理策略开始向经费激励导向。当人才积累满足单位相当时期的稳定运行后,大规模招新已经不再进行,那么相应地如何开发现有人才的潜力和发挥度成为管理重点,同时还必须考虑人才年龄和入职时限指标反馈出的种种问题。
5.2 数据分布
图1显示了本研究调研对象年龄和入职年限的数据分布规律。从图中可以看出本次调研对象对于入职年限而言基本符合正态分布,对于调研数据分析具有积极影响。而调研对象的年龄则相对偏高,这与调研对象的学历和工作性质有关,属于客观情况。
图1 数据分布图(左:年龄分布;右:年限分布)
5.3 对比分析
图2以年龄对比年均产出和年限对比项目资源的数据对比分析结果为例,主要说明不同数据之间的相互影响关系。从图2中可以看出,受年龄影响,个人年均科研业绩数据向30-40年龄段区间集中,同时分值分布偏低。而受入职年限影响,个人项目资源从1.0-2.5年的密集区向两边逐步下降。这都说明科研工作能力受年龄和入职年限影响具备区间集中特性,需要准确把握高产区间加以良好引导。
图2 数据对比图(左:年龄对比年均产出;右:年限对比项目资源)
5.4 综合分析
依据最终个人发挥度表现,图3将入职年限、年龄与包括项目资源、学术成就、科研成果、社会资源、潜力值、年均产出和发挥度在内的几个核心复合指标的分布规律进行了分布对比。从图3可以看出,入职年限分布均匀,且随着年限增加与发挥度保持良好的正比关系;年龄偏高,且发挥度受年龄影响不明显,核心值域分布于中年龄段也总体发挥度适度;而学术成就和社会资源两项基本垫底,与调研对象总体工作年限偏低有关;科研成果与发挥度基本成正比,但个别具备优良科研成果的人员发挥度却不高的特例,需要引起管理层面的注意;潜力值由于主要反映入职前的能力,并不能与研究期间实际发挥度直接挂钩,一部分对象无法适应目前工作,发挥度低于自身原有潜力值,而另一部分原有潜力值偏低,但是在就职单位能够较快找准定位,就能够获得较好的发挥度;就年均产出而言,基本能够反映个人在职期间的发挥属性,但受发挥度指标的复合算法影响,存在一定偏差,此与潜力值对比发挥度关系类似;最后总体项目资源虽能够促进个人科研业绩提升,并扶持个人发展,但受研究期限和项目周期复合影响,目前还未完全体现在当前发挥度数据上。
图3 核心指标演化趋势图
本研究就如何将人才管理中可能影响评价结果的种种因素进行了数据化处理,并利用分层思维简化和实现了非参数指标的体系融合。本研究利用不同指数函数,将传统人才管理的定量评价指标与具备相当影响力的定性信息进行复合运算,得到了复合指数模型及相应具备复合因素的各类指标。通过采用上述复合函数进行数据整合,实现了参数的复合属性和非数值属性的标准化。然后利用指标之间的数据变化趋势分析,得到了有利于管理评价的信息。并提取部分核心指标数据进行了分析说明,阐述了该模型针对人才管理如何进行分析和指导的方法。后续工作将就各个指标具体反馈信息进行逐一探讨分析,进而利用计算模型帮助人才管理层进行衡量评估,使资源配置更加精确,提升管理效率。
猜你喜欢 指数函数函数人才 人才云英语文摘(2022年4期)2022-06-05幂函数、指数函数、对数函数(2)新世纪智能(数学备考)(2021年9期)2021-11-24二次函数新世纪智能(数学备考)(2021年9期)2021-11-24幂函数、指数函数、对数函数(1)新世纪智能(数学备考)(2021年9期)2021-11-24第3讲 “函数”复习精讲中学生数理化·中考版(2021年3期)2021-07-22二次函数新世纪智能(数学备考)(2020年9期)2021-01-04幂函数、指数函数、对数函数(1)新世纪智能(数学备考)(2020年9期)2021-01-04幂函数、指数函数、对数函数(2)新世纪智能(数学备考)(2020年9期)2021-01-04函数备考精讲中学生数理化(高中版.高考数学)(2020年9期)2020-10-28忘不了的人才之策商周刊(2018年13期)2018-07-11