2008-2023年上市公司-企业研发操纵数据-社科经管https://download.csdn.net/download/paofuluolijiang/90880455
https://download.csdn.net/download/paofuluolijiang/90880455
覆盖2008-2023年A股上市公司的研发操纵行为,累计包含超3.4万条观测值,涉及4300余家样本企业。基于《改革》《科研管理》等权威期刊的构建方法,数据涵盖研发操纵的核心指标,包括:异常研发投入(实际研发投入与回归预测值的差值)、研发操纵虚拟变量(异常值为正时赋值为1)以及研发投入强度(研发费用占上期总资产比例)等。此外,数据集整合了企业财务与经营指标,如总资产、营业利润、托宾Q值、市值对数及行业分类代码(证监会2012版),并提供面板数据格式,便于直接用于计量分析。
数据主要来源于上市公司年报、国家统计局公开信息及权威经济管理平台。例如,异常研发投入的计算基于研发支出、企业市值、总资产等变量的回归模型,参考了苑泽明等(2020)提出的方法。数据预处理中剔除了金融行业、ST企业及缺失值,并对连续变量进行缩尾处理,以降低极端值影响。部分字段还附赠了原始数据与处理代码(Stata),支持研究者复现或拓展模型。
该数据集为多领域研究提供支持:其一,在企业治理层面,可分析高管背景、股权结构等因素对研发操纵的影响,如学术经历或国际背景的高管可能抑制操纵行为;其二,在政策评估中,可用于检验税收优惠(如研发加计扣除)的实际效果及监管漏洞;其三,在金融市场领域,可关联股价崩盘风险、投资者情绪等变量,揭示信息不对称导致的资源配置扭曲。此外,数据中行业与区域分类为跨群体比较提供了基础,例如高新技术企业与传统企业的操纵动机差异。