绵绵不断网绵绵不断网

广发宏观:如何对GDP进行月度估算

  报告摘要:

     GDP 数据是宏观何对衡量经济运行最为重要的指标,它衡量的行月是一个时段所有商品和服务的“综合增加值”,无疑比任何单一领域的度估经济数据都靠近于经济真实表现,也是宏观何对我们判断增长周期位置和边际变化方向的主要依据。但目前的行月GDP 数据公布频率最高也仅为季频,不利于市场实时跟踪经济变化,度估把GDP 高频化具有重要意义。宏观何对

     金融市场越来越有效,行月所以宏观数据的度估高频化是一个趋势,比如用发电量、宏观何对耗煤量、行月行业开工率等高频数据去观测工业部门;用地铁客运量、度估航班执行率等数据去观测居民部门;用航运运价等数据去观测出口表现。宏观何对

     GDP 是行月一个更具综合性的衡量经济绩效的指标,涵盖了工业部门、度估服务业部门、对外部门,比任何单一指标都更靠近真实经济表现,GDP 指标如果能进行高频化模拟,无疑具有重要意义。

     GDP 如何高频化?一个最简单便捷的做法是用月度工业增加值同比去粗略估算月度GDP。工业增加值有“小GDP”之称,占GDP 的比重超过30%,可以视为GDP 的一个大样本;且经济中所有终端需求的变化,如出口、消费、资本开支,最终都会映射到工业生产上。从历史经验看,季度工业增加值与实际GDP 之间具有同步性,1992 年以来与GDP 相关系数达0.93,变动方向一致率达84%。但一则在有些时段二者会有方向背离,比如在建筑业、第三产业波动较大的时候;二则二者的变动幅度不同,工增序列标准差为5.5,而实际GDP 序列标准差仅为3.3。

     季度工业增加值与实际GDP 的同步性体现在两个方面,一是两者自1992 年至今的相关系数高达0.93。二是单纯看两者同比每月变动方向,一致率达到84%。

     两者单季方向背离的20 个季度大致分布在六个时间段,其中15 个季度集中在2008 年之前。近期方向背离的时段是在2014 Q4、2016Q2Q4,以及 2019Q1Q4。这些背离时段大部分同时是第三产业GDP、建筑业GDP与整体GDP 变动方向相同的时间段,说明“背离”可能与第三产业GDP、建筑业GDP 波动影响有关。

     除了变动方向外,两者变动幅度也有所差异,从波动率看,季度实际GDP 运行明显更为平稳,工增序列标准差为5.5,而实际GDP 序列标准差仅为3.3。除了金融危机期间以及2020-21 年基数干扰较大外,其余时间里,两者变化幅度上出现较大差异的时间段一是在2001 年Q4 至2003 年Q1 的上行周期中,工增提升较快且回升斜率较陡,而GDP 同比虽同为增长,但回升缓慢,这背后可能是规模以下工业企业增加值增速平缓带来的。二是2014 年至2016 年,工增与GDP 虽然趋势上均为回落,但工增回落幅度明显更大,并且单季出现过回升的时间点。这期间第三产业GDP 同比表现持续增长,增长的幅度和工业GDP 下降的幅度相当。

     所以我们需要进一步去对模拟方法进行细化。GDP 的核算有生产法、支出法、收入法,我们选择以生产法作为估计月度GDP 的主要框架,支出法在指标选择方面提供补充。主要考虑到生产法下数据可得性较高、映射关系较为直接,而支出法下需要两阶段建模,会隐含着两层误差。

     第一,基于生产法框架估计的月度GDP 可以直接和官方口径的季度GDP 数据进行对比。而且支出法自身只有年度数据,对于建模的时效性和样本点来说都有所限制。

     第二,我们估算月度GDP 的核心逻辑是寻找月度层面的其他经济指标,这类经济指标与GDP 存在映射关系。

     这种方式本质上就是生产法GDP 中的“相关指标推算法”。从指标核算的方式本身来看,寻找替代指标进行建模的思路更接近于生产法框架下GDP 核算方法。

     第三,基于生产法框架的预测可以找到更准确的相关指标。从三次产业中各行业占GDP 的比重可以看到,工业占GDP 约32%,工业增加值本身与GDP 一致,为增加值数据,用于建模的合理性较强。如果基于支出法估计月度GDP,建模时不能直接将社零、固投以及海关统计进出口对GDP 建模。更好的方式是先分别对最终消费支出、资本形成总额以及货币服务进出口进行建模,得到转换系数,再进一步对GDP 建模。这一过程中就会融入两层误差。

     方法一是用工业增加值、服务业生产指数建立两变量ARDL 模型,其中“AR”部分表示GDP 季同比过去值对当前GDP 同比的影响,“DL”部分表示工业增加值、服务业生产指数当期同比,及两者的前期值(T-1 期、T-2 期……)对当前GDP 同比(T 期)的影响。这一方法拟合度较高,2017 年以来误差平均0.01%;缺点是时效性有一定影响,需要等到每月15 日经济数据公布。

     从占比来看,工业占了第二产业的八成,我们用工业部门作为第二产业的代表;第三产业涉及行业繁杂,占比较大的是批发零售、金融、地产行业,但三者汇总后的占比也尚未超过第三产业的一半。我们直接利用统计局与2017 年3 月正式对外发布的服务业生产指数作为第三产业增加值的代理变量。

     简单来说,工业增加值代表二产,服务业生产指数代表三产。模型选择ARDL(1,4,4),保留季度GDP 滞后一阶,工增、服务业生产同比滞后4 阶,解释力得到99.3%。这一模型优点在于两点,一则拟合度较高,2017年以来误差平均0.01%;二则指标最为简洁,逻辑清楚。缺点一是时效性欠佳,需要等到每月15 日经济数据公布;二是服务业生产指数起始点为2017 年3 月,建模序列较短,难以用于进行长周期分析。

     方法二是用工业增加值、社零、地产投资建立三变量ARDL 模型。由于服务业生产指数只有2017 年以来的数据,对观测过往的经济周期可能样本不够。我们用第三产业中占比相对较高的批发零售业、房地产业两个行业来替代。相较于方法一,这一方法在拟合优度没有损失过多的前提下,可以进行更长序列的月度GDP 分析。当然,缺点同样是需要等待每月15 日的经济数据公布。

     由于服务业生产指数自2017 年开始公布,用该指标与工增同比进行月度GDP 的估测只能获得自2017 年3 月起始的月度GDP 指数序列,对于跟踪研究我国国内增长周期来说,样本点较少。第三产业中占比相对较高的批发零售业(占GDP 约10%)与第三产业的GDP 走势一致性也最高,相关系数达到0.78。其次是房地产业,统计上相关系数为0.77。

     简单来说,工增代表第二产业GDP,社零代表第三产业中的批发零售项,地产投资代表第三产业中的房地产业项。建模具体方式与方法一类似,即季度序列建模定权重,月度自变量序列配权后合成月度GDP。模型选择ARDL(1,3,4,1),保留季度GDP 滞后一阶和四阶,工增滞后3 阶,社零滞后4 阶,地产投资影响集中在当期,模型解释力96%。这一模型优点在于,由于自变量起始点较长,可以得到自1999 年6 月来的月度GDP同比,1999 年以来预测平均误差在0.03%。拟合优度没有损失过多的前提下,我们可以进行更长序列的月度GDP 分析。缺点同样是时效性欠佳,仍然需要等到每月15 日经济数据公布;二是近期预测结果波动有所加大。

     方法三是高频的三变量模型。为了能进行月度GDP 同比的提前预测,我们选择工业增加值的代理指标工增同比扩散指数,社零的代理指标社零同步扩散指数,地产投资的代理指标30 城商品房销售同比进行ARDL 模型回归。这一模型的缺点在于拟合优度有所下降,需要进行误差调整;而优点相当于以此为代价换取提前15 天左右的预测,至少可以当作一个环比方向上的参考。

     沿用方法二中思路建模,将能更高频获得的工增同比扩散指数、社零同步扩散指数、30 城商品房销售同比与GDP 同比进行ARDL 回归,模型解释力92%。这一优点在于利用高频数据,可以在每个月月末得到当月月度GDP 的估计值。缺点在于拟合优度有所下降,需要进行误差调整。本质上我们相当于牺牲了8%左右的拟合优度下降,以此来换取提前15 天左右的预测。

     我们用方法一和方法二估算了2023 年以来单月的GDP 模拟同比增速,并对两种方法下的结果取平均值。这一测算方法下6-8 月月度GDP 同比分别为4.7%、4.1%、4.9%,8 月经济较6-7 月数据已初步回升,与我们报告中所说的“较为全面的边际好转”结论一致。今年二季度基数较低,为避免基数干扰导致二三季度不可比,我们进一步测算了这一方法下的两年复合增速,8 月两年复合同比为4.2%左右的水平(4%的两年复合增速对应年度GDP 增速5%左右),本轮经济的谷底在4-5 月已经形成,7 月是修复过程中的一个增速回撤点,但也高于4-5 月。

     风险提示:用于估测月度GDP 的模型选择存在选择适用性问题;底层数据指标选择上,工增同步指数、社零同步指数所采用的高频数据或存在样本偏差、或存在遗漏变量问题;利用季度模型定权重中可能会高估或低估每月经济变量与每月GDP 同比之间的关系。

赞(27)
未经允许不得转载:>绵绵不断网 » 广发宏观:如何对GDP进行月度估算