这里有两个关键词,第一个是用适当的经济学模型。最好使用现有的经济学模型,就能把它给讲出来,模型又比较精巧,然后你还能用数学语言讲出来。什么叫恰当的经济学模型呢?如果你是做制度经济学或者新政治经济学研究的,那应该知道最近几年一个火的不得了的人,他叫达龙·阿西莫格鲁(Daron Acemgolu),他几乎所有的文章都很精巧,他有一篇文章“Why Did the West Extend the Franchise?”,就是说西方民主化过程是怎么走过来的,西方的民主化过程并不是短期内完成的,英国大概花了 220 年的时间,一直到 1928 年妇女才拥有跟男人同等的选举权4。他讲了一个什么故事呢?他就讲穷人跟富人之间的斗争,穷人斗的厉害,要自己的利益,富人就放一点。我们完全可以用马克思的阶级斗争来解释,但是你要用马克思的阶级斗争来解释,别人就不认,至少从现代经济学的眼光来看,这不是一个理论或者是不能接受的理论。所以他编了一个故事,他编的是一个 Commitment(承诺)的故事,当穷人向富人要福利的时候,富人说我给你,但是决定权还在我这里。但是穷人一想,你答应给我,到头来你又不给我,怎么办啊?这里面其实是一个承诺问题,怎么实现这个承诺呢?富人说干脆让你们穷人决定,这不就是民主吗。你自己决定该怎么干就怎么干,我不管了。这个故事就是一个经济学的模型,这也是 Edward Prescott 得诺贝尔奖的模型。但我觉得根本没有必要这个模型,马克思的阶级斗争理论完全可以解释,而且可能解释的更充分。但是你最好写一个经济学的模型,讲一个经济学的故事,别人可能更容易相信。
我们知道中国政府起的作用非常大,投资很多,对经济是不是扭曲作用,问题的提出是基于这样的背景。当然最简单的想法就是一个直接效应,政府收税,将税收用于投资,就会挤出居民消费,居民消费自然就会下降。我们想看到的是一个间接效应,政府的投资会不会有扭曲。第一,政府可以得到便宜的银行贷款,政府用大量土地获得大量便宜的贷款,由于资金比较便宜,有可能投资过度。第二,政府之间的竞争可能导致超额投资,政府为了吸引企业投资,将基础设施建设的非常好。比如天津的滨海新区,为了打造良好的投资环境,要建一座世界上一流的歌剧院,邀请的咨询团队都是美国纽约林肯中心的人。我估计这个项目一下子十几亿就下去了,那短期内能不能见效呢?我想大概短期内是不会见效的,滨海新区本来没人住,你还期望北京人开车去滨海新区看演出。这是一类典型的竞争导致的过度投资。政府投资往往对工业企业有补贴,因为他吸引的都是制造业。我们看一下政府之间竞争主要是在竞争制造业,为什么竞争制造业呢?制造业迁移起来较方便,你不竞争,他就跑到其他地方去了,另外制造业的市场大。它不像服务业,服务业只能服务一个地区,市场容量有限,制造业的产品可以卖到本地,可以卖到全国,甚至可以卖到全世界去。但是制造业的劳动回报率要低,它比服务业和农业的劳动回报都要低,资本利润就会上升,但是资本所有者的边际消费倾向低。这些原因都可能导致居民消费比例下降。这里给大家看一副图,我们可以看到政府的储蓄率要超过居民的储蓄率。居民的储蓄率 37.5%,最近这些年政府的储蓄率都超过45%,所以政府的投资非常大。我们这里的数据,是用的省份的数据,但我们有一个新的角度来看这个问题。基本建设投资里头有三项,一类是道路之类的真正的 Infrastructural 投资,第二类是资本性投资,最后一类是其他的投资(包括水库等),这样看的话它的投资主要是第一项,所以我们大概把它看作基础设施投资。我们首先做了一个简化式的回归(Reduced-form estimation),什么是简化式的回归呢?简化式的就是把你的解释变量放在右手边,被解释变量放在左手边,直接做回归。被解释变量就是居民消费占省的 GDP 的比重,右手边放基础设施投资占省的政府支出的比例,还有一些控制变量。 vi 是省的固定效应, vt 是时间固定效应。我们控制了什么呢?第一个是政府收入占 GDP 的比例,这就是第一个直接效应(挤出效应),我们还控制了人均 GDP 和它的平方来控制结构转型,然后控制国有企业的劳动力就业份额,还有控制了国际贸易,这些都是可能影响居民消费的变量。我们这里并没有把所有的变量都放进去,你可以说变量还不够的,但我们这里主要关注的是基础设施建设投资比例,我们这里只控制主要的变量,并不需要控制所有的变量。所以我说做经验研究,也是要讲一个故事,而不是说要找出影响居民消费的因素,这是毫无意义的。我们得出的结论是,如果基础设施建设投资占 GDP 的比重上升一个百分点,居民消费占 GDP 的比重会下降二点八个百分点,这是一个很大的效应。
我们还要想象别人会问什么问题,一个是主要的解释变量的内生性问题,那我们滞后一年、三年来看,发现结果还是非常显著。考虑到里面会有一些发现经济周期作用,所以我们用 5 年平均的办法来做,发现结果也是很显著。还有一个就是是不是省的时间趋势,所以我们又考虑了省的时间趋势,就我刚才说的用省的哑变量,既省的哑变量乘以日历时间,通过这个把时间趋势给去掉。然后我们又换了政府的支出(而不是收入)来做,也是很显著的。为什么要换呢?按理说,基础设施投资占政府支出的比例,应该控制政府的支出,但是从省的层面上,政府的支出可能跟当地经济发展没有多大关系,因为中央的补贴很多,所以后来我们主要用政府的收入,结果都很显著。反过来,如果我们的故事是对的,我们说政府的基础设施建设投资会超出社会最优水平,但是如果由私人来投资就不应该有影响。于是我们把私人投资占 GDP 的比重给放进去,发现没有影响。从反面我们也要证明自己的结论。我们这里的这些控制变量,还有一个作用就是控制省如果用私人来投资他的最优投资水平应该是多少。
我们为了解释内生性问题,又做了一个动态模型。用动态模型就是要把伪相关给去掉,在右手边加上了因变量的滞后一期,这里是用 GMM(Generalized Method of Moments)估计的结果。我们还做了消费的量,有人会说,既然基础设施建设投资有利于经济增长,那它可 能会刺激居民的消费,所以我们就看了一下居民消费倾向是不是受基础设施投资比例的影响,估计的结果显示对人均消费几乎没有影响。我们又看了一下对全国的影响,把左手边的 变量换成一个省的居民消费占全国 GDP 的比重,发现也是一个负的数据,所以它对全国也没有影响。
我们先看一看 SUR Model(似无相关回归),然后又做了一个三阶段最小二乘回归(3SLS)。两个相对照,三阶段的更为有效,但结果是差不多的,资本回报也是一样的。这类文章,我想说的是做经验研究,一定要很仔细很小心。我们这篇文章还不是达到了最严格的标准,还是有内生性的问题。为什么我鼓励大家使用微观数据呢?微观数据内生性的问题就会小得多。省级的数据,所有的因素都是互相影响的,你想找一个干净的变量是很困难的。我们这里也没有试图去找所谓的干净变量,更没有找工具变量,因为找不到,你只能靠 argue,所以我还是鼓励大家多用微观数据做计量研究。