收入不平等是经济学的首要问题之一。政策制定者必须解决这个问题的最有效工具之一是税收:政府根据人们的收入向他们收取资金,并将其重新分配,要么直接分配,要么通过福利计划,或者间接分配,用来支付公共项目的费用。但是,尽管更多的税收可以带来更大的平等,但对人们征收过高的税可能会阻碍他们的工作,或者激励他们寻找避免支付的方法-这就减少了整体的赌注。
要取得正确的平衡并非易事。经济学家通常依赖于难以验证的假设。人们的经济行为是复杂的,收集有关它的数据是困难的。几十年的经济研究一直在努力设计最好的税收政策,但这仍然是一个悬而未决的问题。
美国商业技术公司Salesforce的科学家认为人工智能可以提供帮助。在理查德·索彻(Richard Socher)的领导下,该团队开发了一个名为“人工智能经济学家”(AI Economist)的系统,该系统使用强化学习-与DeepMind的AlphaGo和AlpahZero背后的技术相同-为模拟经济确定最优税收政策。这个工具仍然相对简单(它不可能包含现实世界或人类行为的所有复杂性),但它是以一种全新的方式评估政策的有希望的第一步。团队成员亚历克斯·特罗特(Alex Trott)说:“让税收政策不那么政治化,而更多地依靠数据驱动,这将是令人惊叹的。”
在一个早期的结果中,人工智能发现了一项政策-就生产率和收入平等最大化而言-比学术经济学家研究的最先进的累进税收框架公平了16%。对美国现行政策的改善更大。马萨诸塞州布兰迪斯大学(Brandeis University)的布莱克·勒巴伦(Blake LeBaron)表示:“我认为这是一个非常有趣的想法。”他曾使用神经网络对金融市场进行建模。
在模拟中,四个人工智能工作者每个人都受到自己的强化学习模型的控制。他们与二维世界互动,收集木头和石头,或者与他人交易这些资源,或者用这些资源建造房屋,这会让他们赚钱。工人们的技能水平不同,这就导致了他们的专业性。低技能工人知道,如果他们收集资源,他们会做得更好,而高技能工人会知道,如果他们购买资源建造房屋,他们会做得更好。在每个模拟年度结束时,所有工人都要按人工智能控制的政策制定者制定的税率征税,政策制定者正在运行自己的强化学习算法。政策制定者的目标是提高所有工人的生产率和收入。人工智能通过重复数百万次模拟来收敛到最优行为。
这两种强化学习模型都是从零开始,没有任何经济理论的先验知识,并学会如何通过试错行事-就像DeepMind的人工智能在没有人参与的情况下学习在超人水平上下围棋一样。
你能从只有四个人工智能工作者那里学到很多东西吗?从理论上讲,是的,因为少数几个代理之间的简单交互很快就会导致非常复杂的行为。(例如,尽管围棋很复杂,但它仍然只涉及两个棋手。)。尽管如此,参与该项目的每个人都同意,如果该工具要对现实场景进行建模,那么增加模拟中的工作人员数量将是必不可少的。
人工智能的双倍剂量是关键。以前,在模拟经济中,神经网络已经被用来控制代理人。但让政策制定者也成为人工智能会导致一种模式,在这种模式中,工人和政策制定者会不断适应对方的行动。这种动态环境对强化学习模型是一个挑战,因为在一种税收政策下学习的战略在另一种税收政策下可能不会很好地发挥作用。但这也意味着人工智能机构找到了玩弄系统的方法。例如,一些工人通过降低生产率来获得较低的税级,然后再次提高生产率,从而学会了避税。Salesforce团队表示,工人和政策制定者之间的这种互让导致了一种比以前模型实现的任何东西都更现实的模拟,在以前的模型中,税收政策通常是固定的。
《人工智能经济学家》提出的税收政策有点不同寻常。与大多数现有政策不同的是,要么是累进的(即高收入者被征收更多的税),要么是倒退的(高收入者被征收的税更少),人工智能的政策将两者的各个方面拼凑在一起,对富人和穷人适用最高的税率,对中等收入的工人适用最低的税率。就像人工智能提出的许多解决方案一样-比如AlphaZero的一些制胜举措-结果似乎是违反直觉的,而不是人类可能想出来的东西。但其对经济的影响导致贫富差距缩小。
为了看看人工智能产生的税收政策是否会以类似的方式影响人类行为,该团队在通过亚马逊的Mechanical Turk雇佣的100多名众包员工身上进行了测试,这些员工被要求控制模拟中的员工。他们发现,这项政策鼓励人类以与人工智能大致相同的方式玩游戏,这表明-至少在原则上-人工智能经济学家可以被用来影响实体经济活动。
人工智能支持的模拟的另一个优势是,您可以调整参数以探索不同的场景。例如,可以通过增加社会距离和限制获取资源等限制,或者通过将人员从劳动力中移除来对大流行的影响进行建模。索彻说:“如果未来看起来非常不同,就很难提出基于过去的最优税收理论。”
勒巴伦说,模拟模型改变的能力是一个很大的优势:“看到工人们调整自己以适应税法,这是相当有趣的。”他说,这绕过了对现有税收模式的一大批评,在现有模式中,行为通常是固定的。
LeBaron的主要保留意见是,到目前为止,该工具仅限于少数代理。他说:“有人争辩说,你只需几个代理人就能获得深刻的智力洞察力。”“我不是其中之一。”他希望看到它模拟大约100名工人-这也是Salesforce团队的目标数字。
但勒巴伦认为,这个工具已经可以用来检查现有经济模型的合理性:“如果我是政策制定者,我会启动这个工具,看看它说了什么。”他说,如果人工智能经济学家不同意其他模型,那么这可能是其他模型遗漏了一些东西的迹象。
与Salesforce团队合作的哈佛大学计算机科学家和经济学家大卫·帕克斯(David Parkes)也持乐观态度。他同意他们需要大幅增加代理人的数量。但一旦他们做到了这一点,并在模拟中添加了一些额外的特征,如公司,他预计就能复制现有的理论结果。“然后它就会立即变得有用,”他说。
然而,牛津大学(University Of Oxford)经济学家多恩·法默(Doyne Farmer)却不那么信服。尽管他对强化学习从游戏到经济学的交叉表示欢迎--“这涉及到你是否可以像AlphaZero围棋那样调查政策的问题”--但他认为,该工具真正有用还需要一段时间。“现实世界太复杂了,”他说。
该团队承认,一些经济学家将需要说服。为此,他们发布了自己的代码,并邀请其他人通过它运行自己的模型。Socher说,从长远来看,这种开放性也将是使这些工具值得信赖的重要组成部分。他指出:“如果你使用人工智能来建议某些人减税或增税,你最好能说出原因。”