ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

DARPA世界建模者(World Modelers)项目介绍

2021-02-04 19:31:24  阅读:224  来源: 互联网

标签:分析 定量 机器 DARPA 模型 Modelers 苏丹 World 因果


背景

World Modelers(世界建模者计划,2017-2021年,下面简称WM)是Big Mechanisms的后续项目,与D3M、Causal Exploration是同一个项目经理(Dr. Joshua Elliott)。周期为48个月,分为三个阶段,前两个阶段各为18个月,最后一个阶段为12个月。旨在开发一种将定性因果分析与定量模型和相关数据相结合的技术,能够使分析人员快速建立模型,对复杂、动态的国家/世界安全相关的问题形成全面理解。

WM主要瞄准的问题是次国家级(subnational)的,这种关注反映了冲突和安全性质的变化。如果分析粒度过高,只能得到概括性的结论(例如,撒哈拉以南非洲可能挨饿),而不是有针对性的建议(例如,南苏丹加强安全将使国内流离失所的农民能够返回他们的田地)。在时间上,World Modelers致力于评估其预测的准确性,因此倾向于将时间跨度定为未来一到五年。

粮食不安全将是世界建模者计划的初始用例,在世界许多地区,社会难以养活日益增长的人口,粮食不安全是一个日益严重的问题。粮食不安全既是人道主义挑战,也会对地区安全产生影响,因为粮食短缺可能导致移徙/流离失所和人民之间的冲突。而WM技术将使研究人员能够高效而严格地执行分析任务,例如“分析未来两年南苏丹每个地区的粮食不安全状况”。随着项目的逐渐成熟,WM技术将逐步扩展到其他场景。

 

技术目标

WM的目标是开发一种技术,能够促进全面、有针对性、因果、定量、概率和及时的分析。WM的分析结果需要能够及时发布,提供可以避免危机的一些建议和具体措施。项目所开发的技术仅仅需要几周甚至几小时的处理就能够形成参数化的、定量的预测结果,而按照当前的水平,即使了解更简单一些的系统都需要花费数月或数年的时间。我们以“南苏丹粮食不安全”作为背景,展开说一下项目的技术目标:

1. 综合分析:影响粮食不安全的因素一般很多。综合分析考虑所有相关因素,而经济分析只考虑食品价格,安全分析则考虑农民能否安全地在农场工作。

2. 有针对性的分析:通过参数化模型来反映在每种特定情况下的事实。例如,为了模拟南苏丹的粮食不安全,我们将参数化一般作物产量因素,如天气和土壤肥力,以及相对于粮食安全最初可能显得次要的经济因素。这样一个有针对性的分析更有可能揭示,当南苏丹在2015年货币贬值时,尽管天气好、产量高,但粮食价格(和粮食不安全)仍在上升。

3. 因果分析图:对因果影响因素(如天气和货币贬值)进行正式/规范的表示,称为因果分析图。因果分析图将作为机器和人类开展定性和定量分析的基础框架。因果分析与基于指标和结果之间相关性的分析形成对比,例如食品价格与食品骚乱发生率之间的相关性。

4. 定量模型:尽可能将定性分析与定量模型结合起来。例如,与其说南苏丹的作物产量预计是“好的”,不如运行作物产量模型,获得在当地条件下的定量估计。

5. 概率分析:南苏丹粮食不安全分析中出现的不确定性是因为因果因素的真实值未知。例如,南苏丹的农作物依赖降雨,但最近有利于南苏丹的厄尔尼诺现象很难预测。世界建模者的一个目标是导出结果的概率分布。一个相关的目标是尽可能应用减少不确定性的方法(例如,集成方法)。项目目标之一是开发自动化技术,让机器在人类分析师的指导下执行这些分析。

6. 及时分析:人类已经开发出全面的、有针对性的、定量的和概率的分析,但这在很大程度上是一个手工过程,成本高昂且耗时。澳大利亚联邦科学和工业研究组织(CSIRO)在国家和全球范围内整合了涉及自然资源利用、宏观经济和能源问题的定量模型,以探索在气候变化背景下水、能源和粮食的未来。这一工作花了一个领域专家和计算机科学家团队两年多的时间,整合了9个定量模型,评估20个定性场景。世界建模者的目标是将人类所做的大部分工作自动化,以便在大约一个月内进行此类分析。

 

分析过程

还是以南苏丹粮食安全为例,通过人机交互进行分析的过程可分为以下七个步骤:

  • 第1步:生成或获取一个通用的、定性的粮食安全分析图。
  • 第2步:针对南苏丹地区具体的分析需求,对通用的分析图进行修改。
  • 第3步:将可用的、专业的、定量的分析模型集成到分析图中。
  • 第4步:将定量模型和分析图进行参数化。
  • 第5步:配置场景并运行分析程序,为感兴趣的因素(如食品价格、热量摄入)生成定量结果。
  • 第6步:编制“不确定性报告”,对不确定性的来源进行记录,运行不确定性减少程序并进行敏感性分析。
  • 第7步:确定可能会对关注因素产生影响的行动(例如,市场上的维和人员)。

 

在以上的7个步骤中,分析图是核心。分析图是一个定性的因果结构,但随着分析过程一步一步地变得更加定量,最终它实际上形成了对地球物理、生物物理、社会经济等领域模型的耦合模拟。下图展示了分析图的逐步演化过程,每一步都由人和机器共同完成,WM项目的目的就是使机器尽量发挥更大的作用。

食品不安全的通用定性分析图可以通过机器阅读的方式来构建(如图A),它能够为以后的分析步骤提供一个良好的框架,但不会产生有针对性的分析。

初始定性分析图必须特殊化以适合南苏丹的分析需求(图B)。机器阅读也可能起到一定的作用。例如,在联合国粮农组织(Food and Agriculture Organization)关于南苏丹的国别报告中写道:“由于当地货币贬值、经济普遍低迷和普遍不安全,谷物价格在2015年末开始飙升。”半岛电视台的报道中说,“根据联合国的数据,邻国乌干达接收了数量最多的南苏丹难民,埃塞俄比亚、肯尼亚、苏丹、刚果民主共和国和中非共和国也接收了数万流民”。一项技术挑战是让机器将这样的文本映射到因果模型中的实体。另一项技术挑战是让机器搜寻到这种信息。

第3步开始将这个有针对性但仍然定性的分析图转化为定量的分析图。气候、气象、水文、种植业、商品分析等领域的专家已经建立了许多定量模型,需要被纳入分析图中。图1C表明,定性模型中的节点(如“生

长条件”)可能会以某种方式将信息传递给定量模型,如农业技术转让决策支持系统(DSSAT)种植模型,该模型反过来将定量信息传递回标记为“生产”的节点。步骤3包括如何利用定量模型来估计分析图中的定量参数。

一旦决定了如何在分析中使用定量模型,就有必要设置这些模型的参数来表示当地的条件(图D)。机器可能有助于完成这项任务,因为它们善于收集信息。例如,可以在线获取降雨数据(包括预报),还可以使用遥感数据和众包信息。一项技术挑战是,在线可用的内容与定量模型需要的内容之间的语义不匹配。例如,DSSAT需要太阳辐射数据,而在线源可能提供日长信息,在这种情况下需要转换。虽然日长很容易转化为太阳辐射,但寻找模型参数可能需要推理和领域知识。这个问题之所以重要,是因为一个好的解决方案将使得更广泛的应用专家、定量模型成为可能。许多专家模型已经开发了几十年,而且非常精确。

通过在分析图中的点上建立定量模型,将定性分析转变为定量分析。然而,并非分析图中的每个节点都会从定量模型中获取输出;例如,图D中标记为“access”的节点与定量模型没有关联。南苏丹东赤道地区获得粮食的程度如何?在不存在定量模型的情况下,人类可能需要编写函数来收集分析图中的定量信息(例如,来自DSSAT的生产信息),并将其结合起来,以生成图中其他地方参数的定量估计。世界建模者将开发技术,使这种组合功能的规范对人类来说尽可能容易。

下一步是配置一些场景(图E)。这通常是通过设置外生的“驱动程序”参数来实现的,其中许多参数是时间序列。例如,可以使用历史降雨数据生成一个合成系列,以表示南苏丹东赤道地区两年的降雨量。人类分析师通常会负责说出要分析的场景,但机器可能会帮助建立场景。机器的一个重要作用是检查分析图的语义一致性。例如,想要考虑干旱条件的人可能会设置一个不同于定量天气模型生成的降雨分布,因此分析有两个相互冲突的信息来源。如何解决冲突可能是分析员的决定,但是在非常复杂的分析图中检测这样的冲突对于机器来说是一个合适的任务。

当场景运行时,数值结果会在分析图中“冒泡”。因为场景可能涉及从分布中采样,所以每个场景的运行都会给出稍微不同的结果。因此,短缺/盈余等结果变量将有差异(图E)。

第6步是为每次分析生成一份“不确定性报告”。不确定性报告是必需的,因为没有它们,人们就不知道是否信任分析或如何改进分析。不确定度报告不同于分类准确度和R2等标准度量,后者仅总结不确定度,而不分析其原因。不确定性报告的确切内容由提议者指定,但这些报告应确定不确定性进入分析的位置以及如何通过分析图传播,并应记录减少不确定性的操作。虽然分析员是不确定性报告的主要用户,但是可以想象机器可能会根据机器可读的不确定性报告或多或少地自动修改分析图。

步骤2-6可以重复,直到分析人员满意为止。不确定性报告是分析质量的重要证据来源,通常会指导分析图的迭代细化。

第七步,确定行动,目前是由分析员完成的,分析员说他们认为正在发生或将要发生的事情,决策者决定如何去做。世界建模者将允许决策者使用分析图来探索干预措施。人类不善于考虑行动的组合或行动的多重后果,但机器能够尝试将多种行动组合在分析图上进行推演,从而发现最有效的行动(图F)。

 

技术领域

WM征集的五个技术领域是:

  • TA1:从在线资源建立定性模型。采用机器辅助的方式,构建全面的、有针对性的、因果的、定性的分析图。解决的问题是:”分析应该考虑哪些因素,这些因素之间是如何关联的?”。涉及到的技术有:机器读取因果片段,文本向本体映射,算法组装。
  • TA2:工作流编译器(用于集成定量模型)。机器辅助将定性与定量分析模型相结合,解决的问题是:“分析应该考虑哪些定量模型,它们如何相互连接并在一个共同的计算环境中运行?”。涉及到的技术有:科学工作流,网格计算,分布式仿真,人机协作对话。
  • TA3:参数化模型。机器辅助从多个来源搜寻数据,并将可用数据转换为参数。解决的问题是:“量化模型的参数化数据在哪里,可用数据和所需参数之间的映射是什么?”。涉及到的技术有:机器自动读取表,遥感数据,众包,投票。
  • TA4:从场景到行动。为分析人员提供接口,允许人指定场景并进行干预,由机器给出建议。解决的问题是:“在特定条件下,特定行为会产生什么影响?”。
  • TA5:不确定性报告。机器辅助分析不确定性的来源,并努力减少不确定性。解决的问题是:“分析是否可信?如何改进?”

 

资助团队

(仅列出能查到来源的)

1. Charles River Analytics[2],2018-2021,$4.4 million,研发的技术被称为Sensitivity Analysis of Uncertainty in Causal Environments (SAUCE),该技术有助于分析和理解,将提高决策水平,避免危机的发生。

2. SRI International[3,4],$7.2 million

3. USC Viterbi’s Information Sciences Institute[4],$13 million,名称为MINT,即Model INTegration

4. Raytheon BBN[5]

 

参考资料

[1] https://www.darpa.mil/program/world-modelers

[2] https://www.cra.com/company/news/sauce-and-security-charles-river-analytics-awarded-contract-model-domestic-and-global

[3] https://idstch.com/geopolitics/darpa-world-modelers-build-early-warning-response-system-rapidly-build-analyze-models-conflict-security/

[4] https://blog.executivebiz.com/2017/12/army-taps-sri-international-to-provide-research-support-for-darpa-effort/

[5] https://bbn-e.github.io/work/

[6] https://www.darpa.mil/attachments/DARAPA60_publication-no-ads.pdf

[7] https://www.darpa.mil/staff/dr-joshua-elliott

[8] https://www.grants.gov/web/grants/view-opportunity.html?oppId=292785

 

 

 

 

 

 

 

 

 

标签:分析,定量,机器,DARPA,模型,Modelers,苏丹,World,因果
来源: https://blog.csdn.net/xiaqingyin/article/details/113662864

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有