Covid-19大流行已经提升了数据对全球公众的能见度和重要性,因为健康和政府机构解释和沟通准确,并及时了解大流行语使用数据分析。关于Covid-19大流行的国际响应的公共数据的可用性,可能是在世界各地的锁定模式进行更大的洞察力评估。为了获得对可能的返回正常情况的洞察,数据科学家在域建模的数据,以预测返回正常的时间表,并在牛津大学发布的ContinkMent Policies数据集中绘制数据。探险的努力也在支持一项倡议紧急联盟要了解Covid-19大流行后的全球康复看起来像什么。
数据驱动方法
已经履行了八种经济指标,包括学校,工作场所,公共活动,集会,公共交通,从家庭征收,人民内部运动和国际旅行。在这八个指数上,排名在0到4之间,0表示正常活动和4表示绝对限制,我们分析了各个国家实施的锁定决策。当在时间表上解释时,这八个指数为一个国家提供服务或国家基本服务的运作提供了经济活动(或缺乏活动)的水平。
我们的初始探索性数据分析(EDA)表示,每个国家都在当地目睹了在时间和影响的局部传播模式。政府反应通过经济锁定行动带来了独特的国家特定签名。数据表明,Covid-19案例的生长速率似乎是影响锁定决策的主要因素。这一发现很重要,因为它支持锁定决策的假设以及它们随后的删除,将特定于地理区域,无论是及时还是拆卸秩序都没有观察到的全局模式。
潮汐使用锁定指数作为基于神经网络衍生技术的预测算法的输入流,称为长短短期内存(LSTM)。由于锁定数据是瞬态的,即,新数据每天可用,并且在一个或多个经济活动指标中具有级别的潜在变化,我们有一个强大的培训,以便从这形成基本输入时间序列。使用每日八维向量组成的时间序列作为输入特征。跨越几个月的数据的多个序列构成了培训空间。
由于其灵活性在于分析结构化和非结构化数据,同时还提供了对计算效率所需的学习参数的控制,因此优选一种深度学习方法,例如LSTM,例如LSTM。利用Python框架的Keras包中提供的LSTM模型,探险预测和解释可能每天形成的未来可能的序列。该模型使用当天的序列和前几天的所有序列,以预测前馈方案中第二天的序列。我们的测试精度大约为70%,表明预测模型的高可靠性。
预测分析的见解
解释结果,我们假设八维输入流中的数量的至少50%的数字预测值为0.在我们的评估中,我们依赖于新西兰提供的数据作为测试主题的数据。该模型预测了2020年8月23日,2020年8月23日的恢复正常。具体而言,该模型预测这些指标,
学校运作
举行公共活动
留在家庭要求
内部运动的限制
早期排名为第2类,将会减轻反映第0类的大流行性水平。
诸如8月30日,2020年8月30日的文章新西兰最大的城市在控制下带来神秘的Covid-19浪涌之后退出锁定,提供了证据支持我们的索赔。根据公布的报告,2020年8月31日,在新西兰删除了3级限制的日期。
展望未来
增强此初步发现,域构成了另一个在第一个模型的输出上构建的LSTM模型。使用第一模型的预测序列作为枢轴或主序列,我们已经合成了几种排列,确保0类别的总数,即正常指数,与每个序列的主要序列相同。使用这一新的数据集作为输入流到第二个LSTM模型,景象预测,新西兰的完全返回正常是可能会发生的,这可能发生在2020年12月18日左右。在此日期或围绕此日期,该模型预测完全删除跨越限制的完全删除限制工作场所限制的八个经济活动指标是最后一个被削弱。我们目前正在使用来自法国和哥伦比亚的数据的盲目测试来验证模型,以测试其严格。我们还识别模型的运行边界,以规定其正确使用和解释。
随着Covid-19大流行表明,数据对帮助专家了解并提出建议,以及为政府,企业和公众提供评估,采取行动和计划,以获取创立的信息,知识和智慧,以评估,采取行动和计划在数据科学中。
---
脉深是一个成员紧急联盟,各种各样的公司,个人,非政府组织,数据专家和各国政府合作,提供专业知识,数据和资源,以提出关于区域和全球经济挑战的知识决定,以帮助社会恢复,帮助人们和企业茁壮成长Covid-19。
让我们知道你对这篇文章的看法。
把你的评论放在下面。