跳到主要内容
能源部门
报告

能源部门数据:有关改善数据质量和可用性的建议

布鲁金斯学会印度中心的内容现已存档。 经过七年的有效合作,截至2020年9月11日,布鲁金斯印度公司现已成为 社会经济进步中心,这是一家位于印度的独立公共政策机构。

编辑's Note:

该文件是围绕能源部门数据进行集体头脑风暴会议以及如何改进其集体讨论的结果 学者能源网,由学者,从业人员和 印度能源与可持续性问题专家。该网络是参与的平台,可以更好地实现 研究,分享想法和教训。

印度的能源和电力行业数据比以往任何时候都多,尤其是通过网站和门户网站的组合。我们建议为研究人员和从业人员解决有关查找,获取和获取数据的问题,以进行更多基于证据的政策研究并为国家话语做出贡献。研究人员使用来自多个政府部门和部门的能源和相关数据,但是其同步性和准确性在各个部门之间有所不同,从而使处方受所用信息源的约束。此外,在缺乏关键数据的情况下,研究人员最终依赖于逐年传递的经验法则,没有重新评估基本假设的基础。这可能会导致分析结果中不必要的收敛,因为它们可能会加剧人们对动态变化的偏见,因为它们无法完全捕获动态变化。

同时,公共部门的各部委,部门和企业以模型,门户网站和其他倡议的形式大量涌现公共数据。尽管能源部门以集中信息管理系统的形式进行质量控制的必要性从未像现在这样强,但我们意识到这是一个巨大的挑战
机构工作,需要大量时间来计划和实施。因此,我们建议,第一步,我们在能源公共数据的可用性和报告方面要有更高的标准和一致性。

在缺乏关键数据的情况下,研究人员最终依赖于逐年流传的经验法则,没有重新评估基本假设的依据。

本说明为能源部门公共数据的所有者提供建议,以更新其方法和报告,从而使他们传播的数据对研究人员和其他利益相关者进行基于证据的分析更有意义。

以在线政府门户网站的形式采取了许多新举措,包括提供有关供求,访问,分配和基础设施的实时数据的一些举措,例如NITI Aayog的印度能源仪表板,GARV仪表板,MERIT,URJA ,UJALA,GARV,GTG印度等。每个方面都侧重于特定方面:从对能源需求和供应及其组成部分的一般性看法,到DISCOMS的表现,到电气化和
家庭使用,节能照明的支出,电厂财务和运营绩效以及可再生能源整合的更多技术方面。

此类数据的报告数量激增,以补充来自中央电力局(CEA),煤炭部(MoC),煤炭控制办公室(CCO),石油和天然气部(MoPNG),财政部的传统报告(通常为年度报告)在分析过去和当前的绩效以及提出基于证据的政策研究时,新能源和可再生能源(MNRE)等的必要性,有用性和受欢迎性。这可以通过一些标准化来进一步改善,并为用户提供选择以自定义数据,解开假设并研究趋势。

我们尝试着重强调一些改进数据传播的建议,并评估其中的一些建议可以如何纳入正在进行的工作中。我们还根据特定建议给出了网站/数据汇编的示例。

改善数据传播的建议:

1. 使数据可供下载
多个仪表板具有很好的数据,但都面向在线可视化。下载使研究人员和其他利益相关者可以进行自己的分析和可视化工作,从而减少了数据所有者尝试“全部展示”的工作。
例子: PPAC的石油和天然气营销数据, NITI Aayog的印度能源门户

2. 提供历史数据(尽可能提供)
多个仪表板可提供出色的数据,但仅限于几天或几个月。在线存档有帮助。截至目前,一些学者和机构使用抓取工具定期获取数据。此步骤可能会导致错误,并且可以通过提供归档数据来避免。使用档案还可以使历史数据反映任何更正/更新,而这些瞬时数据可能无法正确捕获。
例子: MoSPI的能源统计, CCO的煤炭统计, MoPNG的石油和天然气统计

3. 启用具有适当术语的长期归档
在线存储库应标准化数据集,文件等的命名法,以便于识别和区分。与其将文件命名为“ ouput.xls”或“ Annual_Report.pdf”,不如将它们分割成多个文件夹,并使用诸如“ load_ouput_20.09.17”或“ Annual_Report_2016”之类的名称将有所帮助。这一点特别重要,因为当研究人员在研究中列出年度报告作为参考时,网址可能会导致年度报告的版本不同。
例子: CEA的负载生成和平衡报告, MoSPI的年度出版物

4. 使数据以正确的格式可用
i)有两部分。在某些情况下,没有下载可用,因此仅具有HTML数据就很难使用。网上可以有很好的可视化效果,但是可下载的数据也可以进行分析。其次,在可以下载数据的地方,它们应该比PDF多。实际上,某些PDF是图像,
尽管基础数据是以数字/数据库/ excel格式生成的。 Excel格式是中性模式,因为数据库可以是专有的。

ii)一个好的起点,尤其是对于在线门户网站,将是按照选择的周期性存档数据到可下载的excel表格中。这将补充(i)并实现更详细的分析。

iii)如果有印刷本,也应有印刷本,从而避免了打印和邮寄费用。数据提供商可以继续根据需要对此类数据收费,但从长远来看,所有公共数据都应在线免费提供。
例子: PPAC的石油和天然气价格统计,NITI的印度能源门户网站

5. 提供多个选项和最终用户控制的用户界面以进行可视化
为了补充可能由数据所有者驱动的实时可视化,提供一组数据可视化选择将对用户有所帮助。示例包括选择时间段,位置,粒度,显示比较等的能力。

例: NREL和MoP的绿色网格化

6. 澄清/标准化/改善标题和元数据
i)从正确列出单位开始,但扩展到显示数字时使公式透明。 CEA在显示例如P列= [F – G] / B的地方执行此操作。从长远来看,我们建议标题的标准化,即使在.xml模式的范围内也是如此。我们(作为学者/研究人员)可以通过这种做法帮助政府。

ii)几次研究人员不得不在不同来源之间进行比较,以了解所传达的信息。如果使用MoSPI和CEA的发电数据,则无法比较演习的范围(是否将自备发电包括在数字中或将辅助消耗扣除)?
充其量可以推断出,在一种情况下,较高的数目包括自养世代。即使这样,也很可能无法完全解决它。随着公共领域中涌现出新数据,我们应谨慎确保要传递的内容与最终传递的内容之间没有差异。这种标准化必须是新数据源(例如工具和仪表板)上数据维护协议不可或缺的一部分。
例: CEA的一般评论

7. 在数据源和引用中保持透明
i)这不仅有助于追踪主要数据和来源,甚至有助于链接至基础方法。 Web链接是理想的参考,除非链接可能不可用。在这两种情况下,详细信息都是有帮助的。例如,与其说“来源:CEA”,不如明确指出哪个CEA报告或文件是来源将很有帮助。

ii)参考对于网页,在线报告等尤为重要。有时可以这样做,但通常在网上发现的工作人员/官员的介绍缺乏此信息。
例: NITI的印度能源门户

8. 分享方法论和假设
i)尽可能通过注释或其他解释来阐明相关的假设和方法。例如:
(1)总数是多少?
(2)该数字在哪里计算(针对哪个位置或节点)?在单元,工厂,母线,边界表等处?
(3)是否通过某种方法检测,报告或计算了特定数字?
(4)例如,为了说明功率不足,应指明是仪器还是计算得出的。

ii)这对于打算传达系统观点(尤其是模型和工具)或从多个假设(经验,经验法则等)得出的信息来源尤其重要。应该对此进行澄清和说明,以及分析单位,四舍五入等。例如,如果NITI的“能源仪表板”还为得出消费者分类连接负载提供了依据,则将有所帮助。

关于上述(4),方法和术语也应全面标准化。所以总体技术& Commercial (AT&C)和传输与分配(T&D)MoSPI和CEA中报告的损失应符合其严格定义才能进行比较。

例: NITI的印度能源安全方案

9.给出所有材料的日期{发布日期和相关数据期日期}

i)对于报告和数据集,发布日期和基础数据日期都很有帮助。对于演示文稿和报告,日期很重要,因为所提供的材料否则可能缺乏上下文。这对于存档数据特别有用。

ii)有时,政府官员在各种论坛上的演讲可以在线获得。这些通常包含以前未发布的数据,但是仍然可以追溯到可靠的来源。这些来源应附有日期,以便使用它们进行分析变得更加容易。

例: 印度统计局

10.列出数据查询的联系点

应该有一种联系某人(可能是也可能不是数据“所有者”)进行澄清和查询的方法。
例子: NITI的印度能源安全方案和印度能源门户


更多

[关于能源转型中的挑战]在化石燃料最难以替代的地方,替换这些用途将需要时间。我们暂时不会完全耗尽化石燃料。我们现在可以停止使用化石燃料的想法意味着经济正陷入严峻的停顿,我们真的不想要那样。我们的想法是阻止人们的气候变化,以便我们能够继续拥有自己习惯的生活,并为我们的孩子和孙子孙女留下我们喜欢的环境。停止经济不是做到这一点的方法。

获取布鲁金斯的每日更新