top of page

天工数据库构建细则

本文记录了天工数据构建过程中对收集工具和原则的具体要求。


基本情况

表格结构

  • 表格按行业或主题划分,每个行业和主题都有“基本信息”、“输入-输出”和“数据来源”三张表。

“数据来源”表存储工艺过程数据的来源(Source),包括工艺过程数据来源

“工艺过程基本信息”表存储工艺过程(Process)基本信息

“输入输出”表存储单元过程的Input flow和Output flow信息

  • 代码表为在录入数据的过程中可引用的标准数据,包括流(Flow)、地理位置(Location)和单位(Unit)

“代码表-流”存储标准的Flow信息,主要支持在输入输出表录入Flow信息时引用

“代码表-地理位置”存储标准的空间属性信息,主要支持在基本信息表中录入Location信息时引用

“代码表-单位”存储标准的单位信息,主要支持代码表-流中的单位信息

“代码表-参与人”存储参与数据记录的人员信息

数据逻辑



语言要求

为便于建立双语言数据库,所有内容均涉及中文和英文两个字段,表格字段名称中含有EN的填写内容为英文。

数据录入第一阶段:按数据来源的语言填写,即如来源于中文文献则填写中文,如来源于英文文献则填写英文,以最大限度保持与数据来源相关描述的一致性

数据定稿后:进行中翻英或英翻中的专业翻译,补齐空缺语言字段。注意:语言用词要保持一致且专业

为避免重复工作,数据录入阶段仅尊重原文做原文摘录工作,不做翻译工作,待数据表内容和数据核查无误后,对定稿数据表进行翻译工作。

注意事项

在多人同时处理一张表的时候,点击+后可能发生没有新建空白记录的情况,请刷新页面,则可以出现已经建立的连续ID的空白记录。


表格填写说明

数据来源表

表格说明

存储单元过程和输入输出流的数据来源信息,每个行业的表格独立,所有行业表格数据结构保持一致。

该数据表为工艺过程基本信息表中关于数据来源字段的代码表,即基本信息表中的数据来源需要从本表中选择插入。

在数据来源首次出现时,需先在该表中录入一条记录,之后再在工艺过程基本信息表进行选择。

命名为“数据来源-xx”,xx代表主题名称,如建材、铝等。

字段填写说明

ID

表格唯一索引字段,无实际意义,新建记录的ID为已有最后记录ID自动加1。

文献/报告信息

记录文献信息。文献信息基于Zotero进行导出,样式为Nature。

  1. 将文献导入Zotero相应文件夹。

  2. 右键点击该文献,选择“由所选条目创建参考文献表”

  3. 在弹出窗口中,选择Nature样式、输出参考文献表、复制到剪贴板

  4. 到表格中的文献信息字段进行粘贴

Zotero使用说明请参考Zotero操作

每个团队的主要联系人均被设为Zotero群组的负责人,可以进行人员调整工作

DOI

如有,需输入文献DOI或者网址URL,包括doi网址,示例:https://doi.org/10.16521/j.cnki.issn.1001-9642.2008.07.016

发表时间

记录文献发表时间。如无法精确,输入该时间段第一天即可。如只知道是2022年12月,则选择2022-12-01。不可留空。

数据来源类型

即文献/报告的类型,单项选择。包括文献、国家或地区统计年鉴、行业统计报告、国家或行业标准、环评报告、专利。如遇上述内容无法涵盖的类型,请选择 “其它”然后在备注中补充说明文献类型。

创建人

记录该条记录的创建人,根据用户名称自动填入,无需操作。

创建时间

记录该条记录的创建时间,根据创建时间自动填入,无需操作。


工艺过程基本信息表

表格说明

存储工艺过程(Process)基本信息,每个行业的表格独立,所有行业表格数据结构保持一致。

命名为“工艺过程基本信息-XX”,XX为主题名称,如建材、铝等。

字段填写说明

ID

表格唯一索引字段,无实际意义,新建记录的ID为已有最后记录ID自动加1。

工艺过程名称

工艺过程(Process)的名称,单元过程和/或其主要产品、服务、技术的一般描述性名称,不可留空。

命名规则:

处理/生产对象+工艺过程目标(必有)| 产品(必有)特性 | 技术工艺(必有) | 原材料

水泥生产 | 普通硅酸盐水泥 42.5MPa | 新型干法 2000t/d | 粉煤灰

水泥生产 | 通用硅酸盐水泥 | 大型新型干法 >4000 t-cl/d

市政污泥脱水 | 脱水污泥 含水率80% | 压滤脱水

产品即相对应的工艺过程中输入输出流的参考定量选择为TRUE的流名称

注意:如遇到无法覆盖上述情况的特殊问题,请联系研究确认。

描述/备注 & 描述/备注EN

数据集的一般信息,对工艺过程基本情况的简要介绍,一般可输入数据来源对该工艺过程相关概要性介绍信息,不可留空。

可对文献基本情况进行记录,如还包括更细分的工艺步骤数据(但无法独立提取成为过程)。

可对数据来源中对该工艺过程的技术进行介绍,体现工况等技术特点,尤其是在工艺过程名称体现技术属性的情况下。

也可以包括通常的(内部未经审核的)质量声明以及使用的信息来源。

注意:请检查“技术说明”,“完整度说明”,“数据选择说明”,“清单计算说明”,“数据处理方法说明”,“采样说明”,“建模过程说明”等字段中的内容,避免重复的输入。

流程图

本数据集所代表的物品、服务、技术、工厂等的流程图和/或照片,可以显示工艺过程边界、内部流程等信息,为了更清晰地说明和记录数据集,可保存文献中的图,也可自制流程图文档,可留空。

数据收集表与在线共享文件夹协同使用。文件夹在初始化主题分类时即完成创建和权限设定。

过程分类

记录该Process数据集的类型,包括是否纳入/排除上游或下游过程、透明度和内部(隐藏的)多功能以及建模的完整性,包括:

  • 单元过程(单一操作):Unit process,single operation。仅包含一个特定工艺步骤,包含基本流、产品流和/或废物流。

  • 单元过程(黑箱):Unit process,black box。几个工艺步骤组合过程,包含基本流、产品流和/或废物流。

  • LCI结果:Life Cycle Inventory,Cradle to Gate。LCl包含产品完整生命周期(由自然资源到产品)数据,全生命周期也被称为系统过程(System process),输入输出均为基础流(Elementary flow)。

只有所有Input都是基础流(Elementary flow)才选择LCI结果,其他均为单元过程。

  • 碳排放因子(单元过程):仅包含碳排放因子的单元过程数据。

  • 碳排放因子(LCI结果):仅包含碳排放因子的生命周期LCI数据。

注意:如遇到无法覆盖上述情况的特殊问题,请联系研究确认。

地理位置ID

记录该工艺过程的空间位置ID,一般为其数据研制地点(或采样地点)所在行政区域ID,引用代码表-地理位置的ID,为uuid。

录入时,点击下拉框,弹出代码表-地理位置表格窗口,可通过筛选和搜索,找到相应记录,点击确认即可。

不可留空,仅可选择1条记录。

代码表-地理位置 支持至城市尺度的空间分辨率,请选择最精细尺度的空间位置,如:

数据明确已知来源于某城市,则直接选择城市;

数据来源省份已知、城市未知,则选择省份;

数据来源省份未知,则选择中国。

地理位置 & 地理位置缩写

记录该工艺过程的空间位置,一般为其数据研制地点(或采样地点)所在行政区域,引用代码表-地理位置的名称。

该字段无需录入,在选择地理位置ID时可自动带入选择的数据。

地理位置说明

有关位置的其他方面的进一步解释:例如,有关公司和/或场所的描述和地址,数据集对于“位置”中某些子区域是否无效,数据是否仅适用于所指示位置的某些区域,或某些基本流或中间产品流是否是从另一个地理区域推算出来的,可留空。

有效期始

数据集有效的时间段的开始年份(至“数据集有效期止”年份),一般为数据来源中体现的数据研制、测算、采样时间,或文献发表时间。对于组合不同年份数据的数据集,通过专家或数据录入人员判断,录入对总体环境影响最具代表性的年份。不可留空。

有效期止

数据集仍然有效/具有足够代表性的时间期限的结束年份。由于在背景系统中环境或技术可能有预期变化这个日期还决定着何时需要或建议进行数据集修订/重塑,一般为数据来源中设定的时间,也可以通过专家或专业人员研判记录,如数据来源中没有体现,可留空。

有效期说明

对有效期时间段的设定进行进一步解释和说明,包括是否是经过专家研判设定的数据,根据哪些信息设定的有效期等。也可包括上述时间段无法涵盖的信息(如:文献报道数据来源于夏季,因此选择5月1日为数据起始时间),可留空。

技术说明

技术特性的描述,包括过程或产品系统的操作条件。对于后者,这包括数据集中包含的相关上游和下游过程。应使用专业术语

数据选择说明

对详细数据(如输入输出流的量、计算参数等)的来源和选择依据进行说明。

可以理解为,数据库为何选择某个来源,因为同一个过程可能有很多lca研究。

数据处理方法说明

记录数据特殊处理的方法。在数据调整中所应用的方法、来源和假设的原则,包括从另一个时间段、另一个地理区域或另一种技术中报道的数据推导或拟合的数据处理过程。如某些数据进行模拟、拟合、趋势外延等,以及相关的假设等。

具体可以理解为,数据报道者(选择的数据来源文献)对数据做了哪些处理(如对10篇技术研究文章报道的数据进行了参数拟合),以及数据录入者对数据进行了哪些加减乘除的简单操作等。

下图为数据选择和数据处理说明示例(来自ELCD数据库):

建模过程说明

工艺过程中使用的数据所涉及的数学关系或拟合说明,如process中涉及一些数据涉及多个parameter参数的核算,则记录在内,包括参数、公式,数学关系,限制条件、模型的优点和缺点等信息。

采样说明

如涉及现场数据测试,记录实地信息,如工厂、样本量等。用于量化输入和输出量的采样程序。应提及在结合不同采样程序时可能出现的问题。

LCI原理

LCI method principle followed in the product system modelling, i.e. regarding using average data (= attributional = non-marginal) or modelling effects in a change-oriented way (= consequential = marginal).

LCI方法

简要说明LCI建模中使用的具体方法,如分配(Allocation)、替代(Substitution)等。在LCI结果和部分终止的系统数据集的情况下,这也包括在所包括的背景系统中应用的方法。

LCI原理和方法说明

LCI计算方法的描述,包括原理、处理方法选择的参考内容,或具体方法。在生命周期评价结果和非完整系统数据集的情况下,它还包括在所包含的背景系统中使用的方法。

例如:The allocation is made in accordance with the provisions of EN 15804. Incoming energy and water and waste production in-house is allocated equally among all products through mass allocation. Effects of primary production of recycled materials is allocated to the main product in which the material was used. The recycling process and transportation of the material is allocated to the analysis in this EPD. For bitumen production, crude oil extraction and transport are allocated by mass, while the final products from oil refineries are allocated by economic factors.

功能单位(Function Unit)说明

LCI计算过程中使用的使用的Function Unit 的详细说明

输入输出流完整度说明

数据收集中产品/输入/输出数据完整度说明,关于产品流和废弃物流以及基本流的完整性,包括截止标准( Cut-off criteria),系统性排除基础设施、服务或辅助设施等。

例如:All major raw materials and all the essential energy is included. The production processes for raw materials and energy flows with very small amounts (less than 1%) are not included. These cut-off criteria do not apply for hazardous materials and substances.

数据来源ID

记录该工艺过程的数据来源的ID,引用数据来源表的ID。

录入时,点击下拉框,弹出数据来源表格窗口,可通过筛选和搜索,找到相应记录,点击确认即可。

不可留空,但仅可选择1条记录。

如是首次涉及的新数据来源,需先至数据来源表中录入新纪录。

该字段非常重要,需保证所录入数据在文献中可完整追溯。

数据来源信息

记录该工艺过程的数据来源,一般为其数据来源名称,引用数据来源表的文献/报告信息。

该字段无需录入,在选择数据来源ID时可自动带入选择的数据。

版权保护

明确该数据是否可公开或被授权使用。如无限制,选择“否”;如有限制,选择“是”。不可留空。

如为公开可获取的文献则默认为“否”。

创建人

记录该条记录的创建人,根据用户名称自动填入,无需操作。

修改人

记录该条记录的最后修改人,根据用户名称自动填入,无需操作。

创建时间

记录该条记录的创建时间,根据创建时间自动填入,无需操作。

最后更新时间

记录该条记录的最后修改时间,根据修改时间自动填入,无需操作。

输入-输出表

表格说明

存储单元过程输入输出(Input/Output)流的信息。

该数据表为基本信息表的子表,即基本信息表的一条数据在该数据表中对应多条记录(多个输入输出流),所有工艺过程的输入输出流数据在同一张表中显示。

命名为“输入输出-XX”,XX代表主题名称,如建材、铝等。

注意文献中的Supplementary material,可能包含比正文中更多的信息。

字段填写说明

ID

表格唯一索引字段,无实际意义,新建记录的ID为已有最后记录ID自动加1。

工艺过程ID

记录工艺过程的ID,引用工艺过程基本信息表中的ID。

录入时,点击下拉框,弹出工艺过程基本信息表格窗口,可通过筛选和搜索,找到相应记录,点击确认即可。

不可留空,但仅可选择1条记录。

工艺过程名称

记录该工艺过程的名称,引用工艺过程基本信息表的工艺过程名称。

该字段无需录入,在选择工艺过程ID时可自动带入选择的数据。

输入/输出

标记该条记录为输入流(Input)或输出流(Output),通过下拉框选择。不可留空。

参考定量

标记为单位产品。每个工艺过程只有一个标记为参考定量的流(Unit Process Reference flow),多为产品流(即主要产品),通过下拉框选择。不可留空。

参考定量选择True,非参考定量选择False。

参考定量并非一定要求该输出流量为1,实质为可基于该流对整个工艺过程进行归一化。

可以根据工艺过程的目的设定参考定量(如单元过程为铝生产,则Output 铝,定为参考定量)

流ID

根据输入/输出的物质/产品选择对应的ID,若文献中无详细描述,则先列在说明中,之后通过专家研判等方式匹配最接近的流,如若需新建流,请与常慧敏联系。

录入时,点击下拉框,弹出代码表-流表格窗口,可通过筛选和搜索,找到相应记录,点击确认即可。

不可留空,仅可选择1条记录。

我们构建的完整Flow代码表数据量超过4万个。由于多维表格行数限制,目前代码表-流表中为ILCD中必须完全匹配的基本流(Elementary flow)约2500个,能够大概率覆盖常见Flow,但肯定不完整。

如无法找到需要的Flow,请参考Flow匹配方法,从完整的FLow表中寻找。

流名称

记录该流的名称,引用代码表-流的流名称。

该字段无需录入,在选择流ID时可自动带入选择的数据。带入数据为英文。

流分类

记录该流的分类,引用代码表-流的流分类。

该字段无需录入,在选择流ID时可自动带入选择的数据。带入数据为英文。

记录该输入/输出流的量。只能输入数字,不可留空。

如文献中给出的是范围,则:

  1. 判断该范围是否有分布信息,如正态分布等

  2. 如有,则此处按下列原则填入(并将相应数据完整填入后面的不确定性相关字段)

    1. 对数正态分布:填入几何平均值

    2. 正态分布:填入算术平均数

    3. 均匀分布:填入平均值(可能需要自行计算)

    4. 三角形分布:填入众数

  3. 如没有分布信息,则按均匀分布处理,自行计算平均值,并将最大值、最小值填入后面的不确定性字段,不确定性类型选为”均匀分布“

  4. 在说明字段中进行充分记录,如“文献中给出的是数据范围(X-Y),此处填入平均值,最大和最小值以不确定性记录。由于文献没有给出数据分布,默认为均匀分布”

单位ID

记录该流数据单位的ID,引用代码表-单位中的ID。

录入时,点击下拉框,弹出代码表-单位窗口,可通过筛选和搜索,找到相应记录,点击确认即可。

不可留空,但仅可选择1条记录。

单位名称

记录该流的单位,引用代码表-流的流单位。

该字段无需录入,在选择单位ID时可自动带入选择的数据。

单位表征

记录该流所选单位的表征(如质量、体积),起到选择数据后的提示作用、避免同名称单位选择错误,引用代码表-流的流单位。

该字段无需录入,在选择单位ID时可自动带入选择的数据。

说明

对该流的信息进行进一步补充说明,如记录详细参数或与流的量无关的其他数据。

如原数据中的流名称与所选流名称并非完全匹配,则首先记录原数据中的名称。

数据获取方式

记录在数据来源中标记的该流数据来源方式(多选),包括:

  • 文献:来源于其他文献

  • 基于公式/化学式计算:基于公式或化学平衡方程式进行计算

  • 实景调研数据:实地采样测试获取数据

  • 数据库:由其他LCA数据库获得的数据

  • 实验测量数据:在实验中进行测试的数据,如实验室中的工艺研发

  • 假设:基于假设的结果

  • 简单估算:不明确的估算

  • 不明确:没有进行明确说明

注意:

  1. 各Process的参考定量(即Functional Unit)可留空

  2. 如遇到无法覆盖上述情况的特殊问题,请联系研究确认。

不确定性类型

记录该流量数据的不确定性分布,包括:

  • 对数正态分布

  • 正态分布

  • 三角分布

  • 均匀分布

注意:如遇到无法覆盖上述情况的特殊问题,请联系研究确认。

几何平均值

记录几何平均值(用于对数正态分布),如选择对数正态分布则不可留空。

几何标准差

记录几何标准差(用于对数正态分布),如选择对数正态分布则不可留空。

算术平均值

记录算术平均数(用于正态分布),如选择正态分布则不可留空。

算术标准差

记录算术标准差(用于正态分布),如选择正态分布则不可留空。

最大值

记录最大值(用于均匀分布和三角分布),如选择均匀分布和三角分布则不可留空。

最小值

记录最小值(用于均匀分布和三角分布),如选择均匀分布和三角分布则不可留空。

众数

记录众数(用于三角形分布),如选择三角分布则不可留空。

创建人

记录该条记录的创建人,根据用户名称自动填入,无需操作。

修改人

记录该条记录的最后修改人,根据用户名称自动填入,无需操作。

最后更新时间

记录该条记录的最后修改时间,根据修改时间自动填入,无需操作。

Commenti


bottom of page