当前位置:股票 > 正文
证券期货行业的数据模型定制及未来之发展

  一、证监会开展行业数据模型编制背景

  当前,随着大数据技术的广泛应用,越来越多的行业和机构认识到,数据已经成为最重要的企业资产甚至是行业资产,对于数据资产的了解、规划、治理和预测成为各行业的新兴赢利点。

  但是,要发挥数据资产的价值,仅仅拥有数据是不够的,还需要理清数据资产的定义和价值,围绕数据资产制定相应的数据战略和管理方法。在其中,数据治理能指导其他数据管理工作的执行,是理清数据资产定义和价值,形成数据资产战略体系的核心工作。

  数据模型是数据治理的核心,也是数据价值挖掘和利用的基础。数据库字段和表没有注释、含糊不清、同名不同义、同义不同名、冗余字段、枚举值不一致的现象是普遍存在的,这些问题都会直接影响到对数据的识别和定义。因此,建设和完善数据模型管理体系,是数据治理工作的关键性基础性步骤,也是实现数据驱动价值管理的关键。

  证券期货行业机构众多、类型广泛、交易方式多样、变化及创新迅速。因此在数据生成、交换与应用的整个生命周期中,各阶段均不同程度地面临着一些问题。

  1.数据生成阶段:基础业务数据定义冲突较多,因为数据生成是来自不同机构,定义往往是以机构为单位。

  2.数据交换阶段:业务跨机构,数据的交换需求很大,但数据标准的定义各有不同,不同公司对同一类业务有自己的数据交换标准,整个行业缺少统一的标准。

  3.数据应用阶段:缺少行业数据脉络图,很难能够说清楚行业数据的来龙去脉。

  所以急需开展行业治理,用于描述整个证券期货市场业务、数据情况,明确数据定义、规范数据交换、辅助监管报送、指导行业系统建设。

  因此,证监会在2014年启动行业数据治理工作,涵盖建立行业基础编码标准、建立行业数据模型、规范机构间接口标准、规范机构内接口标准、建立行业信息披露标准等方面。其中证券期货行业数据模型(SDOM- Securities Data Object Model)建设是数据治理工作的基础。

  二、行业抽象模型与逻辑模型梳理方法

  行业数据模型从识别行业现状出发,根据模型的应用深度的不同,分两步形成用于规范行业标准化的抽象模型和指导行业数据应用建设的逻辑模型,模型编制步骤如下:

  图:模型编制步骤

  1、提取行业规则

  在提取行业规则时,综合考虑法律法规、业务规则和数据特征。其中,涵盖证券业务法律法规近50部;3条业务主线(交易、监管、披露),20余类主体,10余个品种,共计业务规则400余项;同时,根据机构内、机构间数据交换现状,形成数据流图,提炼数据特征。

  2、梳理抽象模型

  在抽象模型梳理过程中,依据“IBR”(Identity、Behavior、Relevance)总体指导思想,划分“交易+监管+披露”三大业务条线,以“1+3+N”(1:公共,3:三大业务条线,N:各条线特有)为设计架构开展梳理。

  三大条线模型分别采用各自的方法开展模型的编制工作。交易模型使用“SPB”(业务(service)、行为(B:Behavior)、过程(P:Process)方法,即针对市场中的每个品种,识别其交易行为和过程的相互关系来抽取数据模型。

  图:交易抽象模型梳理-SPB方法

  图:交易行为过程梳理步骤

  监管模型使用“TM”(监管主题(Theme 譬如获取证券期货业资格)、监管方式(Method 譬如行政许可))方法,即通过监管主体和法律法规,识别监管对象和方式形成模型。

  披露模型使用“T4R”(模板(Template),映射(Reflect)、提炼(Refine)、重组(Recombine)、回归(Regress)方法,即通过披露模板逐层反向提取数据表和数据项形成模型。

  最终,综合三大业务条线,抽取、提炼全市场业务流程与数据的共性部分,形成统一、完备的具有通用性、稳定性和扩展性的资本市场多层次数据模型。

  然后,针对梳理结果,应用元数据管理思想,将数据按照其自身的属性分为原子、复合数据、可复用、语义独立数据表四个层次。同时根据应用过程中的通用性差异,形成通用基础、业务条线通用、业务个性化三个层级的“1+3+N”式模型层级,其中:

  “1”为全市场通用的通用基础数据模型;

  “3”为交易、监管、披露的业务条线通用模型;

  “N”为各业务应用的个性化模型。

  上述分类、分层的组织架构,保障了数据模型的完整性,兼顾了数据模型的共性和个性。

  3、设计行业逻辑模型

  为了方便用户读懂并使用数据模型,按照行业属性代码、证券交易所、期货交易所、证券公司、期货公司、基金公司、监管机构等视角,以“1+6”的方式,依托抽象模型,设计一系列实用性比较强的表,最终形成行业逻辑模型最佳实践。

  图:行业逻辑模型架构

  逻辑模型设计时,首先依托抽象模型成果,归纳数据共性,合并、提炼划分逻辑模型主题域;其次,通过“IBR”方法,找出主题域中核心数据的特征和关系,构建主题域之间的核心关系;最后根据主题域和核心关系,最终形成从核心到外延的逻辑模型架构。

  目前已经完成证券公司逻辑模型的设计工作,基金公司逻辑模型处于梳理过程中。

  三、行业数据模型应用及未来之发展

  1、证券期货行业数据模型现已全面用于统一、规范全行业各类数据标准制订,指导行业各机构应用系统建设。

  行业数据模型有助于建立行业内标准的管理关系,通过行业数据模型将行业发布的业务、技术和接口标准关联起来。由于行业数据模型通用性强、覆盖面广、实用度高,目前行业数据模型已经全面应用于行业标准化中,全行业发布的协议及接口标准均需要经过行业数据模型审核。这保障了在证券期货行业中,任何单位、组织编制发布的标准,其定义的数据项含义准确且唯一,行业中新发布标准不存在同义不同名、同名不同义、核心代码不一致等情况;对核心的复合数据项,其加工逻辑也能保持一致。同时,一批核心应用项目在系统建设时应用行业数据模型,保障在重要机构内部,核心数据项定义明确、稳定,元数据血缘脉络清晰,数据来源有据可查。

  2、证券期货行业数据模型后续可为行业数据大集中提供权威的数据标准。

  后续如果证监会要实现行业数据大集中,行业数据模型可为其提供权威的数据标准基础。无论是来源于中介机构、登记结算公司、交易所亦或是证金公司等机构的监管报送数据,在接口制定过程中,均需要参考行业数据模型,以其为数据标准,从而保障数据报送的一致性、规范性和准确性。

  3、证券期货行业数据模型作为行业数据标准需在市场各环节中渗透其作用,实现行业标准流动性发挥。

  证券期货行业不仅涉及沪市、深市、三板等证券交易场所,还涉及大商所、郑商所、上期所等多个期货交易场所;所涵盖的范围也包括了股票、债券、基金、期货、融资融券、质押式回购等众多品种或交易模式;交易链条所关联的除了中介机构外,还包括了证券/期货交易所、登记结算公司、保证金监控中心等;相关数据更是囊括了交易前、交易中、交易后的所有数据,以及机构内部的交互、机构之间的传输和对外的监管报送数据。所以如何在繁杂的业务过程中,有效地贯彻行业标准也变得尤为重要。

  首先对于上层监管来说,要想保障数据报送的一致性和准确性,需保障报送接口的定义跟行业标准的一致性;其次,中介机构作为数据产生的源头,虽然基于各种考虑,会建立企业数据标准,但是为了保障与周围核心机构的交互传输,势必也希望跟行业标准保持一致;最后,业务系统的生产厂商,要想长期、稳定地为企业提供服务,大环境上也需要向行业标准看齐。所以,只有三个层面协同一致、均以行业标准为标杆,才能实现快速且有条不紊的数据标准化,减少不必要的映射关系,提高数据交互的质量和效率,降低相应的成本。

相关链接:

作者: 来源:中软国际大数据 发布时间:2018-03-01 07:23:18
 
 
  我要发表留言  查看所有评论
 

*
 限制字数显示剩余字数,最大长度: 500 还剩: 500
用户名:
       尊重网上道德,承担一切因您的行为而直接或间接导致的民事或刑事法律责任