大数据在互联网供应链金融中的应用
尽管大数据对于企业的重要性已经得到了理论界和实践界的广泛认同,然而,大数据如何应用在商业决策中还是一个亟待解决的问题。这里的关键在于大数据的分析技术需要与商业理解很好地结合,Provost和Fawcett (2013)曾指出“数据科学不仅仅是数据挖掘,成功的数据科学家能够从数据的视角看待商业问题”。Isson和Harriott (2012)提出了大数据在商业决策运用中的方法论,指出大数据商业分析是紧密围绕关键商业目标,整合企业内外部分散的所需数据源,预见性地回答商业问题并指导相关行动。为了实现这一目标,就需要IMPACT框架,即确定问题(identity),确定关键商业问题、要达到的目标,设置清晰的相关时间和工作预期;操作数据(master),采集、分析和整合所有可获得信息,有助于回答关键问题;赋予含义(provide),数据含义的清晰明确表达,及其与关联关键商业问题的可视化呈现,亦即赋予含义的过程;可行建议(actionable),在数据解释的基础上,提供商业建议,尽可能对建议产生的收益成本给出定量的价值数据;传播沟通(communicate),综合使用多种形式的传播策略帮助将分析洞察传播到全企业尽可能大的范围,可以运用交互工具;最后是追踪结果(track),制定对分析洞察所带来的效果进行跟踪评估的方法。比如,做了什么,效果如何,需要解决的新问题是什么。显然,Isson和Harriott(2012)提出的IMPACT框架对于互联网供应链金融运用大数据具有很好的指导性。基于上述框架,互联网供应链金融的数据运用主要是要解决5W1H,即为什么(why)、什么人(who)、怎么样(what)、何地(where)、何时(when)以及如何(how)。
互联网供应链金融中为什么需要数据?
任何大数据的分析运用都是为了解决关键商业问题,实现商业目标(Isson & Harriott,2012),Waller和Fawcett(2013)就提出在大数据应用中,需要综合运用定量和定性的方法解决相关问题,并预见可能发生的结果,大规模数据分析和相应的知识的确定和分析密不可分。同样在互联网供应链金融活动中,在运用大数据进行分析之前,需要明确数据分析应用的目标,该问题的确定对于搜集什么样的数据、从哪些方面搜集、分析什么等等都具有指导性的作用。
由于互联网供应链金融是通过各种金融性行为,包括融资,立足于多利益相关方建构的网络,来优化商业流程和经营行为,促进产业与金融的融合,产生产业与金融的倍增效益,因此,大数据的运用主要是为了更好地了解互联网供应链金融中关键利益方,特别是融资对象的经营能力、潜在能力和潜在风险。经营能力是了解和掌握服务对象在市场和行业中的地位,以及表现出来的竞争力,如同我们在第1章中谈及的那样,供应链金融的服务对象往往不具备资金、资产和信誉,然而需要“有技术”和“有订单”,技术代表了该企业的核心竞争能力,而订单则代表了企业市场拓展的能力。总体上讲,判定企业的经营状况可以从“硬能力”和“软能力”两个方面来分析:“硬能力”在理论上称为一个组织和企业的显性能力,即可以记录、无须讨论的事实性的能力知识;而“软能力”也可称为隐性能力,即无法明确化、需要面对面交流沟通才能传递的技能(Wyatt, 2001)。具体讲,运用能力网格表征(见图7—2),组织和企业的“硬能力”包括技术、研发方面的能力(如技术、设计、工程、工艺等能力)、运营方面的能力(如生产流程、品质、组织管控、资金财务、供应管理、信息系统建设等能力)以及市场营销方面的能力(如渠道、分销、品牌、客户关系管理等)。“软能力”包括领导力和创新、创业方面的能力,文化建设和协调、团队建设方面的能力,以及外部形象和利益相关者协调能力等。除了经营能力外,大数据分析的另外一个重要的目标是分析判断供应链中服务对象的潜在能力,也就是说不仅仅要分析一个组织已表现出来的能力,还要关注其未来具备的能力,这就是第1章谈及的中小企业必须具备的第三个“有”——“有理想”。这就需要从动态的角度,分析判断企业“硬能力”和“软能力”的培育能力和发展趋势,培育能力指的是企业采用何种手段或者路径去获得或拓展软、硬两种能力,而发展趋势则是判断企业在连续时间段内在两种能力上的发展程度。
图7—2 大数据分析的目标:供应链企业的市场能力和潜在能力大数据分析的第三个主要目标是分析判断供应链参与主体,特别是融资对象的潜在风险。企业风险是指某一对企业目标的实现可能造成负面影响的事项发生的可能性。企业在制定和实现自己目标的过程中,会碰到各种各样的风险,需要通过大数据分析了解企业可能存在的各种负面影响因素。具体看,需要分析了解的风险主要有五大类:一是运营风险,是指企业在运营过程中,由于外部环境的复杂性和变动性以及主体对环境的认知能力和适应能力的有限性,而导致的运营失败或使运营活动达不到预期的目标的可能性及其损失;二是资产风险,是指公司在经营过程中,由于外部不确定因素、内部人为因素及相关条件导致的资产质量发生偏差,而使公司信誉、资金、收益等遭受损失的可能性;三是竞争风险,是指企业由于外部的因素或者能力不足或者失误,使得企业在竞争和经营过程中,实际实现的利益与预期利益目标发生背离的可能性;四是商誉风险,是指组织目前在所有利益各方心目中的地位以及在当前环境下的运营能力和形象受到损毁;五是战略风险,这类风险是影响整个企业的发展方向、企业文化、信息和生存能力或企业效益的各类不确定因素。上述五类风险都是互联网供应链金融有效率和有效益运行发展的威胁,因此,需要借助大数据分析,了解相关主体可能存在的这五类潜在风险。
互联网供应链金融中需要搜集分析谁的数据?
为了实现上述目标,在互联网供应链金融中还需要了解搜集或者分析“谁的数据”。这一问题的明确对于操作数据和大数据分析目标的实现具有重要作用。“谁的数据”涉及智慧供应链流程活动中可能的参与主体,一般有如下几类(见图7—3):一是互联网供应链金融的受益者,或者说融资对象。这是互联网供应链金融的直接参与方,其特质和行为直接决定了该业务的风险或者成功与否。二是与融资对象相关联的交易对象或者合作者。在互联网供应链金融运营过程中,有时风险来源不一定是融资对象本身产生的问题,而是与其发生交易或者合作的关联组织或企业的行为失当导致经营失效。例如,当融资对象的客户发生违约行为,就可能直接导致金融风险,或者与其合作的其他企业由于各种原因使得主体企业的经营无法持续,也会对供应链金融产生危害。因此,搜集和分析融资对象相关联企业的特质和行为数据,也是互联网供应链金融大数据分析应用的重要目标对象。三是与焦点企业(即互联网供应链金融服务者)合作的关联服务者。在互联网供应链金融活动中,为了获取充足、低成本的资金,以及有效地管理控制风险,焦点企业有时需要与其他金融机构开展合作,诸如银行、保险、第三方支付、担保等。然而,如果这些关联服务者产生信用缺失或者行为失当,就会直接对供应链金融产生负面影响。四是焦点企业网络平台的参与者。在智慧供应链或者网络链中有很多平台参与者,这些参与者组织起来共同为融资对象提供相应的服务,例如第三方物流、政府职能部门等,这些组织或企业的失误会直接影响供应链活动的质量,甚至导致供应链运营中断,因此,搜集和分析这类组织或企业的数据,也能保障互联网供应链金融的安全性。五是对上述所有主体产生作用的环境。环境作为一种外部因素会对供应链各类参与主体产生正面或者负面的影响。这种环境因素可以划分为竞争性和动态性两类(宋华,王岚,2012)。环境竞争性表征的是外界环境的竞争程度,由竞争对手的数量和竞争领域的同质性来反
图7—3 互联网供应链金融数据收集分析的对象映(Matusik & Hill,1998)。竞争性环境通常体现为高效率和低价格导向,当竞争环境变得非常苛刻时,产品利润空间趋于固定甚至下降。环境的动态性是指环境稳定或变化的程度(Dess & Beard, 1984),它可以被描述为消费者偏好的变化和产品需求、供给的波动等。显然,环境的竞争性和动态性都会对供应链参与主体产生巨大的影响,因此,环境数据的搜集和分析也至关重要。
互联网供应链金融中需要搜集分析什么样的数据?
搜集分析什么样的数据关系到能否真实地把握分析对象的状况,判断合理的供应链行为,并且指导和规划行动(LaValle et al., 2011)。从原则上讲,互联网供应链金融中搜集分析的数据也需要体现准确性、一致性、及时性和完整性(Hazen et al.,2014)。准确性指的是收集分析的数据能够切实地用于分析刻画融资对象的状况,帮助焦点企业掌握融资对象的真实能力;一致性是指数据应当具有稳定的表现形式,不会出现不同对象、不同时间、不同地域同一信息具有不同的表现形态;及时性是指能够获得最新的数据,最及时地分析反映融资对象目前的状态;完整性要求能尽可能地获得各种多样性的数据,通过对这些多来源、多形态的数据进行整合分析,能够完整地刻画融资对象的全貌。为了实现上述目标,在互联网供应链金融活动中,需要关注和获取的数据主要有如下几种类型:一是时间和空间的数据。时间数据也称时间序列或动态数据,即同一现象或数据在不同时间点或时间段的数据序列,这类数据反映了某一事物、现象等随时间的变化状态或程度,诸如融资对象连续若干时间段的信用变化、供应链所在行业的市场变化、交易商品的价值变动等等。空间数据表明空间实体的形状大小或者经营主体的位置和分布特征,是一种用点、线、面以及实体等基本空间数据结构来表示人与人、人与物、物与物相互依存的数据,例如,质押商品的空间位置和分布、供应链参与者的网络位置和状态等等。
二是主体和客体的数据。主体指的是供应链活动中的参与者,掌握这些行为者的数据对于把握他们的能力和相互关系至关重要,这类数据涵盖了他们的资源、能力、资质、信用、偏好等各类信息。所谓客体是指行为主体的经营目的物,诸如商品、生产工具等客观存在的事物,这些目的物的信息间接反映了行为主体的能力、行业的状态或风险的大小。值得注意的是,不同的业务场景或者管理要求,相对应的主体和客体数据具有差异性,例如库存管理、运输管理或者客户/供应商关系管理中,对应的主体和客体数据都有其特定的数据形态(见表7—3)。
表7—3 不同业务情景下的主体和客体数据
三是要素和情感的数据。要素是供应链运营中所需要的各种社会资源,是维系供应链运行及市场主体生产经营过程中所必须具备的基本因素。传统的要素包括土地、劳动和资金,而在智慧供应链或网络链运营时代,新的要素包括信息、平台和知识。信息是供应链参与者信息系统的建构、管理和运营的基础和能力;平台是指一种虚拟或真实的交易或服务场所,依托于这种场所,所有的供应链参与者相互作用,促进商流、物流和资金流的协同与整合;知识是概念之间的联结,是一种综合化的、体系化的经验、数据和信息(Zagzebski, 1999),它包括供应链参与者所具有的各种显性知识和隐性知识。除了要素数据之外,情感数据也是互联网供应链金融需要关注的数据类型。情感指的是态度的一部分,它与态度中的内在感受、意向具有协调一致性,是态度在生理上一种较复杂而又稳定的生理评价和体验。情感数据的价值是在一种必要的环境下,对于用户的行为进行回忆和分析,然后取出再现,了解用户的心声,体会用户的体验。这种情感数据对于互联网供应链金融而言,往往不仅能够让焦点企业了解供应链某一参与主体当时的体验,而且还能间接知晓其行为特征和环境状态。例如对驾驶员情绪数据的分析,能够让焦点企业判断承运商运输服务的质量(诸如运输安全)和成本(交通处罚、燃油使用等)。
四是单点和网络的数据。单点数据指的是某个特定的供应链参与主体发生的各类数据,包括交易数据、物流数据和资金流数据。网络数据指的是某个特定的参与方所嵌入的网络或者集群数据。网络和集群对于企业会产生很多促进或者制约的作用(Rocha, 2004),Porter(1998)认为产业集群通过配套产业的协同、专业化的劳动力市场、知识外溢等因素对企业的竞争力和创新产生重要的作用。因此,充分了解供应链参与者所在产业网络和集群的政策、结构、业务状态以及竞争力等,对于判断行业和企业竞争力具有重要的作用。例如,在中国不同的地域形成了各具特色的产业集群,这就需要了解该产业集群聚焦的行业或产品、产业集群的规模、国内国外市场的状态、企业之间的配套和互动、产业集群的技术能力和密集度、特定企业在集群中的位置和能力、特定企业与其他企业之间的联系方式等等。
互联网供应链金融中需要从哪些地方获得数据?
与获得什么样的数据相关联,互联网供应链金融大数据分析中还有一个重要的问题是从哪些地方获得数据。这需要考虑各种数据来源的直接和间接渠道(见图7—4)。直接渠道是依托焦点企业与相关利益方所建构的智慧供应链或者网络链,或者公开的社会化网络和平台,借助相互之间直接发生的业务往来以及市场化行为获得相应的数据来源。这类直接渠道包括供应链运营系统、金融信贷机构和一部分关联服务组织。间接渠道是依托其他的组织或自有的网络平台,通过焦点企业的努力,借助一定的手段和途径所能获取的数据来源。这类间接渠道包括政府管理部门、经营/生活服务部门以及其他一些关联服务组织。
图7—4 互联网供应链金融大数据来源
供应链运营系统中的组织是指供应链网络中的所有业务参与方。这类主体包括供应链上下游企业,也就是说,可以通过供应链上游供应商和下游客户获得供应链运营中的交易数据。例如,可以从供应商处获取关于经营的原材料品种、交易的规模、交易的趋势、资金结算的方式、资金应收应付的状态等数据,这类数据有助于判断供应商的资源能力,或者与其交易的交易对手的资源能力。同理,从下游客户可以了解产品经营的品类、分销的状况、品牌实力、销售规模和趋势、主要的客户群等信息,从而识别产成品供应商的竞争力、市场开拓能力、客户维系能力等等。除了上下游企业之外,第三方物流也是数据获取的重要来源,该主体数据的获取主要是为了帮助焦点企业分析物流的状态和水平。例如,可以从承运商或者货代处了解经营企业的运输状态或者货运情况;从仓储企业了解经营企业的产品库龄和产品结构;从库存管理公司处了解经营企业的进销存或库存周转;从港头码头了解产品进出口或者分销的结构和业务规模,以及产品的去向等等。
金融信贷机构主要包括商业银行、信托、财务公司、保理、小额贷款等从事资金借贷的金融机构。这些机构在与供应链参与主体进行资金借贷时,往往会对目标企业进行征信或者尽职调查,这些数据的获取对于判断融资对象的能力和状态也具有非常重要的作用。这些数据包括企业在办理贷款、信用卡、担保等信贷业务时提供的信息数据。
一些关联服务组织是可以直接获得数据的主体,这包括帮助供应链上下游企业开展业务的互联网服务平台,因为相关利益方需要通过该互联网平台完成交易或者物流业务,因此,互联网平台必然沉淀了相应数据。第三方支付是指具备实力和信誉保障的第三方企业和国内外的各大银行签约,为买方和卖方提供信用增强的中介平台。在银行的直接支付环节中增加第三方支付,在通过平台交易时,买方选购商品,不直接将款项打给卖方而是付给中介,中介通知卖家发货;买方收到商品后,通知付款,第三方支付将款项转至卖家账户。第三方支付往往是大数据来源的重要方面,因为供应链参与者的实力和经营状态可以通过其资金支付的状况得到反映。保险公司也是大数据来源的一方面,保险公司是通过销售保险合约、提供风险保障获得相应的收益,其类型包括直接保险公司和再保险公司。从这些保险公司处获取相应的数据,能够帮助了解分析业务的风险程度以及供应链参与者的市场和业务状态。
政府管理部门是监督和管理企业经营活动的公共管理机构,这些管理部门和机构往往拥有企业经营和相关的业务数据,获取这些数据对于刻画企业的经营管理能力具有很重要的作用。一般而言,这些部门机构掌握的相应数据包括:海关掌握的通关状态、舱单信息、外汇核销单状态、进口付汇证明、出口退税证明、出口结汇证明、深加工结转状态、商品税率、报文状态、快件状态、报关员计分、知识产权备案信息、台账状态等;国家质量监督检验检疫部门掌握的以组织机构代码为标识的企业的基本信息,生产许可、强制性认证等行政许可信息,以及政府奖励等良好行为记录,同时也有因为产品质量监督抽查不合格以及执法打假中违法违规的不良行为记录数据等;外汇局掌握的货物贸易、服务贸易、直接投资及一些资本项下的交易,物流、资金流,涵盖了企业的各类名录,以及企业在跨境结售汇方面的情况;税务部门拥有的涉税数据,以及工商部门和其他政府部委或职能监管部门所掌握的企业各类信息数据。
经营/生活服务部门是为企业或企业中的个体提供各类服务的机构。一般来讲,经营服务部门能够为企业提供公共服务,诸如自来水公司、电力公司、产业园区管理公司等,这些组织在提供公共产品或服务的过程中,也会拥有用于刻画企业能力和状态的数据。例如,一个企业水电费的支付状态可以反映其生产经营的正常或异常情况。此外,一些服务于个体的组织机构也掌握了一些反映个人状况的数据,例如能够在合理、合法、符合信息安全的要求下获取分析企业创业者或者领导者的电信支付、信用卡还款、理财和其他生活消费数据,往往便于间接判断企业状态和领导者本身的品质和能力。
其他一些间接性关联服务机构属于独立的组织或者平台,需要焦点企业努力,或者采取一定的合作途径来获取其所拥有的数据。这些组织机构既包括了行业协会、国际/国内标准化组织、专利局等公共机构,也涵盖了例如VC等商业性企业或机构,这是因为像VC这样的组织为了实现对目标公司风险投资,降低投资风险,在企业的配合下,会对企业的历史数据和文档、管理人员的背景、市场风险、管理风险、技术风险和资金风险做全面深入的审核。所有这些信息的获取分析对于互联网供应链金融而言也是至关重要的。
互联网供应链金融中需要分析什么时间点的数据?
由于互联网供应链金融大数据分析的目标是为了全面辨识融资对象的经营能力、潜在能力和潜在风险,因此,在分析的时间点上就需要既考虑历史数据,又考虑实时数据甚至将要发生的数据。历史数据是过去已经发生的数据,这些数据反映了企业曾经拥有的能力和状况,对它们的挖掘和分析能够帮助焦点企业判断特定对象已有的基础,以及风险承受的能力。然而值得注意的是,仅仅有历史数据是不够的,这是因为历史状态不一定能代表目前和将来的状态,加之产业和市场的变化可能使企业拥有的资源和能力得到增强或者丧失,因此,互联网供应链金融中更需要实时数据和即将发生的数据分析。实时大数据分析是指对规模巨大的数据进行分析,利用大数据技术高效地快速完成分析,达到近似实时的效果,更及时地反映数据的价值和意义,把握目前和即将发生的供应链经营状态。显然,要实现实时数据分析就需要做到数据实时采集、数据实时计算和数据实时查询服务(CSDN博客,2014)。数据实时采集要求功能上保证可以完整地收集到所有日志数据,为实时应用提供实时数据,响应时间上要保证实时性、低延迟在秒级左右,要做到这一点,就需要配置简单、部署容易、系统稳定可靠等。实时计算和实时查询是在流数据不断变化的运动过程中实时地进行分析,捕捉到可能对用户有用的信息,并把结果发送出去,供业务部门查询了解,并做出相应的决策。例如,对于电子商务平台上的店铺,实时数据分析需要实时展示一个店铺的到访顾客流水信息,包括访问时间、访客姓名、访客地理位置、访客IP、访客正在访问的页面等信息,此外,还要显示某个到访顾客的所有历史来访记录,同时实时跟踪显示某个访客在一个店铺正在访问的页面等信息,并且支持根据访客地理位置、访问页面、访问时间等多种维度下的实时查询与分析判断其可能的行为(见图7—5)。
图7—5 实时计算流数据分析举例
互联网供应链金融中通过何种方法获得数据?
数据获取的途径是大数据分析运用过程中很重要的一个方面,要获取相应的数据,焦点企业需要考虑和布置多样化的途径和手段。具体讲,大数据获得途径主要有:通过业务的底层化运营沉淀积累数据;通过第三方获得相应的数据;通过公共渠道获得特定数据;通过物联网以及云计算模式来获得数据。
物联网(IoT)是通过射频识别(RFID+互联网)、红外感应器、全球定位系统、激光扫描仪、气体感应器等信息传感设备,按约定的协议,把任何物品与互联网连接起来,进行信息交换和通信,以实现智能化识别、定位、跟踪、监控和管理的一种网络。物联网包含了三项重要的技术:一是传感器技术,这是计算机应用中的关键技术,它把模拟信号转换成数字信号交由计算机处理。二是RFID标签,这也是一种传感器技术。RFID是一种非接触式自动识别技术,主要通过射频信号自动识别目标对象并获取相关信息,无须人工干预,能够在各种状态如静止、移动甚至恶劣环境下准确识别运动物体。RFID技术具有体积小、容量大、寿命长、穿透力强、可重复使用、支持快速读写、可定位和长期追踪物品等特点。三是嵌入式系统技术,这是综合了计算机软硬件、传感器技术、集成电路技术、电子应用技术为一体的复杂技术,它是在接收信息后进行分类处理的中枢。物联网使得供应链从制造环节到分销配送,直至零售环节实现了全程数据的及时可得和可视(见图7—6),并且最终通过分析处理这些数据,提升整体供应链运营绩效和供应链金融决策的有效性。
图7—6 物联网应用信息流程图
云计算(cloud computing)是基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源,其模式主要包括SaaS、PaaS和IaaS。第一层叫作IaaS,有时候也叫作基础设施即服务(Infrastructure-as-a-Service),即通过提供场外服务器、云存储和网络硬件供产业企业租用,节省硬件维护成本和场地,而产业客户企业可以在任何时候利用这些硬件来运行其应用。第二层就是所谓的PaaS(Platform-as-a-Service,平台即服务),即在网上提供各种开发和分发应用的解决方案,比如虚拟服务器和操作系统。这不仅节省了客户在硬件上的费用,而且也让分散的组织之间的合作变得更加容易。第三层也就是所谓的SaaS(Software-as-a-Service,软件即服务),即服务商通过互联网提供软件的模式,将应用软件统一部署在自己的服务器上,客户可以根据自己的实际需求,通过互联网向服务商定购所需的应用软件服务,按定购的服务多少和时间长短向服务商支付费用,并通过互联网获得服务商提供的服务。所有这些云计算服务模式都是大数据获取或运用依托的基础,云计算服务和云应用在云平台的支撑下,让庞大的数据得以保存和处理。一方面云存储为大数据分析做准备;另一方面要挖掘到有价值的数据,这需要借助云服务和云应用的能力。