工程科学学报 Chinese Journal of Engineering 油气资源开发的大数据智能平台及应用分析 宋洪庆都书一周园春王宇赫王九龙 Big data intelligent platform and application analysis for oil and gas resource development SONG Hong-qing.DU Shu-yi,ZHOU Yuan-chun,WANG Yu-he,WANG Jiu-long 引用本文: 宋洪庆,都书一,周园春,王宇赫,王九龙.油气资源开发的大数据智能平台及应用分析.工程科学学报,2021,43(2:179- 192.doi10.13374/j.issn2095-9389.2020.07.21.001 SONG Hong-qing,DU Shu-yi,ZHOU Yuan-chun,WANG Yu-he,WANG Jiu-long.Big data intelligent platform and application analysis for oil and gas resource development[J].Chinese Journal of Engineering,2021,43(2):179-192.doi:10.13374/j.issn2095- 9389.2020.07.21.001 在线阅读View online:https::/oi.org10.13374.issn2095-9389.2020.07.21.001 您可能感兴趣的其他文章 Articles you may be interested in 人工智能在军事对抗中的应用进展 Application progress of artificial intelligence in military confrontation 工程科学学报.2020,42(9外:1106htps:/doi.org10.13374.issn2095-9389.2019.11.19.001 多模态学习方法综述 A survey of multimodal machine learning 工程科学学报.2020,42(5:557 https:/doi.org10.13374.issn2095-9389.2019.03.21.003 基于机器学习的北京市PM2.5浓度预测模型及模拟分析 Machine-learning-based model and simulation analysis of PM2.5 concentration prediction in Beijing 工程科学学报.2019,41(3:401 https:1doi.org/10.13374issn2095-9389.2019.03.014 基于深度学习的人体低氧状态识别 Recognition of human hypoxic state based on deep learning 工程科学学报.2019,41(6):817 https::/1doi.org/10.13374.issn2095-9389.2019.06.014 基于深度学习的高效火车号识别 Efficient wagon number recognition based on deep learning 工程科学学报.2020,42(11:1525htps:oi.org10.13374.issn2095-9389.2019.12.05.001 文本生成领域的深度强化学习研究进展 Research progress of deep reinforcement learning applied to text generation 工程科学学报.2020,42(4:399 https:/1doi.org10.13374j.issn2095-9389.2019.06.16.030
油气资源开发的大数据智能平台及应用分析 宋洪庆 都书一 周园春 王宇赫 王九龙 Big data intelligent platform and application analysis for oil and gas resource development SONG Hong-qing, DU Shu-yi, ZHOU Yuan-chun, WANG Yu-he, WANG Jiu-long 引用本文: 宋洪庆, 都书一, 周园春, 王宇赫, 王九龙. 油气资源开发的大数据智能平台及应用分析[J]. 工程科学学报, 2021, 43(2): 179- 192. doi: 10.13374/j.issn2095-9389.2020.07.21.001 SONG Hong-qing, DU Shu-yi, ZHOU Yuan-chun, WANG Yu-he, WANG Jiu-long. Big data intelligent platform and application analysis for oil and gas resource development[J]. Chinese Journal of Engineering, 2021, 43(2): 179-192. doi: 10.13374/j.issn2095- 9389.2020.07.21.001 在线阅读 View online: https://doi.org/10.13374/j.issn2095-9389.2020.07.21.001 您可能感兴趣的其他文章 Articles you may be interested in 人工智能在军事对抗中的应用进展 Application progress of artificial intelligence in military confrontation 工程科学学报. 2020, 42(9): 1106 https://doi.org/10.13374/j.issn2095-9389.2019.11.19.001 多模态学习方法综述 A survey of multimodal machine learning 工程科学学报. 2020, 42(5): 557 https://doi.org/10.13374/j.issn2095-9389.2019.03.21.003 基于机器学习的北京市PM2.5浓度预测模型及模拟分析 Machine-learning-based model and simulation analysis of PM2.5 concentration prediction in Beijing 工程科学学报. 2019, 41(3): 401 https://doi.org/10.13374/j.issn2095-9389.2019.03.014 基于深度学习的人体低氧状态识别 Recognition of human hypoxic state based on deep learning 工程科学学报. 2019, 41(6): 817 https://doi.org/10.13374/j.issn2095-9389.2019.06.014 基于深度学习的高效火车号识别 Efficient wagon number recognition based on deep learning 工程科学学报. 2020, 42(11): 1525 https://doi.org/10.13374/j.issn2095-9389.2019.12.05.001 文本生成领域的深度强化学习研究进展 Research progress of deep reinforcement learning applied to text generation 工程科学学报. 2020, 42(4): 399 https://doi.org/10.13374/j.issn2095-9389.2019.06.16.030
工程科学学报.第43卷,第2期:179-192.2021年2月 Chinese Journal of Engineering,Vol.43,No.2:179-192,February 2021 https://doi.org/10.13374/j.issn2095-9389.2020.07.21.001;http://cje.ustb.edu.cn 油气资源开发的大数据智能平台及应用分析 宋洪庆12)四,都书一12,周园春2),王宇赫,王九龙2,3) 1)北京科技大学土木与资源工程学院,北京1000832)大数据分析与计算技术国家地方联合工程实验室,北京1001903)中国科学院计 算机网络信息中心,北京1001904)中国石油大学(华东)石油工程学院,青岛266555 ☒通信作者,E-mail:songhongqing@ustb.edu.cn 摘要油气资源大数据智能平台的总体框架应以数据资源为基础、大数据平台算力为支撑、人工智能算法为核心,面向油 气行业生产需求,构建集勘探、开发、生产数据于一体的油气数据资源池,通过数据清洗与融合提升数据质量,整合物理模拟 与数据挖掘等手段,实现服务功能模块化,并在PC端、管控大屏、手机移动APP等多维平台实现智能监测、预警与展示.通 过对深度学习等人工智能方法在油气工业领域的应用案例分析,表明其具有较好的应用前景.未来石油公司应与科研院所 通力合作,挖掘石油工业数据的巨大潜能,实现降本增效,建设全新的智能油气工业生态圈,完成产业升级. 关键词石油;天然气;大数据;人工智能:深度学习:机器学习 分类号TE3 Big data intelligent platform and application analysis for oil and gas resource development SONG Hong-qing DU Shu-yi2),ZHOU Yuan-chun WANG Yu-he,WANG Jiu-long 1)School of Civil and Resource Engineering,University of Science and Technology Beijing,Beijing 100083,China 2)National and Local Joint Engineering Lab for Big Data Analysis and Computer Technology,Beijing 100190,China 3)Computer Network Information Center,Chinese Academy of Sciences,Beijing 100190,China 4)School of Petroleum Engineering,China University of Petroleum(East China),Qingdao 266555,China Corresponding author,E-mail:songhongqing @ustb.edu.cn ABSTRACT With the rapid improvement of exploration and monitoring technologies,the oil and gas industry has accumulated a large amount of data in the fields of seismic exploration,logging,production,and development.How to transform the huge "data resources" into"data assets"and fully utilize data and tap their real value to better serve society is a main concern in the oil and gas industry today. Therefore,the oil industry needs to complete the industrial upgrading of"Smart Oilfield"through digital and intelligent transformation. In recent years,the rise of big data technology and artificial intelligence have allowed international oil companies and oil service giants to accelerate the construction of digital and intelligent oil fields.The overall framework of the big data intelligent platform of oil and gas resources should be based on data resources with big data platform computing power as the support and artificial intelligence algorithms as the core.To meet the production needs of the oil and gas industry,it is of great urgency to build an oil and gas data resource pool that integrates exploration,development,and production data.The data quality can be improved via data cleaning and fusion.Physical simulations,data mining,and other approaches should be combined to achieve the modularization of service functions.Additionally,the goals of intelligent monitoring,early warning,and display on multi-dimensional platforms such as PC,control screen,and mobile apps can also be achieved.The analysis of artificial intelligence methods such as deep learning in the context of the oil and gas industry shows that these methods have good application prospects.In the future,oil companies should work together with scientific research institutes 收稿日期:2020-07-21 基金项目:国家自然科学基金资助项目(11972073):中央高校基本科研业务费资助项目(FRF-TP.19-005B1)
油气资源开发的大数据智能平台及应用分析 宋洪庆1,2) 苣,都书一1,2),周园春2,3),王宇赫4),王九龙2,3) 1) 北京科技大学土木与资源工程学院,北京 100083 2) 大数据分析与计算技术国家地方联合工程实验室,北京 100190 3) 中国科学院计 算机网络信息中心,北京 100190 4) 中国石油大学(华东)石油工程学院,青岛 266555 苣通信作者,E-mail:songhongqing@ustb.edu.cn 摘 要 油气资源大数据智能平台的总体框架应以数据资源为基础、大数据平台算力为支撑、人工智能算法为核心,面向油 气行业生产需求,构建集勘探、开发、生产数据于一体的油气数据资源池,通过数据清洗与融合提升数据质量,整合物理模拟 与数据挖掘等手段,实现服务功能模块化,并在 PC 端、管控大屏、手机移动 APP 等多维平台实现智能监测、预警与展示. 通 过对深度学习等人工智能方法在油气工业领域的应用案例分析,表明其具有较好的应用前景. 未来石油公司应与科研院所 通力合作,挖掘石油工业数据的巨大潜能,实现降本增效,建设全新的智能油气工业生态圈,完成产业升级. 关键词 石油;天然气;大数据;人工智能;深度学习;机器学习 分类号 TE3 Big data intelligent platform and application analysis for oil and gas resource development SONG Hong-qing1,2) 苣 ,DU Shu-yi1,2) ,ZHOU Yuan-chun2,3) ,WANG Yu-he4) ,WANG Jiu-long2,3) 1) School of Civil and Resource Engineering, University of Science and Technology Beijing, Beijing 100083, China 2) National and Local Joint Engineering Lab for Big Data Analysis and Computer Technology, Beijing 100190, China 3) Computer Network Information Center, Chinese Academy of Sciences, Beijing 100190, China 4) School of Petroleum Engineering, China University of Petroleum (East China), Qingdao 266555, China 苣 Corresponding author, E-mail: songhongqing@ustb.edu.cn ABSTRACT With the rapid improvement of exploration and monitoring technologies, the oil and gas industry has accumulated a large amount of data in the fields of seismic exploration, logging, production, and development. How to transform the huge “data resources” into “data assets” and fully utilize data and tap their real value to better serve society is a main concern in the oil and gas industry today. Therefore, the oil industry needs to complete the industrial upgrading of “Smart Oilfield” through digital and intelligent transformation. In recent years, the rise of big data technology and artificial intelligence have allowed international oil companies and oil service giants to accelerate the construction of digital and intelligent oil fields. The overall framework of the big data intelligent platform of oil and gas resources should be based on data resources with big data platform computing power as the support and artificial intelligence algorithms as the core. To meet the production needs of the oil and gas industry, it is of great urgency to build an oil and gas data resource pool that integrates exploration, development, and production data. The data quality can be improved via data cleaning and fusion. Physical simulations, data mining, and other approaches should be combined to achieve the modularization of service functions. Additionally, the goals of intelligent monitoring, early warning, and display on multi-dimensional platforms such as PC, control screen, and mobile apps can also be achieved. The analysis of artificial intelligence methods such as deep learning in the context of the oil and gas industry shows that these methods have good application prospects. In the future, oil companies should work together with scientific research institutes 收稿日期: 2020−07−21 基金项目: 国家自然科学基金资助项目(11972073);中央高校基本科研业务费资助项目(FRF-TP-19-005B1) 工程科学学报,第 43 卷,第 2 期:179−192,2021 年 2 月 Chinese Journal of Engineering, Vol. 43, No. 2: 179−192, February 2021 https://doi.org/10.13374/j.issn2095-9389.2020.07.21.001; http://cje.ustb.edu.cn
180 工程科学学报,第43卷,第2期 to tap the huge potential of oil industry data,achieve cost reduction and efficiency increase,and build a new smart oil and gas industrial ecosystem to complete industrial upgrading KEY WORDS petroleum:natural gas;big data;artificial intelligence;deep learning:machine learning 随着油田工业勘探、开发技术的飞速发展以及 油田的各个领域中,其应用范围已经从上游的勘 自动化与信息化程度的不断提高,石油工业已经迈 探、开发、生产贯穿至下游的销售及运营,很大程 入了数字化与智能化的时代.随之而来的,其数据 度上加速了油田智能化的进程.未来的石油工业,旨 量也从MB级迅速突破至TB级甚至PB级,呈现了 在形成以大数据技术为根基,人工智能算法为武 指数倍的增长山以中国石油天然气集团公司为例, 器,集数据的收集与存储、清洗与融合、挖掘与分 经过“十五”~“十二五”,已有约70个大型信息系 析、可视化及应用于一体的油气大数据智能平台. 统完成了建设并上线运行,其中,仅“勘探与生产技 1石油工业大数据发展及现状 术数据管理系统”就管理着约1500TB的数据,当 然这也只是油田数据的冰山一角.那么,如何有效 在2012年1月召开的达沃斯世界经济论坛 的存储、管理并利用这些数据成为了开发人员、信 中,以大数据为相关主题发布了报告“Big data,. 息人员和研究人员极为关注的问题.《Nature》在 big impact:New possibilities for international develop- 2008年推出了“Big Data”专刊,《Science》在201l年 ment”,深入的讨论了怎样利用大数据技术提高全 2月推出专刊“Dealing with Data”,主要围绕科学 球经济效益.同年5月,联合国在名为“Global 研究中大数据的问题展开讨论,分析了大数据产 Pulse”的项目中发布了一个有关大数据的报告,名 生、处理流程以及对科学研究的重要性,标志着大 "Big data for development:Challenges opportuni- 数据时代的来临.因此,结合大数据技术打造智能 ties”,对应用大数据技术处理发展中国家面对数 化数字化油田已经成为各国下一步的发展方向. 据洪流的问题进行初步解读.大数据技术的崛起 除了对海量的油田数据进行存储和管理,更 已然势不可挡,并逐步在各个领域展开了应用并 重要的是如何对这些数据进行深度的挖掘与分 取得了极佳的效果.因此,将大数据技术应用到石 析,从而能够更好的完善及优化油田开发方案,推 油工业领域已经成为必然的结果.据美国石油工 动石油工业的迅速发展.人工智能技术可以对油 程协会(SPE-OnePetro)数据库显示,自2000年开 藏数据进行深层次的剖析与解读,极大的提升了 始,大数据及人工智能在石油工业领域的研究呈 油田的开发效率和经济效益,其对于油田工业的 现井喷式增长,截止2020年6月,公开发表的相 重要性已经不言而喻.自步入21世纪以来,随着 关会议及研究论文已经超过了10000篇.如图1 机器学习和深度学习崛起,人工智能已经渗透到 所示,就机器学习和油气工业相结合的论文而言, 1400 1200 1000 Exponential growth 800 600 400 200 0 ■■■■■■ Time/a 图1SPE-one petro(美国石油工程师协会)数据库中机器学习相关文章增长图 Fig.I Graph depicting the increase in the number of machine learning-related articles in SPE-OnePetro
to tap the huge potential of oil industry data, achieve cost reduction and efficiency increase, and build a new smart oil and gas industrial ecosystem to complete industrial upgrading. KEY WORDS petroleum;natural gas;big data;artificial intelligence;deep learning;machine learning 随着油田工业勘探、开发技术的飞速发展以及 自动化与信息化程度的不断提高,石油工业已经迈 入了数字化与智能化的时代. 随之而来的,其数据 量也从 MB 级迅速突破至 TB 级甚至 PB 级,呈现了 指数倍的增长[1] . 以中国石油天然气集团公司为例, 经过“十五”~“十二五”,已有约 70 个大型信息系 统完成了建设并上线运行,其中,仅“勘探与生产技 术数据管理系统”就管理着约 1500 TB 的数据[2] ,当 然这也只是油田数据的冰山一角. 那么,如何有效 的存储、管理并利用这些数据成为了开发人员、信 息人员和研究人员极为关注的问题. 《Nature》在 2008 年推出了“Big Data”专刊[3] ,《Science》在 2011 年 2 月推出专刊“Dealing with Data” [4] ,主要围绕科学 研究中大数据的问题展开讨论,分析了大数据产 生、处理流程以及对科学研究的重要性,标志着大 数据时代的来临. 因此,结合大数据技术打造智能 化数字化油田已经成为各国下一步的发展方向. 除了对海量的油田数据进行存储和管理,更 重要的是如何对这些数据进行深度的挖掘与分 析,从而能够更好的完善及优化油田开发方案,推 动石油工业的迅速发展. 人工智能技术可以对油 藏数据进行深层次的剖析与解读,极大的提升了 油田的开发效率和经济效益,其对于油田工业的 重要性已经不言而喻. 自步入 21 世纪以来,随着 机器学习和深度学习崛起[5] ,人工智能已经渗透到 油田的各个领域中,其应用范围已经从上游的勘 探、开发、生产贯穿至下游的销售及运营,很大程 度上加速了油田智能化的进程. 未来的石油工业,旨 在形成以大数据技术为根基,人工智能算法为武 器,集数据的收集与存储、清洗与融合、挖掘与分 析、可视化及应用于一体的油气大数据智能平台. 1 石油工业大数据发展及现状 在 2012 年 1 月召开的达沃斯世界经济论坛 中 ,以大数据为相关主题发布了报告“Big data, big impact: New possibilities for international development”,深入的讨论了怎样利用大数据技术提高全 球经济效益. 同年 5 月 ,联合国在名为“ Global Pulse”的项目中发布了一个有关大数据的报告,名 为“Big data for development:Challenges & opportunities”,对应用大数据技术处理发展中国家面对数 据洪流的问题进行初步解读. 大数据技术的崛起 已然势不可挡,并逐步在各个领域展开了应用并 取得了极佳的效果. 因此,将大数据技术应用到石 油工业领域已经成为必然的结果. 据美国石油工 程协会(SPE-OnePetro)数据库显示,自 2000 年开 始,大数据及人工智能在石油工业领域的研究呈 现井喷式增长[6] ,截止 2020 年 6 月,公开发表的相 关会议及研究论文已经超过了 10000 篇. 如图 1 所示,就机器学习和油气工业相结合的论文而言, 1400 1200 1000 800 600 400 200 0 Number of papers Time/a 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 Exponential growth 图 1 SPE-one petro(美国石油工程师协会)数据库中机器学习相关文章增长图 Fig.1 Graph depicting the increase in the number of machine learning-related articles in SPE-OnePetro · 180 · 工程科学学报,第 43 卷,第 2 期
宋洪庆等:油气资源开发的大数据智能平台及应用分析 181· 近5年发表论文的比重已经占了总数量的60%以 发、建井、非常规完井和生产管理四个专业领域 上,当然,油气大数据的发展并不限于学术研究领 一体化建设,打破在实践应用中地球物理学、地质 域,全球各大石油公司也纷纷致力于和顶级T企 学、油藏工程学、钻井与采油工业学之间的专业 业合作门,联手发展适用于石油工业的大数据分析 壁垒,从而实现各学科的相互融合.如图2所示为 技术,打造数字化智能化油田,从而孕育全新的油 国内外油气大数据智能平台构建实例,在2018年 气革命 10月,由美国《世界石油》杂志于休斯顿举行的 2018年4月,道达尔与信息技术巨头谷歌强 “世界石油奖”的颁奖活动中,哈里伯顿凭借Voice 强联手,针对石油勘探开发中地质数据缺失或误 of the Oilfield!9摘得了“最佳数字化转型奖”.该产 差较大的难题,利用模糊逻辑技术能够对“不完 品是哈里伯顿通过实际应用检验的智能油气建设 备”数据进行处理的特性,基于地震数据并整合了 解决方案,依托工业物联网组件与边缘计算设备 自然语言处理技术构建了更加精细的地质模型, 对数据进行实时收集,基于云平台和大数据分析 率先将大数据技术应用于地质数据处理.2018年 技术进行油田的智能诊断、分析及预测等,可以实 9月,壳牌牵手微软在石油领域智能化方向展开合 现对于井口、油田及资产管理的闭环管理模式 作,Shell Geodesic在两家巨头的研发下应运而生. 当然,国内也已经展开了油田智能化的建设 它能够利用机器学习及控制算法来更为逼真的展 工作.对于上游勘探开发而言,北京科技大学联合 现油气层钻井图像,针对在致密岩层钻井过程可 中国石油大学(华东)及中国科学院计算机网络信 能引发的突发情况提供有效的决策建议.2019年 息中心等机构,搭建面向油气资源开发的大数据 1月,英国BP公司投资500万英镑助力人工智能 智能平台,可实现对油田海量数据的快速弹性可 初创公司Belmont Technology,开发了一个融合物理、 扩展,基于分布式计算引擎Spark开发π-flow数据 地质、历史和油藏信息的地球科学云平台,为BP 处理系统,可以利用不同深度学习算法对油气数 提供独特的“地下资产图谱”.同年2月,埃克森美 据进行流水线式处理及分析,通过油气一体化管 孚与微软建立合作关系,投资约10亿美元用于机 控大屏完成对油气田开发的实时监测、预警及展 器学习算法研究,通过人工智能优化油气井性能 示,能够有效的对油田的开发方案进行评价与指 及分析钻完井数据.雪佛龙已经和微软及斯伦贝 导,见图2.除此之外,在2018年11月,中石油整 谢在2019年9月达成了三方协议,旨在利用云计 合了大庆油田、辽河油田等多家石油子公司的现 算及人工智能技术加快油气工业的数字化转型. 场数据,建立了油气资源的数据湖,打造了旗下第 而现如今国际三大油服巨头,贝克休斯、斯伦 一个智能油气平台“梦想云”,并通过搭建协同的 贝谢、哈里伯顿正紧锣密鼓的向数字化智能化油 研究环境,支撑上游业务的数字化、智能化转型, 田进军图2017年7月,贝克休斯与通用电气完成 初步实现了勘探开发、生产管理及协同研究的一 并购重组,依托其独创的Predix平台,迅速打造全 体化.对于中下游而言,2019年12月,国家石油天 世界第一家全领域数字化油气工业公司.贝克休 然气管网集团有限公司成立,旨在依托大数据及 斯的大数据平台是侧重于独立的数字化板块建设 物联网等技术,对油气储运管线进行数字化建设 以及对全产业链的覆盖.借助通用电气推出的第 和智能升级,全面打造覆盖全国的“智慧管网” 一个面向工业的互联网平台Predix平台所开发的 2020年7月15日召开的华为全球油气峰会表明, 油田数字化板块,与其上游、中游、下游及工业板 华为正致力成为油气数字化转型的忠实伙伴,利 块并列为贝克休斯五大业务板块,集地质建模、油 用5G网络、大数据及云计算等技术解决中石油大 藏模拟、力学分析和可视化于一体,可用于油藏各 庆油田计算性能及数据存储等问题,并且在测井 类数据的采集以及通过人工智能算法优化采收方 油气藏识别、地震波识别、故障诊断等五个场景 案等.而斯伦贝谢主要涉及上游勘探开发生产领 实现AI应用分析.2020年8月21日,首家油气数 域,并强调的是油藏数据、管理系统及硬件设施的 据科学分实验室在中国科学院计算机网络信息中 有效组合,进而实现了更高水准的油田一体化建 心成立,中国工程院韩大匡院士指出,国内油气行 设.2017年9月,斯伦贝谢主要针对油气上游领域 业的数字化智能化发展目前还处于起步阶段,要 推出了名为DELFI的勘探开发认知环境作为基础 充分利用大数据及人工智能手段实现“智慧油田” 的的数字化平台,将硬件设施、软件开发、数字化 战略目标,完成从现如今的“跟跑”到“并跑”甚至 技术和油藏专业知识有机结合,致力于勘探与开 未来“领跑”世界的转变.国内外数字化转型发展
近 5 年发表论文的比重已经占了总数量的 60% 以 上. 当然,油气大数据的发展并不限于学术研究领 域,全球各大石油公司也纷纷致力于和顶级 IT 企 业合作[7] ,联手发展适用于石油工业的大数据分析 技术,打造数字化智能化油田,从而孕育全新的油 气革命. 2018 年 4 月,道达尔与信息技术巨头谷歌强 强联手,针对石油勘探开发中地质数据缺失或误 差较大的难题,利用模糊逻辑技术能够对“不完 备”数据进行处理的特性,基于地震数据并整合了 自然语言处理技术构建了更加精细的地质模型, 率先将大数据技术应用于地质数据处理. 2018 年 9 月,壳牌牵手微软在石油领域智能化方向展开合 作,Shell Geodesic 在两家巨头的研发下应运而生, 它能够利用机器学习及控制算法来更为逼真的展 现油气层钻井图像,针对在致密岩层钻井过程可 能引发的突发情况提供有效的决策建议. 2019 年 1 月,英国 BP 公司投资 500 万英镑助力人工智能 初创公司 Belmont Technology,开发了一个融合物理、 地质、历史和油藏信息的地球科学云平台,为 BP 提供独特的“地下资产图谱”. 同年 2 月,埃克森美 孚与微软建立合作关系,投资约 10 亿美元用于机 器学习算法研究,通过人工智能优化油气井性能 及分析钻完井数据. 雪佛龙已经和微软及斯伦贝 谢在 2019 年 9 月达成了三方协议,旨在利用云计 算及人工智能技术加快油气工业的数字化转型. 而现如今国际三大油服巨头,贝克休斯、斯伦 贝谢、哈里伯顿正紧锣密鼓的向数字化智能化油 田进军[8] . 2017 年 7 月,贝克休斯与通用电气完成 并购重组,依托其独创的 Predix 平台,迅速打造全 世界第一家全领域数字化油气工业公司. 贝克休 斯的大数据平台是侧重于独立的数字化板块建设 以及对全产业链的覆盖. 借助通用电气推出的第 一个面向工业的互联网平台 Predix 平台所开发的 油田数字化板块,与其上游、中游、下游及工业板 块并列为贝克休斯五大业务板块,集地质建模、油 藏模拟、力学分析和可视化于一体,可用于油藏各 类数据的采集以及通过人工智能算法优化采收方 案等. 而斯伦贝谢主要涉及上游勘探开发生产领 域,并强调的是油藏数据、管理系统及硬件设施的 有效组合,进而实现了更高水准的油田一体化建 设. 2017 年 9 月,斯伦贝谢主要针对油气上游领域 推出了名为 DELFI 的勘探开发认知环境作为基础 的的数字化平台,将硬件设施、软件开发、数字化 技术和油藏专业知识有机结合,致力于勘探与开 发、建井、非常规完井和生产管理四个专业领域 一体化建设,打破在实践应用中地球物理学、地质 学、油藏工程学、钻井与采油工业学之间的专业 壁垒,从而实现各学科的相互融合. 如图 2 所示为 国内外油气大数据智能平台构建实例,在 2018 年 10 月,由美国《世界石油》杂志于休斯顿举行的 “世界石油奖”的颁奖活动中,哈里伯顿凭借 Voice of the Oilfield[9] 摘得了“最佳数字化转型奖”. 该产 品是哈里伯顿通过实际应用检验的智能油气建设 解决方案,依托工业物联网组件与边缘计算设备 对数据进行实时收集,基于云平台和大数据分析 技术进行油田的智能诊断、分析及预测等,可以实 现对于井口、油田及资产管理的闭环管理模式. 当然,国内也已经展开了油田智能化的建设 工作. 对于上游勘探开发而言,北京科技大学联合 中国石油大学(华东)及中国科学院计算机网络信 息中心等机构,搭建面向油气资源开发的大数据 智能平台,可实现对油田海量数据的快速弹性可 扩展,基于分布式计算引擎 Spark 开发 π-flow 数据 处理系统,可以利用不同深度学习算法对油气数 据进行流水线式处理及分析,通过油气一体化管 控大屏完成对油气田开发的实时监测、预警及展 示,能够有效的对油田的开发方案进行评价与指 导,见图 2. 除此之外,在 2018 年 11 月,中石油整 合了大庆油田、辽河油田等多家石油子公司的现 场数据,建立了油气资源的数据湖,打造了旗下第 一个智能油气平台“梦想云”,并通过搭建协同的 研究环境,支撑上游业务的数字化、智能化转型, 初步实现了勘探开发、生产管理及协同研究的一 体化. 对于中下游而言,2019 年 12 月,国家石油天 然气管网集团有限公司成立,旨在依托大数据及 物联网等技术,对油气储运管线进行数字化建设 和智能升级,全面打造覆盖全国的“智慧管网”. 2020 年 7 月 15 日召开的华为全球油气峰会表明, 华为正致力成为油气数字化转型的忠实伙伴,利 用 5G 网络、大数据及云计算等技术解决中石油大 庆油田计算性能及数据存储等问题,并且在测井 油气藏识别、地震波识别、故障诊断等五个场景 实现 AI 应用分析. 2020 年 8 月 21 日,首家油气数 据科学分实验室在中国科学院计算机网络信息中 心成立,中国工程院韩大匡院士指出,国内油气行 业的数字化智能化发展目前还处于起步阶段,要 充分利用大数据及人工智能手段实现“智慧油田” 战略目标,完成从现如今的“跟跑”到“并跑”甚至 未来“领跑”世界的转变. 国内外数字化转型发展 宋洪庆等: 油气资源开发的大数据智能平台及应用分析 · 181 ·
.182 工程科学学报,第43卷,第2期 历程如图3所示.总的来说,目前我国油气工业虽 并携手诸如华为等数据科技企业,使得油气行业 然还处在数字化转型的初级阶段,但是各大石油 上中下游的数字化以及智能化发展迅速,相信在 以及天然气公司积极开展对“智慧油田”的建设, 不久的未来可以孕育出全新的油气工业生态圈. Large screen with integrated management control Wellsite edge Cloud computing and bi DecisionSpaceTM Production 365 loT automation facilities Dom Wellsite edge computing Big data analysis platform Production services Services and applicationsnd appiiinthe oil and gas field Construction process of oil and gas big data intelligent platform Digital oilfield production monitoring platform 困2国内外油气大数据智能平台构建实例图 Fig.2 Construction and example of the intelligent platform for domestic and foreign oil and gas big data In April,Total joined In Octobet, In Janury,BP In July,PetroChins farces with Google to Halliburton n the"Best Degit nd s or is of the and gas. computing chnolog 2017 208 2019 2020 In September In Novembe Microsod in the Pineline netwotk develonmer Dream Cloud"an elhatiornehip Group Co.Lid was counitive ctroleim field an st如ed the digital to intelligently analyze established to bualda oy developed oal and gas well Chinese Acaden可yof pipe network. sciences. 图3国内外油气工业数字化转型发展历程 Fig.3 Development process of the digital transformation of the oil and gas industry at home and abroad 2油气大数据“6V”属性特点分析 有结构化数据如地震反演、生产数据等,还包括半 对于大数据特性的描述比较具有代表性的是 结构化数据如地震解释、钻井报告等,以及非结构 3V定义uo:即规模性(Volume),多样性(Variety)和 化数据像测井曲线、岩心图片等,因而具有“Variety” 高速性(Velocity).国际数据公司(IDC)在此基础 特性.现如今,这些油田数据的获取大多是基于物 上添加了第4V的特性,价值型(Value).IBM则认 联网的井下或地面传感器等边缘监测设备,在保 为真实性(Veracity)也是大数据技术的必然要素 证了数据的“Veracity”特性的同时,可以实现对数 对于石油工业而言,还有一些学者认为除了上述 据的实时传输,突出了油气数据的“Velocity”.另 SV的特性,还应该具有多变性(Variability)l2I 外,由于储层地质结构的复杂性以及油田现场人 如图4所示)为石油工业大数据的“6V”特 为操作等不确定因素,都会令勘探、开发、生产领 性.石油工业的“Volume”主要体现在其庞大的数 域相关数据产生“Variability”,如油田生产过程中 据量,就石油上游而言,已经构建了9大类数据资 的产量、压力等数据,而油气数据最为重要的就 产库,涵盖了600多个油气藏,7000余个地震工 是它的“Vlue”,如在油田勘探中,可以利用地震 区,开发了近45万口井,管理超过108万个测井文 数据预测地质空间结构从而确定地下油气藏所 件,累计存储量达1.7PB以上而这个庞大的数 在;在油田开发领域,通过测井录井数据来预测储 据体包括了勘探、测井录井及生产等各个领域,既 层物性参数节约生产时间:在油田生产中,利用生
历程如图 3 所示. 总的来说,目前我国油气工业虽 然还处在数字化转型的初级阶段,但是各大石油 以及天然气公司积极开展对“智慧油田”的建设, 并携手诸如华为等数据科技企业,使得油气行业 上中下游的数字化以及智能化发展迅速,相信在 不久的未来可以孕育出全新的油气工业生态圈. Wellsite edge computing ① ② ③ Cloud computing and big data platform Landmark Construction process of oil and gas big data intelligent platform Production services and applications in the oil and gas field Digital oilfield production monitoring platform Large screen with integrated management control 1. IoT automation facilities 2. Wellsite edge computing 3. Big data analysis platform 4. Services and applications DecisionSpaceTM Production 365 Domestic Foreign 图 2 国内外油气大数据智能平台构建实例图 Fig.2 Construction and example of the intelligent platform for domestic and foreign oil and gas big data In July, Baker Hughes became the world’s first full-field digital oil and gas industry company relying on the Predix platform. In April, Total joined forces with Google to take the lead in applying big data technology to geological data processing. In October, Halliburton won the “Best Digital Transformation Award” for its product “Voice of the Oilfield”. In January, BP developed an earth science cloud platform that integrates physics, geology, histoy, and reservoir information. In September, Chevron, Microsoft and Schlumleiget reached a tripartite agreement to accelerate the digital transformation of oil and gas. In July, PetroChina and Huawei collaborated to realize intelligent analysis of oil and gas scenarios utilizing 5G and cloud computing technologies. In September, Schlumberger launched DELFI’s exploration and development cognitive environment as a basic digital platform. In September, Shell collaborated with Microsoft in the application of artificial intelligence in the petroleum field and jointly developed “Shell Geodesic”. In November, PetroChina built its first intelligent oil and gas platform “Dream Cloud” and started the digital construction of oil and gas field. In February, Exxonmobil and Microsoft established a cooperative relationship to intelligently analyze oil and gas well performance. In December, the National Petroleum and Natural Gas Pipeline Network Group Co., Ltd. was established to build a nationwide “smart pipe network”. In August, the first oil and gas data science sublaboratory was established in the Computer Network Information Center of the Chinese Academy of Sciences. 2017 2018 2019 2020 图 3 国内外油气工业数字化转型发展历程 Fig.3 Development process of the digital transformation of the oil and gas industry at home and abroad 2 油气大数据“6V”属性特点分析 对于大数据特性的描述比较具有代表性的是 3V 定义[10] :即规模性(Volume),多样性(Variety)和 高速性(Velocity). 国际数据公司(IDC)在此基础 上添加了第 4V 的特性,价值型(Value). IBM 则认 为真实性(Veracity)也是大数据技术的必然要素[11] . 对于石油工业而言,还有一些学者认为除了上述 5V 的特性,还应该具有多变性(Variability) [12] . 如图 4 所示[13] ,为石油工业大数据的“6V”特 性. 石油工业的“Volume”主要体现在其庞大的数 据量,就石油上游而言,已经构建了 9 大类数据资 产库,涵盖了 600 多个油气藏, 7000 余个地震工 区,开发了近 45 万口井,管理超过 108 万个测井文 件,累计存储量达 1.7 PB 以上[14] . 而这个庞大的数 据体包括了勘探、测井录井及生产等各个领域,既 有结构化数据如地震反演、生产数据等,还包括半 结构化数据如地震解释、钻井报告等,以及非结构 化数据像测井曲线、岩心图片等,因而具有“Variety” 特性. 现如今,这些油田数据的获取大多是基于物 联网的井下或地面传感器等边缘监测设备,在保 证了数据的“Veracity”特性的同时,可以实现对数 据的实时传输,突出了油气数据的“Velocity”. 另 外,由于储层地质结构的复杂性以及油田现场人 为操作等不确定因素,都会令勘探、开发、生产领 域相关数据产生“Variability”,如油田生产过程中 的产量、压力等数据. 而油气数据最为重要的就 是它的“Value”,如在油田勘探中,可以利用地震 数据预测地质空间结构从而确定地下油气藏所 在;在油田开发领域,通过测井录井数据来预测储 层物性参数节约生产时间;在油田生产中,利用生 · 182 · 工程科学学报,第 43 卷,第 2 期
宋洪庆等:油气资源开发的大数据智能平台及应用分析 ·183 产数据完善开发方案进而提高采油效率等.由这 性”,通过大数据技术将这些具有“规模性”、“多 些物联网下的实时监测、物理模拟和实验分析等 样性”、“高速性”的数据存储及融合,利用人工智 数据组成了油田具有大数据“6V”特性的多元异构 能探究其“多变性”原因,挖掘数据间规律最终发 数据体.因此,我们需要基于油气数据的“真实 挥油气数据真正的“价值” Exploration Reservoir engineering Drilling and completion Productron Volume Seismic acquisition Reservoir engineering, Sensors: SCADA sensor: SEGD/SEDY... numerical simulation flow,pressure and ROP flow and pressure Structured data Structured data Structured data WITSML Structured data SEGD,SEGY, WITSML,RESML and RESML Variety pre-stack and post-stack PRODML PRODML Unstructured data Semi-structured data Interpretation report curve. daily drilling report Unstructured:gas log Crude analysis report Real-time data collection Real-time data collection Real-time data collection Velocity Wide-azimuth data Mud logging. LWD and MWD SCADA sensors Veracity Seismic processing Reservoir model Sensor calibration Sensor calibration Reservoir simulation Variability Seismic interpretation combination of seismic Data interpretation and eological interpretation drilling and production data optimization Data interpretation Geological s structu mprove the drilling program Reduce the cost, Value Improve primary oil ave non-productive time reservoir parameter drive innovation with unconventional resources reduce risk recovery 图4油田工业大数据“6V特性 Fig.4 Oilfield industry big data "6V"features! 3油气资源开发的大数据智能平台框架构建 台的优势与潜能 31油气资源大数据智能平台总体框架 3.2数据的收集与存储 为了完成石油工业数据一体化建设,打造涵 随着勘探开发技术的不断更新,石油工业产 盖上游的勘探及开发,中游的运输与存储,下游的 生的数据不但体量极为庞大,更具有多源异构的 分配和销售于一体的大数据智能化平台,构建的 特性.首先,由于石油在勘探和开发中会涉及多个 主要流程及总体框架如图5所示.首先可以依托 领域的共同作用,如地震勘探、测井录井、油田开 石油工业各大巨头公司,研究所及勘探院的数据 发等,因此不同研究领域的数据体有他们各自的 库,将不同领域下不同存储方式的特征数据,按照 数据特征与存储格式.例如,对于地震勘探数据, 结构化数据、半结构化数据、非结构化数据来进 由美国勘探地球物理学会(SEG)推荐的SEDG、 行收集存储,打造一个统一的数据资源池,这也是 SEDY存储格式,以及科罗拉多矿院CWP(Center 整个智能化油气大数据平台的基石.然后,基于数 for Wave Phenomena)实验室开发的一套开源地球 据资源池,我们需要将这些不同领域的数据进行 物理数据处理系统中SU格式(Seismic Unix);对于 数据清理、提取与融合,加强不同领域下数据的关 测井录井数据,主要是常见的测井曲线图片以及 联性,提升数据质量与可信度,从而打破石油工业 相关的解释性文本文件;对于油田开发数据,主要 存在的“数据孤岛”现象.接着,我们以人工智能算 包含油井产量、压力等结构化数据等.其次,油藏 法为武器,通过机器学习、深度学习、统计学分析 数据还具有多尺度的特性,从宏观尺度上通过数 等数据挖掘手段,深层次的剖析解读数据中的潜 值模拟进行地质建模,再到介观层次的格子玻 在规律和隐含的特征,从而给予油田工业更多的 尔兹曼方法的运用6,甚至微观层次的分子动力 建议与决策支持.最后,这些利用人工智能算法获 学研究叨,这些技术手段都在油田领域有着广泛 取的分析结果需要通过可视化等简洁的方式展现 的应用空间.大数据智能平台的真正价值就是可 给终端的用户,使终端客户群如政府机构、研究人 以高效的提取与挖掘这些通过物理模拟、现场监 员、销售部门等可以按照自己的需求方便快捷的 测及实验分析等手段收集来的油气数据体] 获取相关数据,真正的发挥出石油工业大数据平 那么,油气工业如此庞大的多源异构数据需
产数据完善开发方案进而提高采油效率等. 由这 些物联网下的实时监测、物理模拟和实验分析等 数据组成了油田具有大数据“6V”特性的多元异构 数据体. 因此,我们需要基于油气数据的“真实 性”,通过大数据技术将这些具有“规模性”、“多 样性”、“高速性”的数据存储及融合,利用人工智 能探究其“多变性”原因,挖掘数据间规律最终发 挥油气数据真正的“价值”. Volume Variety Velocity Veracity Variability Value Petroleum industry data "6V" characteristics Exploration Reservoir engineering Drilling and completion Production Seismic acquisition, SEGD/SEDY... Reservoir engineering, numerical simulation Sensors: flow, pressure and ROP SCADA sensor: flow and pressure Geological spatial structure prediction, reservoir parameter inversion Improve the drilling program, drive innovation with unconventional resources Reduce the cost, save non-productive time reduce risk Improve primary oil recovery Seismic interpretation, geological interpretation Reservoir simulation, combination of seismic, drilling and production data Data interpretation and optimization Data interpretation Seismic processing Reservoir model Sensor calibration Sensor calibration Real-time data collection Real-time data collection Real-time data collection Wide-azimuth data acquisition Mud logging, LWD and MWD SCADA sensors SEGD, SEGY, pre-stack and post-stack WITSML, RESML and PRODML Structured data WITSML Final well report, daily drilling report Structured data Unstructured data Semi-structured data Interpretation report Logging curve, core picture... Unstructured: gas log... Structured data Structured data Semi-structured data Unstructured data Crude analysis report RESML PRODML 图 4 油田工业大数据“6V”特性[13] Fig.4 Oilfield industry big data “6V” features[13] 3 油气资源开发的大数据智能平台框架构建 3.1 油气资源大数据智能平台总体框架 为了完成石油工业数据一体化建设,打造涵 盖上游的勘探及开发,中游的运输与存储,下游的 分配和销售于一体的大数据智能化平台,构建的 主要流程及总体框架如图 5 所示. 首先可以依托 石油工业各大巨头公司,研究所及勘探院的数据 库,将不同领域下不同存储方式的特征数据,按照 结构化数据、半结构化数据、非结构化数据来进 行收集存储,打造一个统一的数据资源池,这也是 整个智能化油气大数据平台的基石. 然后,基于数 据资源池,我们需要将这些不同领域的数据进行 数据清理、提取与融合,加强不同领域下数据的关 联性,提升数据质量与可信度,从而打破石油工业 存在的“数据孤岛”现象. 接着,我们以人工智能算 法为武器,通过机器学习、深度学习、统计学分析 等数据挖掘手段,深层次的剖析解读数据中的潜 在规律和隐含的特征,从而给予油田工业更多的 建议与决策支持. 最后,这些利用人工智能算法获 取的分析结果需要通过可视化等简洁的方式展现 给终端的用户,使终端客户群如政府机构、研究人 员、销售部门等可以按照自己的需求方便快捷的 获取相关数据,真正的发挥出石油工业大数据平 台的优势与潜能. 3.2 数据的收集与存储 随着勘探开发技术的不断更新,石油工业产 生的数据不但体量极为庞大,更具有多源异构的 特性. 首先,由于石油在勘探和开发中会涉及多个 领域的共同作用,如地震勘探、测井录井、油田开 发等,因此不同研究领域的数据体有他们各自的 数据特征与存储格式. 例如,对于地震勘探数据, 由美国勘探地球物理学会( SEG)推荐的 SEDG、 SEDY 存储格式,以及科罗拉多矿院 CWP(Center for Wave Phenomena)实验室开发的一套开源地球 物理数据处理系统中 SU 格式(Seismic Unix);对于 测井录井数据,主要是常见的测井曲线图片以及 相关的解释性文本文件;对于油田开发数据,主要 包含油井产量、压力等结构化数据等. 其次,油藏 数据还具有多尺度的特性,从宏观尺度上通过数 值模拟[15] 进行地质建模,再到介观层次的格子玻 尔兹曼方法的运用[16] ,甚至微观层次的分子动力 学研究[17] ,这些技术手段都在油田领域有着广泛 的应用空间. 大数据智能平台的真正价值就是可 以高效的提取与挖掘这些通过物理模拟、现场监 测及实验分析等手段收集来的油气数据体[18] . 那么,油气工业如此庞大的多源异构数据需 宋洪庆等: 油气资源开发的大数据智能平台及应用分析 · 183 ·
184 工程科学学报,第43卷,第2期 Government organization Oil company Research institute Service Computer display Large screen display Mobile display Dynamic reservoir management Single well management Development plan and adjustment application tat Simulation Data tracking Well structure Multiphase flow History fitting Optimization Index prediction Reserves Well state Diagnosis Evaluation Production A Artificial intelligence Random forest Bayes Fuzzy logic Deep nerual network Data cleaning 5 Relational data Hvbrid STORM Spark Offline and Data extraction distributed real-time architecture storage computing Data fusion Structured data 。Semi--structured Reservior data Simulation Drilling Production Monitor Experiment Unstructured resource pool 因5油气大数据智能平台基本流程与总体框架 Fig.5 Basic process and overall framework of oil and gas big data intelligent platform 要用什么来进行高效的存储呢,分布式框架的鼻 Stom则是来一条数据就处理一条数据,这种不同 祖Hadoop的出现u吻是大数据技术得以广泛使用 的数据处理机制也决定了应用场景的不同.但是 的关键.Hadoop主要由三个模块构成:HDFS, 无论是Spark还是Storm计算框架在大数据技术 YARN2o以及MapReduce2.HDFS即为分布式文 中均需要依托HDFS进行. 件系统,其最大的优势是可以整合在分布式架构 因此,单一的架构一定无法满足石油工业的 下每一台计算机的硬盘资源,无论是存储还是计 计算要求,混合架构才是当今大数据油田的核心 算都可以视为在一个硬盘下使用,极大的加快了 架构,既能满足油田多源异构数据体的分布式存 数据的存储的效率;YARN是分布式资源管理系 储,又可以对数据进行离线计算和实时处理.如 统,主要是对于HDFS进行统一的集群管理及调 图6所示,集Hadoop、Spark和Storm计算框架2 度,提高了资源利用率;MapReduce是一个基于数 的优势于一体,才能充分挖掘油田数据的巨大潜 据批处理模式的计算框架,通过简单的编程就 能,打造真正油气大数据分析平台 可以完成分布式程序的计算,适合PB级以上海量 3.3数据的清洗与融合 数据的离线处理,具有很高的容错性及良好的扩 “数据孤岛”现象一直是困扰石油工业智能 展性 化的核心问题.其主要原因是石油工业涵盖了多 虽然MapReduce具有强大的离线处理能力, 个业务领域,包括物探、钻井、录井、测井、试采、 但由于是基于批处理模式以及计算过程是在硬 生产等.而这些不同的部门根据各自数据的特点 盘上进行,因此不擅长数据的实时计算,于是 建设自己的数据库,使得数据孤立存储;而且,对 Spark2m和Storm2开始登上大数据的舞台,他们 于相同属性的数据,不同部门站在各自研究领域 的运算过程均是基于内存而非硬盘,同时运用的 的角度进行分析,会产生不同的理解,加大了跨领 是数据流处理模式,能够极大的提高了数据的吞 域数据合作的难度.同时,企业的管理体制以及数 吐和处理速度.他们的区别在于Spark是准实时 据标准的不统一都会在无形中引发“数据孤岛”现 而Storm是完全实时(延迟度为秒级),Spark的运 象,所带来的这负面影响主要是效率低下以及资 行模式是先收集一段数据然后进行统一处理,而 源浪费
要用什么来进行高效的存储呢,分布式框架的鼻 祖 Hadoop 的出现[19] 是大数据技术得以广泛使用 的关键 . Hadoop 主要由三个模块构成 : HDFS, YARN[20] 以及 MapReduce[21] . HDFS 即为分布式文 件系统,其最大的优势是可以整合在分布式架构 下每一台计算机的硬盘资源,无论是存储还是计 算都可以视为在一个硬盘下使用,极大的加快了 数据的存储的效率;YARN 是分布式资源管理系 统,主要是对于 HDFS 进行统一的集群管理及调 度,提高了资源利用率;MapReduce 是一个基于数 据批处理模式的计算框架,通过简单的编程就 可以完成分布式程序的计算,适合 PB 级以上海量 数据的离线处理,具有很高的容错性及良好的扩 展性. 虽然 MapReduce 具有强大的离线处理能力, 但由于是基于批处理模式以及计算过程是在硬 盘上进行 ,因此不擅长数据的实时计算. 于是 Spark[22] 和 Storm[23] 开始登上大数据的舞台,他们 的运算过程均是基于内存而非硬盘,同时运用的 是数据流处理模式,能够极大的提高了数据的吞 吐和处理速度. 他们的区别在于 Spark 是准实时 而 Storm 是完全实时(延迟度为秒级),Spark 的运 行模式是先收集一段数据然后进行统一处理,而 Storm 则是来一条数据就处理一条数据,这种不同 的数据处理机制也决定了应用场景的不同. 但是 无论是 Spark 还是 Storm 计算框架在大数据技术 中均需要依托 HDFS 进行. 因此,单一的架构一定无法满足石油工业的 计算要求,混合架构才是当今大数据油田的核心 架构,既能满足油田多源异构数据体的分布式存 储,又可以对数据进行离线计算和实时处理. 如 图 6 所示,集 Hadoop、Spark 和 Storm 计算框架[24] 的优势于一体,才能充分挖掘油田数据的巨大潜 能,打造真正油气大数据分析平台. 3.3 数据的清洗与融合 “数据孤岛”现象[25] 一直是困扰石油工业智能 化的核心问题. 其主要原因是石油工业涵盖了多 个业务领域,包括物探、钻井、录井、测井、试采、 生产等. 而这些不同的部门根据各自数据的特点 建设自己的数据库,使得数据孤立存储;而且,对 于相同属性的数据,不同部门站在各自研究领域 的角度进行分析,会产生不同的理解,加大了跨领 域数据合作的难度. 同时,企业的管理体制以及数 据标准的不统一都会在无形中引发“数据孤岛”现 象,所带来的这负面影响主要是效率低下以及资 源浪费. Government organization Oil company Research institute Computer display Large screen display Mobile display Dynamic reservoir management Single well management Development plan and adjustment Simulation Index prediction Data tracking Reserves Well structure Well state Multiphase flow Diagnosis History fitting Evaluation Optimization Production Seismic Simulation Drilling Production Monitor Experiment Structured data Semi-structured Unstructured Reservior data resource pool Artificial intelligence Data cleaning Data extraction Data fusion Relational data distributed storage Hybrid architecture Offline and real-time computing Random forest Bayes Fuzzy logic Deep nerual network learning Machine Deep learning Service Data visualiztion and application Data mining Data storage Data source 图 5 油气大数据智能平台基本流程与总体框架 Fig.5 Basic process and overall framework of oil and gas big data intelligent platform · 184 · 工程科学学报,第 43 卷,第 2 期
宋洪庆等:油气资源开发的大数据智能平台及应用分析 185 Spark framework Storm framework NoSOL DB (quasi real-time computing) (real-time computing) Tamino:Structured data storage MLlib Graphx Spark streaming Nimbus Zookeeper (Dynamic production data, Machine Graphics Real-time data Task submission and Cluster seismic inversion...) learning processin stream processing cluster monitoring coordination Couch DB:Semi-structured data storage Worker Spark SQL-RDD Supervisor (Seismic interpretation, Data execution basic unit Running Supervisory task logging reports...) process NEO4J:Unstructured data storage (Drilling logging curves, Hadoop architecture(data storage and offline computing) digital core pictures...) HDFS MapReduce YARN Cassandra:Column storage mode of Distributed storage of Big data processing Cluster management distributed architecture oil and gas data framework and deployment 因6油气大数据智能平台Hadoop、Spark及Storm混合存储计算架构 Fig.6 Oil and gas big data intelligent platform with Hadoop,Spark,and Storm hybrid storage computing architecture 因此,利用大数据技术将不同部门的存储数 对油藏数据进行清洗,解决数据中的缺失、冗余、 据进行清洗和融合显得尤为重要.如图7所示,首 冲突等质量问题.接着需要依靠各专业领域的专 先以各石油公司、研究机构现有的专业数据库为 家根据数据中参数涉及专业频率,明确参数权重, 基础,通过油气工业大数据平台按照结构化、半结 分析相关参数逻辑关系,确定参数转化公式等,建 构化、非结构化数据进行统一的整合与存储,建立 立统一参数围度及加强数据间的逻辑关联,实现 基础的数据共享资源池.然后基于完整性约束、 油气工业各领域之间的数据融合,从而打破“数据 修复规则P7、统计理论2及人机结合等方法, 孤岛”现象 Structured data Partial cleaning Geophysics Semi-structured data Global cleaning onomic Geologic Unstructured data Rule-based Cleaning Fusion "Multi-source" Data fusion Data resource pool Statistics Databases of oil companies research institutions, Man-machine universities.. integration Data integration and extraction Data cleaning 图7油气工业多源异构数据体的清洗融合 Fig.7 Cleaning and fusion of multi-source data in the oil and gas industry 3.4数据的挖掘与分析 机器学习是企图从大量的历史数据中捕获其变 石油工业数据的存储和融合至关重要,但更 化特征、分析内在联系从而挖掘数据间的隐含规律 重要的是如何通过人工智能的算法去进行数据的 的算法统称.如图8所示,应用在石油工业的主要 挖掘与分析.随着机器学习和深度学习的飞速发 算法有:支撑向量机(SVM),模糊逻辑(FZ),遗传算 展,人工智能已经在各领域已经展现了其强大的 法(GA),随机森林(RF),粒子群优化算法(PSO)以 预测、分析、决策及指导能力,逐步开始引领工业 及广泛应用的人工神经网络(ANN)等.基于RF算 4.0变革.因此,近年来许多机器学习和深度学习 法,Aliyuda等Bo1建立了对采收率和油井产量的预 算法也已经逐步融入到石油工业智能化的研究 测模型,预测结果与实际的输出极为匹配.Ahmadi 中,无论是在石油工业上游的勘探与开发,还是在 和Bahadori利用最小二乘支撑向量机(LSSVM) 中游的运输及提炼,乃至下游的销售都产生了积 方法准确预测在油井开发过程中水气的突破时间,并 极的影响,大大提高了研究效率及经济效益 通过GA进行算法优化.同时,支撑向量回归方法
因此,利用大数据技术将不同部门的存储数 据进行清洗和融合显得尤为重要. 如图 7 所示,首 先以各石油公司、研究机构现有的专业数据库为 基础,通过油气工业大数据平台按照结构化、半结 构化、非结构化数据进行统一的整合与存储,建立 基础的数据共享资源池. 然后基于完整性约束[26]、 修复规则[27]、统计理论[28] 及人机结合[29] 等方法, 对油藏数据进行清洗,解决数据中的缺失、冗余、 冲突等质量问题. 接着需要依靠各专业领域的专 家根据数据中参数涉及专业频率,明确参数权重, 分析相关参数逻辑关系,确定参数转化公式等,建 立统一参数围度及加强数据间的逻辑关联,实现 油气工业各领域之间的数据融合,从而打破“数据 孤岛”现象. Structured data Semi-structured data Unstructured data Data integration and extraction Data cleaning Databases of oil companies research institutions, universities... Data resource pool Cleaning Partial cleaning Global cleaning Rule-based Statistics Man-machine integration Fusion Geophysics Geological analysis Economic evaluation Drilling engineering Production engineering Reservoir engineerin ...... “Multi-source” Data fusion 图 7 油气工业多源异构数据体的清洗融合 Fig.7 Cleaning and fusion of multi-source data in the oil and gas industry 3.4 数据的挖掘与分析 石油工业数据的存储和融合至关重要,但更 重要的是如何通过人工智能的算法去进行数据的 挖掘与分析. 随着机器学习和深度学习的飞速发 展,人工智能已经在各领域已经展现了其强大的 预测、分析、决策及指导能力,逐步开始引领工业 4.0 变革. 因此,近年来许多机器学习和深度学习 算法也已经逐步融入到石油工业智能化的研究 中,无论是在石油工业上游的勘探与开发,还是在 中游的运输及提炼,乃至下游的销售都产生了积 极的影响,大大提高了研究效率及经济效益. 机器学习是企图从大量的历史数据中捕获其变 化特征、分析内在联系从而挖掘数据间的隐含规律 的算法统称. 如图 8 所示,应用在石油工业的主要 算法有:支撑向量机(SVM),模糊逻辑(FZ),遗传算 法(GA),随机森林(RF),粒子群优化算法(PSO)以 及广泛应用的人工神经网络(ANN)等. 基于 RF 算 法,Aliyuda 等[30] 建立了对采收率和油井产量的预 测模型,预测结果与实际的输出极为匹配. Ahmadi 和 Bahadori[31] 利用最小二乘支撑向量机(LSSVM) 方法准确预测在油井开发过程中水气的突破时间,并 通过 GA 进行算法优化. 同时,支撑向量回归方法 Spark framework (quasi real-time computing) MLlib Machine learning Graphx Graphics processing Spark streaming Real-time data stream processing Storm framework (real-time computing) Nimbus Task submission and cluster monitoring Zookeeper Cluster coordination Spark SQL-RDD Data execution basic unit Supervisor Supervisory task Worker Running process Hadoop architecture (data storage and offline computing) HDFS Distributed storage of oil and gas data MapReduce Big data processing framework YARN Cluster management and deployment NoSQL DB Tamino: Structured data storage (Dynamic production data, seismic inversion...) Couch DB: Semi-structured data storage (Seismic interpretation, logging reports...) NEO4J: Unstructured data storage (Drilling logging curves, digital core pictures...) Cassandra: Column storage mode of distributed architecture 图 6 油气大数据智能平台 Hadoop、Spark 及 Storm 混合存储计算架构 Fig.6 Oil and gas big data intelligent platform with Hadoop, Spark, and Storm hybrid storage computing architecture 宋洪庆等: 油气资源开发的大数据智能平台及应用分析 · 185 ·
186 工程科学学报,第43卷,第2期 也被应用于非均质储层的渗透率预测以及裂缝 适用于特低渗透油藏井排距设计%而PSO算法则 预测中B,都表现出了优越的性能.El-Sebakhy提 被多次应用于油田井位的优化等37-3].另外,Ahmadi 出了一种神经模糊推理系统来评估原油系统中的压 等39也利用混合了PSO算法的人工神经网络预测 力-体积-温度特性.Patel等31应用遗传算法很好的 储层物性.由此可以看到,机器学习方法的互相结合 解决了油田通过循环蒸汽来采油问题.GA算法也 在油田开发及生产方面会有更广阔的的应用空间. Capillary pressure curve reconstruction Pore Structure Physical parameters:rock compressibility. Deep ncural network Physical parameters Forecast of oil production and bottom hole pressure Water flooding efficiency Fuzzy logic Logging data generation Evaluation of PVT characteristics Sedimentary microfacies identification Oil and gas production Crack prediction Prediction of remaining oil saturation Oil recovery forecast Random fores Recurrent neural network Logging curve generation Lithology identification Reservoir model recognition Reservoir description Thickness of reservoir sand body Water saturation predictionNeuralworks Deep belief network Prediction of reservoir permeability paramets Physical parameters:effective porosity Reservoir identification Well pattern design Seismic image reconstruction Core permeability Genetic algorithm Generative adversarial networkUltrahigh resolution seismic inversion Optimization of oil production Artificial Seismic resolution enhancement Crack prediction intelligence Pipeline leak diagnosis and early waming Reservoir permeability Hybrid neural network Seismic phase waveform classification Support vector machine Prediction of reservoir physical parameters Water breakthrough time prediction Water saturation estimation Permeability prediction Physical parameters:permeability and fluidity ratio Well location opimionPicam Well pattem infilling Oilfield productivity forecast Convolutional neural network Fault interpretation and identification Logging lithology interpretation Oilfield fault detection and diagnosis 图8油气行业常用人工智能算法 Fig.8 Artificial intelligence algorithms commonly used in the oil and gas industry 人工神经网络是受人类大脑的生物学习过程 深度学习的多级水力压裂水平井最终采收率的预 启发从而创造出的一种机器学习算法,其内部具 测模型.Korjani等将目标井方向、角度、位置、 有与人类神经元类似的高度关联的节点,可以学 深度与电阻率结合,运用此方法去生成了位于加 习数据中的非线性映射特征从而建立预测、函数 利福尼亚某油田中特定位置的测井数据.You等7 逼近、算法优化等.由于此类算法极为适合在数 基于BP神经网络并结合了粒子群优化算法,完成 据关系模糊、数据不完善等不确定性条件时去挖 了对毛细管压力曲线的重构和预测.王安辉等 掘数据潜在规律进行分析,因此在石油工业领域 通过深度学习网络考虑了压力及孔隙度等因素, 已经广泛运用并有着极佳的预测效果.早在20世 预测岩石的压缩系数.Wang等9改进了深度神 纪90年代,人工神经网貉就被运用在油田沉积微 经网络对致密油气藏产量进行预测.利用CNN, 相的识别,、采油井产量和自喷井井底流压的 李道伦等50基于卷积神经网络根据实测压力及对 预测、水淹层测井的评价]等.Negash和Yaw 应导数数据,准确预测油藏参数,例如流度比、储 整合了油管压力、温度,套管压力,注水压力及注 容比等,进而实现了对径向复合油藏自动试井的 水量等参数,利用带有外部输入的自回归网络 解释.Zhu等s)基于小波分解法为每个测井点构 (NARX),准确的预测生产井的油、气、水产量. 造多层图像,进而利用深层卷积神经网络完成了 随着深度学习的发展,国内外大量学者也开 对测井的岩性解释.Huang等网提出了一个可扩 始着手致力于深度学习算法与石油工业相结合的 展的地震分析大数据平台,根据地震体数据,基于 研究.其主要应用的深度学习算法包括反向传播 深度学习模型中CNN对地质断层进行检测和识 神经网络(BPNN),卷积神经网络(CNN),循环神 别.同时CNN还可用于油田故障诊断及检测等53-s刈 经网络(RNN),深度置信网络(DBN),生成对抗网 对于RNN而言,张东晓等s阿考虑了测井信息随深 络(GAN)以及混合神经网络模型.基于BPNN, 度的变化趋势,同时兼顾了不同测井曲线的内在 Carpenter根据超过200000地质数据点以及800 联系,通过RNN提出了一种人工生成测井曲线的 多口井的特征数据,构建了一个基于地质驱动和 方法,并在实际验证中取得了良好的效果.Tian和
也被应用于非均质储层的渗透率预测[32] 以及裂缝 预测中[33] ,都表现出了优越的性能. El-Sebakhy[34] 提 出了一种神经模糊推理系统来评估原油系统中的压 力−体积−温度特性. Patel 等[35] 应用遗传算法很好的 解决了油田通过循环蒸汽来采油问题. GA 算法也 适用于特低渗透油藏井排距设计[36] . 而 PSO 算法则 被多次应用于油田井位的优化等[37−38] . 另外,Ahmadi 等[39] 也利用混合了 PSO 算法的人工神经网络预测 储层物性. 由此可以看到,机器学习方法的互相结合 在油田开发及生产方面会有更广阔的的应用空间. Pore Structure Physical parameters Water flooding efficiency Evaluation of PVT characteristics Crack prediction Lithology identification Oil recovery forecast Physical parameters: effective porosity Water saturation prediction Reservoir description Well pattern design Core permeability Optimization of oil production Crack prediction Reservoir permeability Water breakthrough time prediction Permeability prediction Well location optimization Oilfield productivity forecast Capillary pressure curve reconstruction Physical parameters: rock compressibility... Forecast of oil production and bottom hole pressure Logging data generation Sedimentary microfacies identification Oil and gas production Prediction of remaining oil saturation Logging curve generation Reservoir model recognition Thickness of reservoir sand body Prediction of reservoir permeability parameters Reservoir identification Seismic image reconstruction Ultrahigh resolution seismic inversion Seismic resolution enhancement Water saturation estimation Pipeline leak diagnosis and early warning Seismic phase waveform classification Prediction of reservoir physical parameters Oilfield fault detection and diagnosis Physical parameters: permeability and fluidity ratio Well pattern infilling Fault interpretation and identification Logging lithology interpretation Fuzzy logic Random forest Neural networks Genetic algorithm Support vector machine Particle swarm algorithm Deep neural network Recurrent neural network Deep belief network Generative adversarial network Hybrid neural network Convolutional neural network Machine learning Deep learning Artificial intelligence 图 8 油气行业常用人工智能算法 Fig.8 Artificial intelligence algorithms commonly used in the oil and gas industry 人工神经网络是受人类大脑的生物学习过程 启发从而创造出的一种机器学习算法,其内部具 有与人类神经元类似的高度关联的节点,可以学 习数据中的非线性映射特征从而建立预测、函数 逼近、算法优化等. 由于此类算法极为适合在数 据关系模糊、数据不完善等不确定性条件时去挖 掘数据潜在规律进行分析,因此在石油工业领域 已经广泛运用并有着极佳的预测效果. 早在 20 世 纪 90 年代,人工神经网络就被运用在油田沉积微 相的识别[40]、采油井产量[41] 和自喷井井底流压的 预测[42]、水淹层测井的评价[43] 等. Negash 和 Yaw[44] 整合了油管压力、温度,套管压力,注水压力及注 水量等参数,利用带有外部输入的自回归网络 (NARX),准确的预测生产井的油、气、水产量. 随着深度学习的发展,国内外大量学者也开 始着手致力于深度学习算法与石油工业相结合的 研究. 其主要应用的深度学习算法包括反向传播 神经网络(BPNN),卷积神经网络(CNN),循环神 经网络(RNN),深度置信网络(DBN),生成对抗网 络 (GAN)以及混合神经网络模型. 基于 BPNN, Carpenter[45] 根据超过 200000 地质数据点以及 800 多口井的特征数据,构建了一个基于地质驱动和 深度学习的多级水力压裂水平井最终采收率的预 测模型. Korjani 等[46] 将目标井方向、角度、位置、 深度与电阻率结合,运用此方法去生成了位于加 利福尼亚某油田中特定位置的测井数据. You 等[47] 基于 BP 神经网络并结合了粒子群优化算法,完成 了对毛细管压力曲线的重构和预测. 王安辉等[48] 通过深度学习网络考虑了压力及孔隙度等因素, 预测岩石的压缩系数. Wang 等[49] 改进了深度神 经网络对致密油气藏产量进行预测. 利用 CNN, 李道伦等[50] 基于卷积神经网络根据实测压力及对 应导数数据,准确预测油藏参数,例如流度比、储 容比等,进而实现了对径向复合油藏自动试井的 解释. Zhu 等[51] 基于小波分解法为每个测井点构 造多层图像,进而利用深层卷积神经网络完成了 对测井的岩性解释. Huang 等[52] 提出了一个可扩 展的地震分析大数据平台,根据地震体数据,基于 深度学习模型中 CNN 对地质断层进行检测和识 别. 同时 CNN 还可用于油田故障诊断及检测等[53−54] . 对于 RNN 而言,张东晓等[55] 考虑了测井信息随深 度的变化趋势,同时兼顾了不同测井曲线的内在 联系,通过 RNN 提出了一种人工生成测井曲线的 方法,并在实际验证中取得了良好的效果. Tian 和 · 186 · 工程科学学报,第 43 卷,第 2 期
宋洪庆等:油气资源开发的大数据智能平台及应用分析 ·187 Hornelse%基于永久井下压力计数据,将循环神经网 的石油工程问题,成为国内外学者们的研究热点 络用于油藏模型识别和生产预测.该方法在致密 机器学习之所以能够受到石油工业研究人员的青 油气藏的产量预测方面也有着很好的效果.除了 睐,主要因为受限于现在的科技水准与设备,人们 上述三类主要的深度学习模型,还有一些深度网 并不能准确的掌握地下的储层特性以及地质参数 络模型也已经开始试探性的结合石油工业领域. 与动态数据之间存在的非线性关系,搞清这些非 Liu等s)通过深度置信网络(DBN)基于多个地震 线性关系进而求出相关参数的解析解需要科技手 属性预测储层中砂体厚度,相比于BPNN与支撑 段的提升和大量研究者们的探索,而机器学习的 向量机,具有更好的预测效果.Cao等s网采用了五 出现恰好能够解决石油工业面临的这种问题.以 层DBN用于识别了川西盆地气藏.生成对抗网络 深度学习6侧为例,它可以利用多层的网络结构自 (GAN)主要应用于地质勘探,Carpenters9提出一 主捕获并学习输入变量与输出参数之间的非线性 种利用GAN对地震图像的重构的方法.同时, 映射特征,并自主学习数据特征来建立数据之间 GAN也可用于超高分辨率地震反演6以及对地 的关系模型.相比于一些常规的机器学习方法,在 震分辨率进行增强6 对大量数据进行处理过程中,深度学习会展现更 当然,每个深度神经网络都有自己的优势以 为强大的对于数据特征的学习能力,表现出更完 及本身的一些局限性,因此许多学者对于特定的 美的预测性能等.本章结合几个实例,介绍下常用 应用背景,将不同的深度学习算法相互混合62,从 的深度学习方法及在油藏工业各领域的应用 而可以更好的对数据特征进行提取以及对神经网 4.1储层物性参数智能预测 络进行优化.Xu等6首先利用GAN网络对不平 油田的开发中储层的物性参数极为重要,如孔 衡的故障数据进行增强,然后再通过长短时记忆 隙度、渗透率等.Wu等0利用深度卷积神经网络 网络(LSTM)学习数据在时间维度上的相关性并 识别数字岩心,同时将孔隙度和比表面积作为物理 对管道状态进行分类,从而预测管道是否发生泄 延伸放入该网络中预测岩心渗透率.Algahtani等四 漏.Alakeely和Hornet6将RNN与CNN的组合模 通过卷积神经网络学习高分辨率数字岩石图片的 型应用到了传统油藏模拟任务中.Lei等s基于 孔隙特征,从而对孔隙度、平均孔径等作出准确 RNN与CNN,建立了卷积循环网络模型并成功应 预测 用于地震相的波形分类.除此之外,还有一些学者 如图9所示为基于数字岩石图片预测物性参 将神经网络与传统的机器学习算法相结合 数基本流程.利用高分辨率数字成像技术获取数 Anifowose和Abdulraheemt提出了一种结合功能 字岩石或岩心照片作为深度学习模型的输入数 网络、模糊逻辑和支持向量机杂交的网络模型,用 据,通过格子玻尔兹曼及分水岭等算法基于数字 于确定储层渗透率和孔隙度这两种重要参数, 图片获取岩心渗透率及孔隙度等参数作为输出数 Amii等I7利用独立分量分析(ICA)优化了BP神 据,每个岩心图片以及其对应的物性参数为一组 经网络,进而可以对致密砂岩含水饱和度进行有 样本数据.收集大量样本数据构成样本数据集,并 效估计.Saemi等s8开发了一种基于遗传算法的 按照一定比例划分为训练集和测试集,利用训练 神经网络模型,通过该模型来寻求测井数据与岩 集的数据通过反向传播算法训练卷积神经网络, 心渗透率可能存在的关联, 训练好的CNN模型可以通过数字岩心照片直接 4油气资源开发智能方法应用 得到对应的物性参数,基于测试集对训练好的最 优模型进行测试.从测试集结果可以看到,预测值 油藏大数据平台的构建使石油工业能够打破 与真实值的散点分布图主要在Y=X直线附近,说 “数据孤岛”等问题,将勘探、钻井、完井、生产等 明卷积神经网络利用数字岩心图片对相应物性参 各领域数据提取融合,打造了一个数据质量好、关 数的预测是有效且可靠的 联性强、可信度高的油藏数据资源池.当然,数据 4.2井间连通性智能评价 资源是石油工业的基石,如果把它比作我们手中 受限于储层地质条件的复杂性以及现如今科 的“武器”,那么人工智能就是决定这把“武器”能 技水平的局限性,我们无法根据地质结构对井间 够发挥多大威力的关键所在.众所周知,自21世 的连通性作出准确评价.Du等四将油藏数值模拟 纪以来,机器学习和深度学习有着迅猛的发展,而 与深度学习相结合,通过深度神经网络建立了油 且已经逐步与石油工业相结合,解决了许多复杂 田现场较易获取的动态生产数据与储层平均渗透
Horne[56] 基于永久井下压力计数据,将循环神经网 络用于油藏模型识别和生产预测. 该方法在致密 油气藏的产量预测方面也有着很好的效果. 除了 上述三类主要的深度学习模型,还有一些深度网 络模型也已经开始试探性的结合石油工业领域. Liu 等[57] 通过深度置信网络(DBN)基于多个地震 属性预测储层中砂体厚度,相比于 BPNN 与支撑 向量机,具有更好的预测效果. Cao 等[58] 采用了五 层 DBN 用于识别了川西盆地气藏. 生成对抗网络 (GAN)主要应用于地质勘探,Carpenter[59] 提出一 种利用 GAN 对地震图像的重构的方法. 同时 , GAN 也可用于超高分辨率地震反演[60] 以及对地 震分辨率进行增强[61] . 当然,每个深度神经网络都有自己的优势以 及本身的一些局限性,因此许多学者对于特定的 应用背景,将不同的深度学习算法相互混合[62] ,从 而可以更好的对数据特征进行提取以及对神经网 络进行优化. Xu 等[63] 首先利用 GAN 网络对不平 衡的故障数据进行增强,然后再通过长短时记忆 网络(LSTM)学习数据在时间维度上的相关性并 对管道状态进行分类,从而预测管道是否发生泄 漏. Alakeely 和 Horne[64] 将 RNN 与 CNN 的组合模 型应用到了传统油藏模拟任务中. Lei 等[65] 基于 RNN 与 CNN,建立了卷积循环网络模型并成功应 用于地震相的波形分类. 除此之外,还有一些学者 将 神 经 网 络 与 传 统 的 机 器 学 习 算 法 相 结 合 . Anifowose 和 Abdulraheem[66] 提出了一种结合功能 网络、模糊逻辑和支持向量机杂交的网络模型,用 于确定储层渗透率和孔隙度这两种重要参数. Amiri 等[67] 利用独立分量分析(ICA)优化了 BP 神 经网络,进而可以对致密砂岩含水饱和度进行有 效估计. Saemi 等[68] 开发了一种基于遗传算法的 神经网络模型,通过该模型来寻求测井数据与岩 心渗透率可能存在的关联. 4 油气资源开发智能方法应用 油藏大数据平台的构建使石油工业能够打破 “数据孤岛”等问题,将勘探、钻井、完井、生产等 各领域数据提取融合,打造了一个数据质量好、关 联性强、可信度高的油藏数据资源池. 当然,数据 资源是石油工业的基石,如果把它比作我们手中 的“武器”,那么人工智能就是决定这把“武器”能 够发挥多大威力的关键所在. 众所周知,自 21 世 纪以来,机器学习和深度学习有着迅猛的发展,而 且已经逐步与石油工业相结合,解决了许多复杂 的石油工程问题,成为国内外学者们的研究热点. 机器学习之所以能够受到石油工业研究人员的青 睐,主要因为受限于现在的科技水准与设备,人们 并不能准确的掌握地下的储层特性以及地质参数 与动态数据之间存在的非线性关系,搞清这些非 线性关系进而求出相关参数的解析解需要科技手 段的提升和大量研究者们的探索,而机器学习的 出现恰好能够解决石油工业面临的这种问题. 以 深度学习[69] 为例,它可以利用多层的网络结构自 主捕获并学习输入变量与输出参数之间的非线性 映射特征,并自主学习数据特征来建立数据之间 的关系模型. 相比于一些常规的机器学习方法,在 对大量数据进行处理过程中,深度学习会展现更 为强大的对于数据特征的学习能力,表现出更完 美的预测性能等. 本章结合几个实例,介绍下常用 的深度学习方法及在油藏工业各领域的应用. 4.1 储层物性参数智能预测 油田的开发中储层的物性参数极为重要,如孔 隙度、渗透率等. Wu 等[70] 利用深度卷积神经网络 识别数字岩心,同时将孔隙度和比表面积作为物理 延伸放入该网络中预测岩心渗透率. Alqahtani 等[71] 通过卷积神经网络学习高分辨率数字岩石图片的 孔隙特征,从而对孔隙度、平均孔径等作出准确 预测. 如图 9 所示为基于数字岩石图片预测物性参 数基本流程. 利用高分辨率数字成像技术获取数 字岩石或岩心照片作为深度学习模型的输入数 据,通过格子玻尔兹曼及分水岭等算法基于数字 图片获取岩心渗透率及孔隙度等参数作为输出数 据,每个岩心图片以及其对应的物性参数为一组 样本数据. 收集大量样本数据构成样本数据集,并 按照一定比例划分为训练集和测试集. 利用训练 集的数据通过反向传播算法训练卷积神经网络, 训练好的 CNN 模型可以通过数字岩心照片直接 得到对应的物性参数,基于测试集对训练好的最 优模型进行测试. 从测试集结果可以看到,预测值 与真实值的散点分布图主要在 Y=X 直线附近,说 明卷积神经网络利用数字岩心图片对相应物性参 数的预测是有效且可靠的. 4.2 井间连通性智能评价 受限于储层地质条件的复杂性以及现如今科 技水平的局限性,我们无法根据地质结构对井间 的连通性作出准确评价. Du 等[72] 将油藏数值模拟 与深度学习相结合,通过深度神经网络建立了油 田现场较易获取的动态生产数据与储层平均渗透 宋洪庆等: 油气资源开发的大数据智能平台及应用分析 · 187 ·