基于大數(shù)據(jù)的測井智能解釋系統(tǒng)開發(fā)與應(yīng)用
作者:檢測狗 發(fā)表時間:2021-03-17 08:04:59 瀏覽次數(shù):368
-
碩博初稿查重系統(tǒng) 498.00元/篇? 語種:中文,英文,小語種? 適用:雜志社投稿,職稱論文? 簡介:碩博初稿檢測(一般習(xí)慣叫做碩博預(yù)審版),論文查重檢測上千萬篇中文文獻,超百萬篇各類獨家文獻,超百萬港澳臺地區(qū)學(xué)術(shù)文獻過千...開始檢測
-
維普查重(大學(xué)生版) 4.00元/千字? 語種:中文,英文? 適用:雜志社投稿,職稱論文? 簡介:學(xué)位論文查重,維普大學(xué)生版論文查重系統(tǒng):高校,雜志社指定系統(tǒng),可檢測期刊發(fā)表,大學(xué)生,碩博等論文。檢測報告支持PDF、網(wǎng)...開始檢測
-
本科高校內(nèi)部版系統(tǒng) 288.00元/篇? 語種:中文,英文,小語種? 適用:雜志社投稿,職稱論文? 簡介:比定稿版少大學(xué)生聯(lián)合比對庫,其他數(shù)據(jù)庫一致。出結(jié)果快,價格相對低廉,不支持驗證,適合在修改中期使用,定稿推薦PMLC?!?..開始檢測
-
萬方論文查重系統(tǒng) 4.00元/千字? 語種:中文? 適用:雜志社投稿,職稱論文? 簡介:畢業(yè)論文查重,萬方查重系統(tǒng),涵蓋期刊、學(xué)位論文、學(xué)術(shù)成果、學(xué)術(shù)會議論文的大型網(wǎng)絡(luò)數(shù)據(jù)庫;比肩中國知網(wǎng)的學(xué)術(shù)數(shù)據(jù)庫。最多支...開始檢測
摘 要:人工智能技術(shù)在測井解釋中的應(yīng)用由來已久,但單方法應(yīng)用研究多,系統(tǒng)集成應(yīng)用少。當今云計算、大數(shù)據(jù)和人工智能技術(shù)的規(guī)模應(yīng)用,再次推動了測井解釋智能化發(fā)展。以多學(xué)科數(shù)據(jù)融合的數(shù)據(jù)湖為基礎(chǔ),在專業(yè)軟件的基礎(chǔ)上進行智能解釋模塊開發(fā),將測井智能解釋引入到傳統(tǒng)的解釋流程中,輔助測井分析人員快速挖掘隱藏的高價值信息。利用大數(shù)據(jù)治理工具將數(shù)據(jù)湖連接到智能模型,實現(xiàn)大數(shù)據(jù)與智能算法融合。通過系統(tǒng)開發(fā)實現(xiàn)基于大數(shù)據(jù)的智能解釋模型和傳統(tǒng)專業(yè)軟件的集成,搭建基于地質(zhì)圖件導(dǎo)航的測井智能解釋環(huán)境,形成地質(zhì)、油藏背景下的智能化測井解釋工作模式,增強測井評價復(fù)雜儲層的能力,提高工作效率。
關(guān)鍵詞:大數(shù)據(jù);智能算法;測井解釋;智能解釋環(huán)境
0引言
人工智能技術(shù)作為第四次工業(yè)革命的重要推動力,是大數(shù)據(jù)、算法和算力的重要結(jié)合,給各行各業(yè)帶來了革命性的變革,也為測井技術(shù)的發(fā)展提供了強大的技術(shù)支持。測井技術(shù)的應(yīng)用深度與廣度主要取決于資料解釋的信息豐度,其中的重要環(huán)節(jié)依賴于解釋方法與軟件的開發(fā)[1-3]。目前,國內(nèi)外測井解釋軟件功能齊全、種類繁多,促進了解釋技術(shù)進步,提高了測井解釋水平,解決了一批測井解釋評價的難題。但是隨著勘探開發(fā)目標的日益復(fù)雜化和隱蔽化,現(xiàn)有的解釋方法和軟件難以準確描述儲層的復(fù)雜狀態(tài)[4]。測井對儲層的非線性響應(yīng),導(dǎo)致處理解釋質(zhì)量不高,要準確研究非均勻地層測井信息所蘊含的地質(zhì)信息,需要研發(fā)新的測井解釋方法[5]。人工智能作為一種改進計算機求解問題的方法[1],可以彌補傳統(tǒng)解釋方法的不足,使測井分析人員擺脫大量低知識層次的分析工作。將人工的知識和經(jīng)驗系統(tǒng)化、條理化形成“智能助手”,幫助測井分析人員解決更深層次的地質(zhì)問題。
為此,國內(nèi)外進行了大量的實踐。斯倫貝謝公司推出的DELFI勘探開發(fā)認知環(huán)境,將復(fù)雜的數(shù)值模擬、數(shù)據(jù)分析等變得智能和快捷。國內(nèi)也在積極探索適合中國特色的測井智能化解釋道路,這給傳統(tǒng)測井解釋技術(shù)發(fā)展帶來了新動能和良好的發(fā)展前景[6-8]。20世紀,中國測井科技工作者在人工智能單方法應(yīng)用和專家系統(tǒng)開發(fā)等方面都取得了重要的研究成果[9-22]。然而,這些成果并沒有及時地轉(zhuǎn)化為生產(chǎn)力。究其原因是缺乏兩個關(guān)鍵環(huán)節(jié),一是缺少足量的專業(yè)大數(shù)據(jù)作為智能計算的基礎(chǔ);二是缺少符合測井智能解釋業(yè)務(wù)的集成應(yīng)用環(huán)境。
前人取得的研究成果為測井智能解釋系統(tǒng)的開發(fā)和應(yīng)用奠定了基礎(chǔ)。按照測井解釋軟件走集成化道路[3]的思路,長慶油田通過系統(tǒng)開發(fā)和應(yīng)用環(huán)境搭建,實現(xiàn)了大數(shù)據(jù)、人工智能和測井解釋軟件的集成應(yīng)用。將“數(shù)據(jù)”“算法”“場景”3個關(guān)鍵要素有機結(jié)合,形成了基于大數(shù)據(jù)的測井智能解釋環(huán)境,提高了測井參數(shù)計算精度和流體識別準確率,提升了測井分析效率,促進了測井解釋由單井解釋向多井評價、油藏分析轉(zhuǎn)變。
1總體思路和系統(tǒng)架構(gòu)
1.1總體思路
測井解釋軟件是測井資料處理與解釋的重要工具和載體,是運用各種現(xiàn)代技術(shù)綜合解決地質(zhì)問題的重要手段,是測井解釋技術(shù)能力的綜合體現(xiàn),也是衡量測井技術(shù)水平的一個重要指標[8]。斯倫貝謝公司在Techlog解釋軟件中開發(fā)了主成分分析、回歸、聚類、決策樹、神經(jīng)網(wǎng)絡(luò)等智能功能模塊。這些模型的訓(xùn)練樣本主要是軟件的工區(qū)數(shù)據(jù),一方面數(shù)據(jù)量不足,另一方面針對算法的數(shù)據(jù)預(yù)處理較少,導(dǎo)致應(yīng)用受限。DELFI系統(tǒng)建立了跨專業(yè)協(xié)同工作環(huán)境,采用開放式的軟件開發(fā)模式,通過Studio集中管理Techlog與Petrel、ECLIPS等地質(zhì)、油藏軟件的數(shù)據(jù),實現(xiàn)了地質(zhì)、工程業(yè)務(wù)智能化與協(xié)同化。然而,涉及國家地質(zhì)數(shù)據(jù)的安全問題,中國不能像引進專業(yè)軟件一樣引進DELFI系統(tǒng),只能走自主研發(fā)的道路。
長慶油田經(jīng)過10余年的數(shù)字化油田建設(shè),建成了數(shù)字化油氣藏研究系統(tǒng)(RDMS)[6],盤活了15萬余口井的地質(zhì)、鉆井、測井、錄井、分析化驗、試油(氣)等多學(xué)科數(shù)據(jù)。RDMS實現(xiàn)了專業(yè)數(shù)據(jù)自由推送、實時關(guān)聯(lián)、在線可視等基礎(chǔ)功能;開發(fā)的基于地質(zhì)圖件的數(shù)據(jù)導(dǎo)航系統(tǒng)(CQGIS)實現(xiàn)了多學(xué)科數(shù)據(jù)自動收集、整理,以及軟件的無縫銜接[23-25],這些建設(shè)成果逐漸成為大數(shù)據(jù)技術(shù)應(yīng)用的基礎(chǔ)。針對測井軟件開發(fā)的數(shù)據(jù)接口打通了數(shù)據(jù)湖的通道,通過以專業(yè)軟件為基礎(chǔ)開發(fā)大數(shù)據(jù)治理工具,實現(xiàn)樣本數(shù)據(jù)快速提取[26-30]。在專業(yè)軟件中開發(fā)智能解釋模塊,將智能應(yīng)用引入到傳統(tǒng)測井解釋流程中,實現(xiàn)專業(yè)軟件、智能應(yīng)用和數(shù)據(jù)湖的耦合集成。在RDMS、CQGIS和解釋軟件之間,搭建起以地質(zhì)、油藏為約束的測井智能化解釋評價環(huán)境。
1.2系統(tǒng)架構(gòu)
系統(tǒng)自下而上由數(shù)據(jù)層、功能層和應(yīng)用層組成,從功能上分為樣本數(shù)據(jù)治理、數(shù)據(jù)綜合分析、模型訓(xùn)練與優(yōu)選、模型評估與管理,應(yīng)用上分為建模應(yīng)用和極簡應(yīng)用(如圖1)。在數(shù)據(jù)層開發(fā)數(shù)據(jù)解編模塊處理測井數(shù)據(jù)體,實現(xiàn)測井數(shù)據(jù)與試油、巖心分析、錄井等資料的數(shù)據(jù)模型和數(shù)據(jù)結(jié)構(gòu)統(tǒng)一。數(shù)據(jù)治理工具在深度域上進行數(shù)據(jù)治理,完成連續(xù)數(shù)據(jù)和離散數(shù)據(jù)的匹配。解釋人員通過專業(yè)軟件選擇儲層特征數(shù)據(jù),并依據(jù)試油結(jié)論給特征數(shù)據(jù)打上標簽,將這些數(shù)據(jù)按層位存入樣本數(shù)據(jù)庫。進入樣本庫的數(shù)據(jù)可直接用于模型訓(xùn)練與優(yōu)化,形成用于測井參數(shù)計算和流體識別的智能模型,通過模型優(yōu)選,組合成針對性推薦智能模型組,供用戶調(diào)用。
系統(tǒng)應(yīng)用分為極簡應(yīng)用和建模應(yīng)用兩種模式。極簡應(yīng)用模式面向普通用戶,普通用戶不用關(guān)心模型訓(xùn)練和參數(shù)優(yōu)化等工作,根據(jù)系統(tǒng)推薦的最優(yōu)模型組合,開展單井或多井的專業(yè)解釋工作,在智能系統(tǒng)的輔助下專注于參數(shù)計算、流體識別及產(chǎn)能預(yù)測工作。建模應(yīng)用模式面向?qū)<矣脩簦饕撠?zé)特征優(yōu)選、模型構(gòu)建、參數(shù)優(yōu)化、模型評估工作,是系統(tǒng)正常運行的基礎(chǔ)。
在此系統(tǒng)架構(gòu)下,智能系統(tǒng)運行的業(yè)務(wù)流程大致分為:①依托RDMS數(shù)據(jù)流進行樣本數(shù)據(jù)治理,建設(shè)機器學(xué)習(xí)樣本庫;②根據(jù)智能算法特點,通過數(shù)據(jù)綜合分析工具在樣本庫中進行特征優(yōu)選,并進行預(yù)處理,形成模型訓(xùn)練的特征矩陣;③通過超參數(shù)設(shè)置構(gòu)建模型,并進行模型迭代訓(xùn)練,優(yōu)化參數(shù),對模型進行評估;④組合單一功能的智能模型,形成智能模型組;⑤用戶通過極簡應(yīng)用模式調(diào)用智能模型組進行測井解釋評價。其中①~④在建模應(yīng)用模式下進行,⑤在極簡應(yīng)用模式下進行。
2測井大數(shù)據(jù)治理
在專業(yè)解釋軟件的基礎(chǔ)上開發(fā)大數(shù)據(jù)治理工具,實時繪制測井專業(yè)圖件,對多專業(yè)數(shù)據(jù)進行快速集成和直觀展示,對數(shù)據(jù)進行補全、融合、抽取等治理。讓專家用戶專注于儲層特征的分析、選取和打標簽工作。
通過開發(fā)數(shù)據(jù)接口,在數(shù)據(jù)湖中自動收集井基本信息(如坐標、鉆井液、鉆頭等信息)、地質(zhì)分層、試油、錄井、分析物性等數(shù)據(jù),并自動轉(zhuǎn)換為數(shù)據(jù)治理工具的數(shù)據(jù)格式,批量推送到治理工具;專業(yè)軟件調(diào)用測井繪圖模板直接成圖,并可以自由補充其他數(shù)據(jù),完成特征匹配和數(shù)據(jù)檢查后,選擇儲層特征值,打上相應(yīng)標簽(如油層、油水同層、差油層、含油水層、干層、泥巖、砂巖、煤、隔夾層等)。最后,一鍵式自動提取目標井基本信息、單點數(shù)據(jù)、特征值、試油數(shù)據(jù)、巖心分析數(shù)據(jù)等,并批量提交入庫。以上過程構(gòu)成了測井大數(shù)據(jù)治理流程(如圖2)。
選取樣本數(shù)據(jù)應(yīng)當遵循以下原則:①盡可能選擇具有單層試油數(shù)據(jù)的儲層提取樣本數(shù)據(jù);②以一個壓裂試油單元為最小單位選取特征值,一個單元可以包含若干特征值,每個特征值的標簽可以不同;③以儲量計算標準為依據(jù)確定標簽屬性,尤其要仔細鑒定油水同層和含油水層;④在一個試油單元中盡可能多地選取不同標簽的數(shù)據(jù),除了選取有效儲層外,還應(yīng)附帶上下蓋層及隔夾層的數(shù)據(jù);⑤樣本庫數(shù)據(jù)要盡量保證各標簽樣本數(shù)據(jù)相對平衡。
相關(guān)知識推薦:中石油職稱評定論文發(fā)表技巧
按照地質(zhì)分層,樣本庫進行分層管理數(shù)據(jù),利用“分區(qū)分層,分而治之”的數(shù)據(jù)治理策略,逐步建立盆地級的機器學(xué)習(xí)樣本庫。數(shù)據(jù)治理和樣本庫建設(shè)是一個長期的過程,貫穿于智能系統(tǒng)應(yīng)用的整個生命周期。后期或可采取以智能促智能的思路加快樣本數(shù)據(jù)庫建設(shè)。
3智能模型訓(xùn)練和管理
經(jīng)過長期的研究和實踐,前人[9-22]將有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、強化學(xué)習(xí)等算法紛紛引入到測井解釋中,形成了各具特色的應(yīng)用技術(shù)。由于樣本數(shù)據(jù)量較少,數(shù)據(jù)缺乏精細的預(yù)處理,導(dǎo)致模型泛化能力較低,距工業(yè)化應(yīng)用存在一定距離。本次系統(tǒng)開發(fā)將這些成果進行了優(yōu)化集成,開發(fā)了“模型參數(shù)自動尋優(yōu)”“模型組合優(yōu)化推薦”“專業(yè)圖件在線繪制”“應(yīng)用效果實時展示”等功能模塊,實現(xiàn)了智能算法集成應(yīng)用。
3.1智能模型訓(xùn)練
結(jié)合測井解釋業(yè)務(wù)特點,對支持向量機、K-近鄰、神經(jīng)網(wǎng)絡(luò)等算法進行優(yōu)化,使智能算法與傳統(tǒng)解釋理念融合。通過集成TensorFlow深度神經(jīng)網(wǎng)絡(luò)算法[31-32],保證系統(tǒng)功能可擴展。以上算法的核心原理及訓(xùn)練方法成熟可靠,在系統(tǒng)開發(fā)過程中主要在數(shù)據(jù)預(yù)處理和模型自動訓(xùn)練方面做了大量工作,下面以支持向量機識別復(fù)雜油水層為例進行簡要介紹。
3.1.1智能算法與測井解釋方法的結(jié)合
研究認為,支持向量機分類算法思想與測井常規(guī)油水識別圖版基本思想是一致的,目標是尋找不同類別數(shù)據(jù)的邊界。支持向量機學(xué)習(xí)不同類別數(shù)據(jù)之間的決定邊界,通常只有位于邊界的部分數(shù)據(jù)點起到重要作用,這些點被稱為“支持向量”(圖3a)[33]。在傳統(tǒng)的交會圖解釋方法中,利用聲波時差與電阻率交會圖(圖3b)確定油層類的電性下限值,然后把各下限值用直線連接起來作為油水界限(圖3b)。二者的基本思想都是通過統(tǒng)計分析,確定出一個合理的決策邊界[34],用于數(shù)據(jù)分類。
在復(fù)雜儲層的測井解釋中,常規(guī)油水識別圖版適應(yīng)性較差,在圖版上表現(xiàn)為油水界限不清晰,如圖3b藍圈數(shù)據(jù)點所示。油層類和水層類混雜在一起,常規(guī)解釋方法無法確定有效的油水界限,導(dǎo)致圖版解釋符合率較低,主要原因是常規(guī)二維交會圖僅使用了電阻率和聲波時差兩個測井信息,未使用其他測井資料信息。為了充分挖掘這些信息,測井分析家通過近似條件假設(shè)和嚴格的數(shù)學(xué)模型推導(dǎo)[1],構(gòu)建儲層敏感參數(shù),制作各種解釋圖。通過這種類似降維的方法,將更多的測井信息引入到二維圖中,但仍然沒有使用全部測井信息。
在二維圖中增加一個維度的測井信息,帶來的相關(guān)信息量成倍增加,通常表示為三維流體識別圖(圖4a),這種交會圖在實際使用時非常不方便。即使在單個二維交會圖中的油水界限都很不規(guī)則(圖4b中黑色曲線),如果再增加圖4c、圖4d所示的兩個交會圖的不規(guī)則油水邊界,油水決策邊界將變?yōu)槿S空間的一個超平面。這個超平面無法直觀展示,應(yīng)用難度大。支持向量機利用核函數(shù)可以將多維數(shù)據(jù)映射到非線性的高維空間,通過超參數(shù)控制決策超平面的復(fù)雜程度[33],可以準確逼近這個超平面。支持向量機利用靈活的決策邊界尋優(yōu)技術(shù),在非線性高維空間中開展測井解釋,這給正確識別非常規(guī)復(fù)雜儲層流體性質(zhì)提供了有效的解決方案。
3.1.2樣本數(shù)據(jù)預(yù)處理
目前,大多數(shù)機器學(xué)習(xí)模型都采用梯度下降算法進行模型訓(xùn)練,其中心思想是迭代調(diào)整參數(shù)使成本函數(shù)最小化[34],當成本函數(shù)達到全局最小,得到的參數(shù)組合就是最佳擬合參數(shù);否則,模型要么過擬合,要么欠擬合,泛化應(yīng)用效果均不會太好。大多數(shù)機器學(xué)習(xí)算法對數(shù)據(jù)尺度非常敏感,當輸入模型的多維數(shù)據(jù)尺度差異很大時,會使梯度下降算法尋找成本函數(shù)的全局最小值變得異常困難。
用支持向量機進行分類時,支持向量對決策邊界起到了決定性作用。如圖5a,因為密度與電阻率數(shù)據(jù)數(shù)值差異較大,支持向量之間的“距離”小,分類效果非常差;經(jīng)過預(yù)處理后二者尺度變得接近(圖5b),分類效果明顯改善。支持向量之間的“距離”被放大,決策邊界更容易求取[33]。
眾所周知,各測井曲線之間數(shù)據(jù)尺度差異大,數(shù)據(jù)分布形式也有較大不同。如圖6中聲波時差和自然伽馬曲線數(shù)據(jù)尺度和分布形態(tài)都比較相近,類似于正態(tài)分布特征;而電阻率和密度曲線不但數(shù)據(jù)尺度相差大,分布形態(tài)也不相同。數(shù)據(jù)的這些特征都會影響最優(yōu)決策邊界的計算。依據(jù)機器學(xué)習(xí)特征工程要求,結(jié)合測井數(shù)據(jù)特點,對電阻率曲線進行對數(shù)變換后,與其他曲線同時采用Z分數(shù)標準化方法[33][公式(1)]進行預(yù)處理,使數(shù)據(jù)尺度和分布形態(tài)一致(如圖7所示),這對于大多數(shù)機器學(xué)習(xí)算法是非常重要的。公式(1)中需要用到區(qū)域樣本數(shù)據(jù)的平均值和標準差。由統(tǒng)計學(xué)大數(shù)定律[35]可知,對于某條測井曲線,在同一地區(qū)或地層范圍內(nèi),當樣本數(shù)據(jù)足夠多時,數(shù)據(jù)的標準差和平均值趨于穩(wěn)定。因此,對于樣本數(shù)據(jù)的預(yù)處理可以直接使用大樣本數(shù)據(jù)的標準差和平均值,利用公式(1)直接計算,保證了數(shù)據(jù)預(yù)處理標準的一致性。——論文作者:石玉江1 劉國強2 鐘吉彬3 王 娟3 張文靜3
中國知網(wǎng)查重入口:http://jiarunkj.com/jiance/本站聲明:網(wǎng)站內(nèi)容來源于網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系我們,我們將及時刪除處理。