地質(zhì)檔案精細(xì)化管理服務(wù)信息化研究
時(shí)間:2022-04-26 04:06:40
導(dǎo)語(yǔ):地質(zhì)檔案精細(xì)化管理服務(wù)信息化研究一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
摘要:經(jīng)過(guò)多年的努力,內(nèi)蒙古地質(zhì)檔案管理服務(wù)信息化建設(shè)取得了重要成果,在大數(shù)據(jù)時(shí)代下,內(nèi)蒙古自治區(qū)結(jié)合自身實(shí)際,開(kāi)展地質(zhì)檔案精細(xì)化管理服務(wù)信息化建設(shè),打破傳統(tǒng)管理模式,地質(zhì)檔案按照文件級(jí)進(jìn)行信息化管理服務(wù),滿足新一代信息技術(shù)條件下地質(zhì)檔案管理服務(wù)要求。
關(guān)鍵詞:地質(zhì)資料;精細(xì)化;文件級(jí)管理;元數(shù)據(jù)自動(dòng)提取
1.引言
近年來(lái),物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)、人工智能等新一代信息技術(shù)深刻地影響著科技和產(chǎn)業(yè)界,也對(duì)我們?nèi)粘Ia(chǎn)生活產(chǎn)生了重大的轉(zhuǎn)變。物聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)是新一代信息的基礎(chǔ);云計(jì)算為大數(shù)據(jù)存儲(chǔ)、處理提供依托;大數(shù)據(jù)是人工智能的基礎(chǔ),為人工智能決策提供數(shù)據(jù)支持。大數(shù)據(jù)在新一代信息技術(shù)中顯得尤為重要。美國(guó)將大數(shù)據(jù)看作是“未來(lái)的石油”,政府投資巨資啟動(dòng)大數(shù)據(jù)研究和發(fā)展計(jì)劃,并將這一計(jì)劃上升到了國(guó)家高度[1];歐盟非常重視數(shù)據(jù)開(kāi)放,由于數(shù)據(jù)資源全面開(kāi)放,每年會(huì)給歐盟帶來(lái)400億歐元經(jīng)濟(jì)增長(zhǎng),歐盟認(rèn)為大數(shù)據(jù)是促進(jìn)經(jīng)濟(jì)增長(zhǎng)的重要?jiǎng)恿2]。內(nèi)蒙古自治區(qū)把大數(shù)據(jù)、云計(jì)算產(chǎn)業(yè)作為培育戰(zhàn)略性新興產(chǎn)業(yè)的主攻方向、作為經(jīng)濟(jì)社會(huì)發(fā)展的新引擎,制定出臺(tái)《內(nèi)蒙古國(guó)家大數(shù)據(jù)綜合試驗(yàn)區(qū)建設(shè)實(shí)施方案》和《內(nèi)蒙古自治區(qū)促進(jìn)大數(shù)據(jù)發(fā)展應(yīng)用的若干政策》,決心把內(nèi)蒙古建設(shè)成為“中國(guó)北方大數(shù)據(jù)中心、絲綢之路數(shù)據(jù)港、數(shù)據(jù)政府先試區(qū)、產(chǎn)業(yè)融合發(fā)展引導(dǎo)區(qū)、世界級(jí)大數(shù)據(jù)產(chǎn)業(yè)基地”[3]。地質(zhì)工作是內(nèi)蒙古經(jīng)濟(jì)社會(huì)的先行性、基礎(chǔ)性工作,涉及各行各業(yè),關(guān)系到國(guó)計(jì)民生。地質(zhì)檔案資料是地質(zhì)工作最直接的成果,由此形成地質(zhì)資料信息產(chǎn)品有各種文本、圖表、聲像、實(shí)物、數(shù)字代碼等形式資料和數(shù)據(jù),這些資料和數(shù)據(jù)是內(nèi)蒙古大數(shù)據(jù)重要組成部分。傳統(tǒng)方式采用中國(guó)科技檔案通用的案卷級(jí)方式保存地質(zhì)資料,這種保存方式中的案卷級(jí)目錄無(wú)法詳細(xì)地顯示每件資料包含具體信息,使得精準(zhǔn)信息難以獲取。為了適應(yīng)大數(shù)據(jù)時(shí)代下地質(zhì)檔案信息管理服務(wù)要求[4-7],提升地質(zhì)檔案精細(xì)化管理服務(wù),內(nèi)蒙古自治區(qū)國(guó)土資源信息院在財(cái)政經(jīng)費(fèi)的支持下,進(jìn)行了地質(zhì)檔案管理服務(wù)精細(xì)化建設(shè),其主要目標(biāo)為:按照大數(shù)據(jù)技術(shù)規(guī)范,匯聚地質(zhì)檔案數(shù)據(jù),初步建成內(nèi)蒙古自治區(qū)地質(zhì)檔案數(shù)據(jù)中心,在完善“地質(zhì)檔案管理與服務(wù)系統(tǒng)”的基礎(chǔ)上,按照精細(xì)化管理服務(wù)要求,開(kāi)發(fā)文件級(jí)地質(zhì)檔案管理與服務(wù)系統(tǒng),實(shí)現(xiàn)地質(zhì)檔案信息按照細(xì)粒度(文件級(jí))進(jìn)行存儲(chǔ)、管理、服務(wù),即實(shí)現(xiàn)地質(zhì)檔案按照文件級(jí)目錄、單個(gè)電子文件、段落進(jìn)行管理服務(wù);實(shí)現(xiàn)關(guān)聯(lián)地質(zhì)檔案智能匯聚、提取、挖掘等應(yīng)用。
2.系統(tǒng)設(shè)計(jì)
2.1內(nèi)蒙古地質(zhì)檔案管理服務(wù)信息化現(xiàn)狀分析。經(jīng)過(guò)多年的努力,內(nèi)蒙古地質(zhì)檔案管理服務(wù)信息化建設(shè)取得了重要成果,為自治區(qū)社會(huì)、經(jīng)濟(jì)發(fā)展提供了大量基礎(chǔ)性信息產(chǎn)品。利用電子閱覽室,實(shí)現(xiàn)了地質(zhì)檔案到館“一站式”服務(wù);利用地質(zhì)檔案信息共享服務(wù)平臺(tái),實(shí)現(xiàn)了互聯(lián)網(wǎng)在線服務(wù);利用微信公眾號(hào)等新媒體工具,拓寬服務(wù)渠道;利用自身地質(zhì)檔案信息庫(kù)優(yōu)勢(shì),積極開(kāi)展各項(xiàng)專題服務(wù)。面向政府部門、基層地勘單位、礦業(yè)權(quán)人以及生產(chǎn)和科研機(jī)構(gòu)等部門,積極提供地質(zhì)檔案多元化服務(wù),同時(shí)為國(guó)家生態(tài)文明建設(shè)和自治區(qū)重大項(xiàng)目提供綠色通道服務(wù),地質(zhì)檔案管理和服務(wù)能力逐年提高[8-14]。2.2系統(tǒng)建設(shè)總體規(guī)劃。系統(tǒng)建設(shè)按照先進(jìn)性原則、實(shí)用性原則、標(biāo)準(zhǔn)化原則、安全可靠性原則、可擴(kuò)展性原則進(jìn)行系統(tǒng)設(shè)計(jì)。系統(tǒng)建設(shè)采用大數(shù)據(jù)技術(shù)平臺(tái)、網(wǎng)絡(luò)通信技術(shù)、數(shù)據(jù)訪問(wèn)技術(shù)、微服務(wù)軟件開(kāi)發(fā)技術(shù);按照國(guó)家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)以及地方性實(shí)施細(xì)則和規(guī)范進(jìn)行,系統(tǒng)設(shè)計(jì)遵循統(tǒng)一的信息編碼、規(guī)范;系統(tǒng)設(shè)計(jì)時(shí)充分考慮了與已有地質(zhì)檔案管理與服務(wù)系統(tǒng)整合,并為今后的功能擴(kuò)充預(yù)留必要的軟件接口,系統(tǒng)框架見(jiàn)圖1。基礎(chǔ)設(shè)施層主要包括網(wǎng)絡(luò)設(shè)施、網(wǎng)絡(luò)存儲(chǔ)、服務(wù)器等硬件設(shè)備,同時(shí)還包括支撐這些硬件設(shè)備運(yùn)行的操作系統(tǒng)、應(yīng)用軟件等軟設(shè)施;數(shù)據(jù)源層主要為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),結(jié)構(gòu)化數(shù)據(jù)包括地質(zhì)檔案案卷級(jí)目錄庫(kù)(成果資料目錄數(shù)據(jù)庫(kù)、原始資料目錄庫(kù)、實(shí)物資料目錄庫(kù)、涉密信息庫(kù)等)和文件級(jí)元數(shù)據(jù);非結(jié)構(gòu)化數(shù)據(jù)有地質(zhì)報(bào)告和圖件等,通過(guò)數(shù)據(jù)采集、整理、清洗、轉(zhuǎn)換、裝載等過(guò)程,將多元、異構(gòu)、分布的數(shù)據(jù)最終形成一個(gè)一體化大數(shù)據(jù);計(jì)算層主要是大數(shù)據(jù)技術(shù)平臺(tái),主要包括分布式文件系統(tǒng)、數(shù)據(jù)庫(kù)、數(shù)據(jù)庫(kù)倉(cāng)庫(kù)、計(jì)算框架、流計(jì)算框架、數(shù)據(jù)挖掘等;業(yè)務(wù)組件和數(shù)據(jù)訪問(wèn)層采用微服務(wù)技術(shù)為應(yīng)用平臺(tái)提供數(shù)據(jù)安全傳輸、緩存訪問(wèn)、檢索、用戶管理、日志管理、可視化等。應(yīng)用平臺(tái)是此次建設(shè)重點(diǎn),在原有地質(zhì)檔案管理與服務(wù)系統(tǒng)的基礎(chǔ)上,實(shí)現(xiàn)地質(zhì)檔案精細(xì)化管理服務(wù)升級(jí),增加文件級(jí)管理服務(wù)信息化建設(shè),完善電子閱覽室系統(tǒng)和共享服務(wù)系統(tǒng)。在已有的基礎(chǔ)上,按照“總體規(guī)劃,分步實(shí)施”的原則進(jìn)行信息化建設(shè),具體為:適應(yīng)地質(zhì)大數(shù)據(jù)技術(shù)發(fā)展要求,研究建立精細(xì)化地質(zhì)檔案管理元數(shù)據(jù)模型;按照該模型規(guī)范和要求,完成全館八十多萬(wàn)件地質(zhì)檔案文件級(jí)元數(shù)據(jù)著錄;開(kāi)發(fā)文件級(jí)管理與服務(wù)系統(tǒng);升級(jí)數(shù)據(jù)庫(kù),完善地質(zhì)檔案管理與服務(wù)系統(tǒng);實(shí)現(xiàn)地質(zhì)檔案向智能化服務(wù)轉(zhuǎn)變,在地質(zhì)檔案精細(xì)化管理服務(wù)基礎(chǔ)上,融入人工智能,實(shí)現(xiàn)地質(zhì)檔案正文報(bào)告按章節(jié)進(jìn)行搜索,并且能夠按用戶需要內(nèi)容進(jìn)行重新組合,實(shí)現(xiàn)地質(zhì)檔案知識(shí)服務(wù)。2.3系統(tǒng)建設(shè)關(guān)鍵技術(shù)。大數(shù)據(jù)環(huán)境下,除了需要解決大數(shù)據(jù)應(yīng)用中的關(guān)鍵技術(shù)外,更需要解決地質(zhì)檔案精細(xì)化管理服務(wù)中的關(guān)鍵技術(shù)。由于不同時(shí)期地質(zhì)檔案數(shù)據(jù)的管理軟件和保管格式也隨著采用軟件不同而格式不一致。綜合利用圖文數(shù)字化目錄文件、電子文件登記表、地質(zhì)檔案歸檔匯交信息系統(tǒng)(ED-Maker)軟件中XML格式文件、案卷級(jí)目錄數(shù)據(jù)庫(kù)FoxPro等信息,實(shí)現(xiàn)地質(zhì)檔案文件元數(shù)據(jù)自動(dòng)提取,自動(dòng)提取的數(shù)據(jù)為:檔號(hào)、題名、編著者、文件名稱、中文名稱、文件后綴、文件類型、文件路徑、文件大小、比例尺、密級(jí)、密級(jí)來(lái)源、館藏機(jī)構(gòu)、資料分類、數(shù)字資源類型、語(yǔ)種、起始經(jīng)度、起始緯度、終止經(jīng)度、終止緯度等。自動(dòng)提取的這些信息與文件級(jí)的文字報(bào)告和圖件進(jìn)行關(guān)聯(lián)?;ヂ?lián)網(wǎng)環(huán)境下,需要解決地質(zhì)檔案正文報(bào)告和圖件傳輸慢的問(wèn)題。正文報(bào)告?zhèn)鬏斨胁捎谩肮羌芊ā?,先傳輸?shù)刭|(zhì)檔案文件級(jí)元數(shù)據(jù)、章節(jié)目錄等信息,然后按需傳輸對(duì)應(yīng)章節(jié)數(shù)據(jù),這樣能夠大大提高傳輸效率,減少等待時(shí)間,通過(guò)這種技術(shù),可以把正文報(bào)告、附圖、附表、附件等信息組織在一起,形成整冊(cè)閱讀;圖件傳輸中采用“瓦片法”,把圖件按照“金字塔”規(guī)則切成“瓦片”,在瀏覽器端按需進(jìn)行調(diào)度,通過(guò)這種方法,圖形操作平滑,用戶體驗(yàn)較好。大數(shù)據(jù)環(huán)境下,資料檢索采用基于地質(zhì)領(lǐng)域本體,構(gòu)建基于知識(shí)的檢索技術(shù)[15]。其組成包括中英文分詞、推理引擎、組成新的查詢條件、返回結(jié)果等部分。推理引擎結(jié)合領(lǐng)域本體,根據(jù)本體上位詞、下位詞、相關(guān)詞、實(shí)例詞等進(jìn)行語(yǔ)義推理,推理后形成新的查詢條件,然后從結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)中進(jìn)行檢索,并返回結(jié)果。
3.系統(tǒng)應(yīng)用
系統(tǒng)建設(shè)在已有基礎(chǔ)上,采用大數(shù)據(jù)技術(shù)、計(jì)算機(jī)網(wǎng)絡(luò)等技術(shù),采用面向?qū)ο蠹夹g(shù)開(kāi)發(fā),采用的技術(shù)先進(jìn),架構(gòu)合理,開(kāi)發(fā)的功能先進(jìn)、實(shí)用。目前已經(jīng)完成了文件級(jí)管理與服務(wù)開(kāi)發(fā),系統(tǒng)開(kāi)發(fā)完成后在內(nèi)蒙古自治區(qū)國(guó)土資源廳信息院進(jìn)行上線運(yùn)行,通過(guò)一段時(shí)間的試運(yùn)行后,正式投入使用,如圖2。圖2地質(zhì)檔案文件級(jí)管理與服務(wù)Figure2FileManagementofGeologicalData系統(tǒng)兼容中國(guó)地質(zhì)調(diào)查局地質(zhì)檔案管理服務(wù)要求的各種數(shù)據(jù)格式,能夠從不同格式地質(zhì)檔案數(shù)據(jù)中提取文件級(jí)信息,進(jìn)行精細(xì)化管理服務(wù);按照“應(yīng)提盡提”的原則,自動(dòng)化方式提取文件級(jí)信息;用戶按照導(dǎo)入、自動(dòng)提取、人工核實(shí)流程進(jìn)行地質(zhì)檔案文件級(jí)元數(shù)據(jù)采集,能盡量減少人工工作量,提高工作效率。利用該系統(tǒng),完成全館文字類和圖件類資料文件級(jí)元數(shù)據(jù)入庫(kù),其中自動(dòng)提取元數(shù)據(jù)731660件,人工核對(duì)681719件。完成附圖595828件,正文17409件,附件17409,附表29600件。
4.結(jié)論與建議
通過(guò)信息系統(tǒng)建設(shè)工作,首先查清了館藏地質(zhì)檔案電子文件情況,并對(duì)館藏電子文件進(jìn)行了文件級(jí)元數(shù)據(jù)采集入庫(kù),為進(jìn)行精細(xì)化管理服務(wù)提供了物質(zhì)條件;開(kāi)發(fā)完成的文件級(jí)地質(zhì)檔案管理與服務(wù)系統(tǒng)具備按照條件查詢、圖形查詢功能,查詢結(jié)果能夠?qū)崿F(xiàn)單個(gè)文件和案卷關(guān)聯(lián),提高管理服務(wù)能力。建議進(jìn)一步完善日常運(yùn)行的地質(zhì)檔案管理與服務(wù)系統(tǒng),使得地質(zhì)檔案從接收驗(yàn)收、管理、借閱服務(wù)全流程信息化更加優(yōu)化,提升地質(zhì)檔案管理精細(xì)化水平,提高地質(zhì)檔案服務(wù)精準(zhǔn)水準(zhǔn),建議如下:(1)進(jìn)一步把地質(zhì)檔案數(shù)據(jù)庫(kù)更新維護(hù)日?;诘刭|(zhì)檔案格式規(guī)范、涉密信息處理、接收驗(yàn)收方面安排專人專崗進(jìn)行日?;幚?,在信息系統(tǒng)的支持下,進(jìn)行細(xì)粒度信息采集入庫(kù),提升精細(xì)化管理水平和服務(wù)效率。(2)完善地質(zhì)檔案管理與服務(wù)系統(tǒng),把文件級(jí)管理、借閱服務(wù)加入到地質(zhì)檔案管理服務(wù)系統(tǒng)中來(lái),實(shí)現(xiàn)地質(zhì)檔案文件級(jí)查詢、借閱、互聯(lián)網(wǎng)在線服務(wù);進(jìn)一步提高地質(zhì)檔案知識(shí)服務(wù)能力。
作者:汪艷梅 單位:內(nèi)蒙古國(guó)土資源信息院