
勝利油田科技檔案是在油田科研、生產過程中形成的,記載油田科學研究、技術推廣及其管理活動全過程,反映油田科技發展一般規律的檔案。是廣大科研人員參閱大量文獻,經反復實驗及調研后所撰寫的研究成果,是衡定油田理論水平、科研能力的重要標志,也是其為獲得相應職稱所必須完成的重要任務。一般來說,科技檔案的選題往往經過專家和研究人員反復思考、論證、斟酌而定,不少屬于較為前沿的問題或前人從未涉足到的領域,有些甚至還是國家、中石化或管理局的重點攻關課題或組成部分。科技檔案不僅具有較高學術價值和實用價值,而且數據、資料詳實,信息量大,是油田開展科學技術研究、各級領導進行科學決策的重要依據。在企業里,科技檔案應受到領導、科研人員以及廣大職工的普遍重視。
科技檔案是企業一項極具特色的收藏項目。從1981年以來,各企業都有意識地收藏本單位撰寫的論文和科技檔案,但并未形成嚴格、規范的制度?;旧峡蒲许椖窟M行驗收時,上交2份由檔案館和相關部門分別收藏的方式,早期僅限于紙本,并按年限、級別順序排列上架,供閱覽者翻閱。不僅難以保存,且查閱極不方便,更談不上全國石油石化行業間情報交流。
近年來,隨著企業的發展,科研人員和科研項目的增加,大批科技檔案入庫,查閱的人數迅速增加。以勝利油田為例,在1981——2004年的24年間,共收集了本企業科技檔案近2000冊,年均新增科技檔案200多冊??蒲辛α康?004年時,中國工程院院士一名,博士后科研工作站從0個增加到13個,科研人員達到12000多人,再加上在職研究生和碩士研究生1300人左右,據不完全統計,進庫查閱人數也由1998年前的l00多人次增加到2006年的1200多人次。查閱者普遍反映檢索困難、低效,浪費了大量的時間和精力,部分紙質文獻極易丟失、損毀,無法利用。由此可見,建立方便、快捷、高效的查詢科技檔案全文檢索系統刻不容緩。
現代信息處理技術為解決這一問題提供了便利。至于能否在局域網內運用成熟的技術,在少投入的基礎上率先建立自己的全文數據庫呢?這一想法是可行的。勝利油田科技處、檔案館、圖書館和有關單位可提供全部檔案數據(紙質、電子)資料,這是建立全文數據庫的一個寶貴資源和最重要的基礎。目前,在收藏印刷本科技檔案的同時也收藏電子版的軟盤或光盤,這為建設科技檔案全文數據庫提供了極大的便利。為此,在建設“數字油田”的大好形勢下,作為油田數字文化信息建設的重點,應全力建立勝利油田科技檔案全文數據庫。最大的優點是數據庫不但提供科技檔案的文摘,還提供全文信息、獲獎信息、科研人員信息、推廣情況等,這就給需要全面了解檔案內容的讀者帶來方便,無疑使科技檔案的運用上升了一個新臺階。
依據中華人民共和國國家標準GB/T 18894_2002《電子文件歸檔與管理規范》,科技檔案全文數據庫的建立包括資料的采集、資料的輸入與發布運行3大步驟。
2.1資料的收集
完整收集資料是建庫的前提。由于勝利油田是從近幾年才開始要求科研項目完成時在上繳印刷本科技檔案的同時必須上繳電子版的軟盤或光盤,之前只有印刷本論文收藏。據核實,1977—1989年紙本人藏率平均僅為97%,1990—2004年紙本收藏達到80%,但入藏的電子版并不如意,格式多樣,空缺、壞盤不少。對往年科技檔案的收集,首先,對原有電子版進行按單位、年限整理存檔;對那些保留有印刷本無電子版的科技檔案,按規定的標準盡快掃描,整理儲存。其次,對空缺或已遺失的印刷本,則通過主管部門、檔案館、科研單位資料室、報社、研究員本人等多渠道征集、復印裝訂成冊。根據收藏的要求,會同科技處,對當年及未來科技檔案收集,制定了詳盡、規范的上繳制度,明確規定在項目通過鑒定后,除必須向檔案館等有關部門提交2冊印刷本外,還必須上繳電子版全文一份。電子版全文必須嚴格按規定的程序輸入。
1) 必須是以word編輯保存的“.doc”文件。
2) 盡量合并為一個獨立的文檔,全文內容必須與印刷本內容完全一致,應包括封面、前言、目錄、中文文摘、英文文摘、正文、科研人員名單、評審人員名單、獲獎情況、推廣情況、參考文獻、附錄、附圖等。對于有公章等特別的張頁提供按規定掃描的圖像文件。對于有數學、化學公式的其它電子格式的資料,提供按規定轉化成的PDF格式文件。
3) 必須按以下程序輸入文件名:年度十單位十科研名稱.doc
為了保護作者的版權,維護作者的合法權益,授權于油田科技處同有關科研單位和人員進行協商,主要有:填寫授權書(即回執單,共兩聯,一聯自存,一聯留,表略),以便了解他們對資料完整性確認、資料保密說明、版權授權的具體要求和限制范圍,為后期全文發布和檢索做好前期工作。
2.2數據的整理與輸入
數據整理是數據輸入前的一項重要工作,具體包括:科研項目名稱、單位、年度、級別(國家級、部級、局級等)、獲獎情況、關鍵詞、館藏索取號、頁碼數、分類號、保密級別、查閱權限、全文、相關鏈接等等。
考慮到未來發展,全文數據庫將是一種必然的趨勢,因此,在建立全文數據庫時應始終堅持低成本、高效率的原則。直接運用勝利油田“科技管理信息系統”原有的數據不僅省去大量的建庫時間,而且有利于今后建立全文數據庫時與之對接。我們從中提取相關字段(庫結構所需字段):科研項目名稱、單位、年度、級別(國家級、部級、局級等)、獲獎情況、關鍵詞、頁碼數,批量導入全文數據庫內,從而實現建庫基本數據錄入的任務,可在此基礎上進行全文數據庫建設,避免了大量的重復勞動,又方便、快捷。
全文輸入是一個比較棘手的問題。為便于查閱者使用,需將全文輸入,以何種方式輸入直接影響查閱的速度,而查閱是否快捷、方便是數據庫的優勢,也是數據庫成敗的關鍵。如按常規采取將全文放在字段里的方法,不僅使查閱速度比較慢,而且不好瀏覽??梢园讶恼砗煤笠责^藏索取號為文件名放到服務器的文件夾里,增加其全文存放地址鏈接。
數據庫能否按管理者的意愿(根據授權者的授權)發揮保護版權的作用是一個難點問題??萍紮n案有些課題需要保密,有些屬專利性質。稍有疏忽即可能損害作者的權益。通過比較,用PDF格式發布全文是較好的方法。PDF文檔是Adobe公司公布的用于進行全球電子文檔分發的開放式標準,也是網上信息采用的主要格式,它具有以下優點:①掃描后直接轉換為PDF格式(詳見附件1),可忠實原文,保證原文的完整性,不用識別,效率高,瀏覽快捷、方便;其它文檔格式可方便地轉化為PDF格式。②支持各種不同級別的安全性。如可閱讀可打印,但不能修改;可閱讀不可打印;可瀏覽不可復制。這種安全性控制對保護電子出版物版權非常有效。
對于全文的掃描作如下規定:
(1)一律采用A4幅面,對于特殊的大圖表和大圖象采取分割組合的方式,分別建立縮略圖和原樣圖。
(2)全部采用300dpi的掃描分辯率,文本和圖表用黑白二值;黑白圖像用灰度16bit;彩色圖像采用256色。
2.3數據庫的發布
開發的科技檔案數據庫管理系統,應具有強大的信息發布功能,其特點是:完善的多功能檢索系統,檢索信息快、準而全,滿足讀者高查準率和高查全率的要求。以此為平臺,在界面上以簡捷方便、快捷自如、實用為主要特色。在檢索上,首先可以提供全方位的檢索,通過科研項目名稱、單位、年度、關鍵詞、館藏索取號、分類號、保密級別等7種檢索途徑,查閱者既可實現按某一個途徑進行單一檢索,也可通過邏輯關系進行多途徑組配檢索。其次,實現了除全文外的全字段(包括中英文摘)任意字、詞、句檢索,查全率高。最后,該系統要實現了二次檢索、智能檢索、模糊檢索的功能,以縮小檢索范圍,提高了查準率。為使不了解論文準確信息的查閱者可以方便地查閱到所需信息,并實現了通過目錄樹進行逐步查詢檢索的功能,從而滿足了不同層次和要求的用戶的需求,使系統更具有人性化、個性化。
經過檢索,查閱者可獲得所需的題錄信息(包括科研項目名稱、單位、年度、級別(國家級、部級、局級等)、獲獎情況、關鍵詞、館藏索取號、頁碼數、分類號、保密級別、查閱權限、全文、相關鏈接),如果查閱者需要進一步了解全文,只需在題錄信息下端點擊“顯示原文件”,即可瀏覽全文。為了保護著者的版權和數據庫的安全,采取用戶注冊、分級授權的管理方式,且全文僅提供在局網內瀏覽。
數據庫能否鏈接其他信息是衡量數據庫效能的一個重要指標。本數據庫應注意與相關資源的鏈接,使查閱者可以輕松地通過本庫直接點擊進入到檔案館、圖書館相應的管理系統、勝利油田科技管理信息系統;并實現庫與庫之間無縫鏈接和跨庫檢索,通過點擊題錄信息里的單位、有關人員字段,可進入勝利油田的單位、科研人員專家學者庫,瀏覽到有關單位的基本信息、產品簡介、技術實力等;科研人員的簡歷、學術論文、著作、科研成果等有關信息。
3.1領導重視是發展科技檔案數據庫的基本條件
企業要重檔案館、圖書館和情報部門的自動化、網絡化建設,把數據庫建設和文獻檢索系統建設放在圖情工作的重要位置。建庫實踐證明,只有領導重視和積極參與,才能保證把科技檔案數據庫建設搞好。
3.2采取分工合作的方式建庫
此項工作包括:紙本的收集整理、數據的輸人、全文的掃描轉換合并,數據的檢查、提交、修改、導入,這些工作可以由不同的人員分工協作,共同完成。這樣,既能提高效率又能確保質量。同時,要充分發揮文件形成機構、檔案管理部門、相關科研單位和軟件開發商的積極性,做到系統設計合理,適應科技檔案管理的長期發展需要。
3.3 需要考慮安全問題
科技檔案數據庫的建設是一項長期的持續性工作。其特點是連續性強、工作量大、技術含量高。由于加強了與其它單位、部門間的聯系,但也帶來信息利用的安全性問題,可通過對數據庫備份、密級設定、用戶利用權限控制、使用正版軟件、防毒殺毒、網絡防火墻等措施加強管理,同時要求參與此項工作的專業人員具有較高的業務素質及科學嚴謹的工作態度。
3.4 培養和造就一批高素質的工作人員
實現科技檔案網絡化管理,要適應信息社會的要求,迫切需要一批既有檔案管理方面知識與技能,又有計算機網絡方面的知識與技能;既精通網頁制作技術,又有一定的檔案編研功底和審美能力的復合型檔案人才。這就要求檔案工作者努力優化知識結構,加強自身學習,成為具有多種知識結構的人才。同時,要引進計算機及通訊、網絡技術專業人才,優化檔案隊伍的專業結構,為科技檔案科學化、數字化管理奠定堅實的基礎。
作者簡介:杜守先,現工作于勝利油田高級人才培訓中心,曾在勝利油田圖書館從事科技檔案管理工作,后來科技檔案移交管理局檔案管理中心。
CIO頻道人物視窗
CIO頻道方案案例庫
大數據建設方案案例庫
電子政務建設方案案例庫
互聯集成系統構建方案案例庫
商務智能建設方案案例庫
系統集成類軟件信息研發企業名錄