
方案概述
政府門戶網站是人們在生活和工作中獲取權威信息的渠道,是各級政府公開政務信息發布的重要陣地。隨著政府網站內容的不斷豐富,網頁數量呈幾何方式增長,如何從巨大的信息量中快速找到自己需要的信息,是政府門戶網站或網站群提升信息服務的一個迫切需要。同時作為一級政府,也需要整合下屬機構的網站信息,實現資源共享,為公眾提供全面、完整、及時的當地政府公開政務信息的“一站式檢索”服務。
天宇政府門戶網站群搜索引擎解決方案采用天宇公司具有自主知識產權的全文檢索技術和智能互聯網信息采集技術開發的網站搜索引擎系統產品,實現政府門戶網站所有欄目和下屬機構子網站的網站群搜索服務,達到對各級政府及其下屬機構所有公開政務信息“一站式”檢索的目的,大大提升政府信息服務水平。
方案特點
網站群搜索:對政府門戶網站主欄目和下屬機構子站點的所有欄目進行分類、分欄目的高級檢索和全文檢索,實現發布信息的快速、準確查詢。
全網站搜索:支持網站全部信息內容的檢索,包括網頁文件、圖片、附件中的WORD文檔、PDF文檔、EXECL表格、PPT演示文檔、音視頻資料等所有格式文件的檢索。
一站式檢索:整合采集政府下屬機構門戶網站信息資源,提供整個政府公開政務信息的“一站式”檢索服務,公眾通過政府主網站一個入口即可查詢到政府及下屬各單位各部門公開發布的政務信息,提高查詢和使用政務信息的效率,提升政府門戶網站信息服務水平。
零風險部署:天宇公司網站搜索引擎系統是一套先進、成熟的獨立產品,安裝部署不需要改動用戶原有應用系統,只需要將我公司提供的鏈接腳本嵌入到原有網站中就可實現檢索功能,這樣可以最大限度地保護用戶原有投資。
個性化設置:采集的鏡像文件保存在本地服務器的全文檢索數據庫中,保證了用戶數據安全,并可以靈活定制檢索的界面風格、分類及欄目,明顯優于第三方搜索引擎。
方案內容
天宇政府門戶網站群搜索引擎解決方案分為系統部署和工程部署兩部分內容。系統部署包括信息采集子系統、信息管理子系統、信息檢索子系統的部署;工程部署包括對政府門戶網站和下屬局委辦子網站發布的內容、信息資源的采集工程的設置。

1、系統部署
信息采集子系統
實現對政府門戶網站和下屬單位部門的子網站WEB頁面的批量采集,支持對各類網頁格式信息的采集和附件內容的采集,并通過內容過濾、自動去重、自動分類,加載到CGRS網頁檢索庫進行管理與提供網站全文檢索服務。主要包含以下幾個部分:
(1)、確定采集目標網站,建立采集工程配置;
(2)、對采集工程進行搜索策略的定義及過濾條件等內容的設定;
(3)、根據URL特征完成檢索地址設置,對網站頻道進行分類采集、過濾及內容自動去重;
(4)、將采集的內容自動加載到CGRS網頁檢索庫,交由CGRS全文數據庫管理系統進行統一管理。
(5)、采集的文件類型。系統支持對頁面內容(htm、html、xml、shtml、asp、php、jsp、notes等)、網頁附件(doc、xls、ppt、txt、pdf等)、圖片(jpg、gif、jpeg、bmp等)、音頻(MP3等)、視頻(AVI、RM、MPEG等)、JAVA(由JavaScript程序生成的頁面)等內容的采集。
信息管理子系統
通過WSE DBA對采集下來的各類WEB頁面、附件等非結構化信息資源通過CGRS全文數據庫進行統一管理。同時實現對采集過程及用戶權限進行全局管理。
后臺CGRS全文數據庫是對WEB頁面、文本、電子文檔、圖像、聲音、映像等頁面附件提供強大的數據庫管理和檢索功能的全文數據庫平臺,具有數據庫管理及維護功能,如搜索引擎數據庫定義、建立、備份、恢復、邏輯刪除、物理刪除、重組、增量備份、記錄查重等。
用戶與審計管理。包括用戶權限管理,用戶操作審計、分析與統計,日志分析與統計等功能。
信息檢索子系統
采用先進的基于字元索引技術,不需要安裝分詞詞庫,全面解決了分詞技術所造成的網頁漏查、錯查、索引更新等現象。支持任意字、詞、短語、句和片段的全文檢索,保證對采集的海量WEB頁面100%的查全率和較高的查準率。提供智能化的全文檢索和各類復合檢索手段。支持邏輯組合檢索、多字段復合精確檢索、歷史檢索、相關詞擴展檢索、分類導航檢索、中英文(字符)混合檢索、二次檢索、網頁附件內容的檢索等。檢索關鍵詞在標題和摘要中高亮顯示,檢索結果分別按照標題、摘要、內容進行類聚,并剔除重復性的內容。檢索結果可以按相關性和時間排序。
2、工程部署
系統部署完畢后,進入工程部署階段,對政府門戶網站和下屬單位部門的子網站發布的內容、信息資源的信息采集工程進行設置和調試。根據發文規律,提供定時采集設置,達到無人值守自動采集之目的,提高系統的時效性和高效性。同時系統具有良好的穩定性與安全性,可以實現7*24小時無間斷工作。
成功案例
“中國杭州”政府門戶網站搜索引擎項目是天宇政府門戶網站群搜索引擎的一個典型應用。該項目采用天宇公司網站搜索引擎系統產品,構建杭州市政府門戶網站“全網站”搜索引擎,整合采集杭州市下屬65個局、委、辦門戶網站信息資源,實現整個杭州市政務信息“網站群”的搜索,為各級黨政機關和社會公眾提供公開政務信息的“一站式”檢索服務。用戶只需要訪問杭州市政府門戶網站,通過站點檢索功能便可以查詢到所有杭州市政府及下屬各單位各部門的門戶網站上所發布的政務信息。該項目有助于提高公眾查詢與使用政務信息的效率,真正體現政府部門親民、利民、便民的服務宗旨。
文章作者:網盾
CIO頻道人物視窗
CIO頻道方案案例庫
大數據建設方案案例庫
電子政務建設方案案例庫
互聯集成系統構建方案案例庫
商務智能建設方案案例庫
系統集成類軟件信息研發企業名錄