
方案概述
政府門戶網站是人們在生活和工作中獲取權威信息的渠道,是各級政府公開政務信息發布的重要陣地。隨著政府網站內容的不斷豐富,網頁數量呈幾何方式增長,如何從巨大的信息量中快速找到自己需要的信息,是政府門戶網站或網站群提升信息服務的一個迫切需要。同時作為一級政府,也需要整合下屬機構的網站信息,實現資源共享,為公眾提供全面、完整、及時的當地政府公開政務信息的“一站式檢索”服務。
天宇政府門戶網站群搜索引擎解決方案采用天宇公司具有自主知識產權的全文檢索技術和智能互聯網信息采集技術開發的網站搜索引擎系統產品,實現政府門戶網站所有欄目和下屬機構子網站的網站群搜索服務,達到對各級政府及其下屬機構所有公開政務信息“一站式”檢索的目的,大大提升政府信息服務水平。
方案特點
網站群搜索:對政府門戶網站主欄目和下屬機構子站點的所有欄目進行分類、分欄目的高級檢索和全文檢索,實現發布信息的快速、準確查詢。
全網站搜索:支持網站全部信息內容的檢索,包括網頁文件、圖片、附件中的WORD文檔、PDF文檔、EXECL表格、PPT演示文檔、音視頻資料等所有格式文件的檢索。
一站式檢索:整合采集政府下屬機構門戶網站信息資源,提供整個政府公開政務信息的“一站式”檢索服務,公眾通過政府主網站一個入口即可查詢到政府及下屬各單位各部門公開發布的政務信息,提高查詢和使用政務信息的效率,提升政府門戶網站信息服務水平。
零風險部署:天宇公司網站搜索引擎系統是一套先進、成熟的獨立產品,安裝部署不需要改動用戶原有應用系統,只需要將我公司提供的鏈接腳本嵌入到原有網站中就可實現檢索功能,這樣可以最大限度地保護用戶原有投資。
個性化設置:采集的鏡像文件保存在本地服務器的全文檢索數據庫中,保證了用戶數據安全,并可以靈活定制檢索的界面風格、分類及欄目,明顯優于第三方搜索引擎。
方案內容
天宇政府門戶網站群搜索引擎解決方案分為系統部署和工程部署兩部分內容。系統部署包括信息采集子系統、信息管理子系統、信息檢索子系統的部署;工程部署包括對政府門戶網站和下屬局委辦子網站發布的內容、信息資源的采集工程的設置。

1、系統部署
信息采集子系統
實現對政府門戶網站和下屬單位部門的子網站WEB頁面的批量采集,支持對各類網頁格式信息的采集和附件內容的采集,并通過內容過濾、自動去重、自動分類,加載到CGRS網頁檢索庫進行管理與提供網站全文檢索服務。主要包含以下幾個部分:
(1)、確定采集目標網站,建立采集工程配置;
(2)、對采集工程進行搜索策略的定義及過濾條件等內容的設定;
(3)、根據URL特征完成檢索地址設置,對網站頻道進行分類采集、過濾及內容自動去重;
(4)、將采集的內容自動加載到CGRS網頁檢索庫,交由CGRS全文數據庫管理系統進行統一管理。
(5)、采集的文件類型。系統支持對頁面內容(htm、html、xml、shtml、asp、php、jsp、notes等)、網頁附件(doc、xls、ppt、txt、pdf等)、圖片(jpg、gif、jpeg、bmp等)、音頻(MP3等)、視頻(AVI、RM、MPEG等)、JAVA(由JavaScript程序生成的頁面)等內容的采集。
文章作者:網盾
CIO頻道人物視窗
CIO頻道方案案例庫
大數據建設方案案例庫
電子政務建設方案案例庫
互聯集成系統構建方案案例庫
商務智能建設方案案例庫
系統集成類軟件信息研發企業名錄