網(wǎng)站建設定制采取適當?shù)木W(wǎng)頁歸檔技術
- 編輯:admin -推送模式由政府或者第三方機構主動將網(wǎng)站信息主動呈繳或捐贈到保存機構,這種主動的方式有助于深層網(wǎng)頁和數(shù)據(jù)庫資源等采集難度較大的資源也能夠安全、便捷地轉(zhuǎn)移到保存機構。
采取適當?shù)木W(wǎng)頁歸檔技術。目前主流的網(wǎng)頁歸檔技術包括推送和拉取兩種模式,兩種模式的采集主體不同,適用不同的網(wǎng)頁收集情況和要求。推送模式由政府或者第三方機構主動將網(wǎng)站信息主動呈繳或捐贈到保存機構,這種主動的方式有助于深層網(wǎng)頁和數(shù)據(jù)庫資源等采集難度較大的資源也能夠安全、便捷地轉(zhuǎn)移到保存機構。拉取模式則是由保存機構使用特定軟件工具,將網(wǎng)站信息資源采集、下載并保存在本地服務器中。
采集方法又可進一步劃分為四類:一是廣泛式采集,即采用收割軟件自動采集國家域名范圍內(nèi)或整個因特網(wǎng)的網(wǎng)頁及其他在線資源,能夠?qū)崿F(xiàn)大范圍、全面、快速采集,但采集質(zhì)量和時間難以把控;二是選擇性采集,即根據(jù)資源主題、內(nèi)容、價值等要素有選擇地采集部分網(wǎng)絡空間或特定資源,經(jīng)過選擇收集的資源內(nèi)容質(zhì)量相對較高,但目前以人工甄選為主,工作量較大且判斷會受個人主觀因素影響;三是專題性采集,一般針對具體的專題或事件進行采集;四是復合式采集,即綜合利用以上多種采集方法,實現(xiàn)優(yōu)勢互補,能夠在一定程度上同時滿足廣度與深度的要求。

因此,上述采集方式適用于不同的主體及其各異的資源收集需求,對資源廣度要求較高的采集活動可以選擇廣泛式采集;有特定工作開展或研究需求的主體通常需要在某一領域深度挖掘信息,因此可以在實施選擇性采集或?qū)n}采集;復合式采集則適用于掌握一定經(jīng)濟實力、技術基礎較好的大型組織機構,實施廣度采集的同時,選擇重點領域或重要事件進行深度采集,實現(xiàn)資源采集全面性與深入性相結合。
