網(wǎng)頁(yè)檔案信息長(zhǎng)期保存的策略。從國(guó)內(nèi)外網(wǎng)頁(yè)檔案長(zhǎng)期保存的項(xiàng)目來看,其多為公益性項(xiàng)目,同時(shí)大部分的項(xiàng)目都是在政府部門的支持下由多個(gè)部門聯(lián)合參與或者舉辦的,如國(guó)家檔案館、高校、網(wǎng)絡(luò)中心或者信息中心、商業(yè)部門和公益性機(jī)構(gòu)。如澳大利亞的數(shù)字檔案PANDORA項(xiàng)目和我國(guó)的“中國(guó)Web信息博物館”項(xiàng)目,都是由圖書館、檔案館和高校聯(lián)合參與的。基于網(wǎng)頁(yè)采集的動(dòng)態(tài)變化性和多樣性等特點(diǎn),僅有檔案館或者圖書館單獨(dú)承擔(dān)這類大項(xiàng)目是不現(xiàn)實(shí)的,因此必須鼓勵(lì)多方力量共同參與到網(wǎng)頁(yè)長(zhǎng)期保存中。具體來說,就是要做好職能劃分和利益分配的工作。首先,參與單位可以在法律允許的范圍內(nèi)對(duì)網(wǎng)頁(yè)檔案信息資源進(jìn)行合理的利用,如圖書館和檔案館可以利用網(wǎng)頁(yè)資源進(jìn)行檔案服務(wù)的深度開發(fā)與加工。其次,網(wǎng)頁(yè)檔案采集工作對(duì)技術(shù)的依賴性較高,因此還要支持和鼓勵(lì)互聯(lián)網(wǎng)企業(yè)或者信息技術(shù)企業(yè)參與到項(xiàng)目中,為采集項(xiàng)目提供技術(shù)上的支持。最后,還要不斷豐富采集項(xiàng)目的資金來源,利用項(xiàng)目眾籌和社會(huì)募捐等非政府撥款方式募集資金,為采集項(xiàng)目提供更多的資金支持。
當(dāng)前網(wǎng)頁(yè)檔案信息的主要采集策略有兩種,分別是完全性采集策略和部分性采集策略。完全性收集策略是指對(duì)網(wǎng)頁(yè)的所有信息進(jìn)行收集。目前,瑞典、奧地利和美國(guó)的多個(gè)網(wǎng)頁(yè)檔案保存項(xiàng)目采用了完全性采集策略。完全性采集策略的優(yōu)勢(shì)在于不需要人工對(duì)網(wǎng)頁(yè)內(nèi)容進(jìn)行判斷和復(fù)制,而是完全由機(jī)器完成這一操作,因此其成本較低。對(duì)于小型的、資金較為缺乏的檔案管理部門,可適當(dāng)?shù)剡x擇完全性收集策略,但需要注意對(duì)信息進(jìn)行過濾。內(nèi)容結(jié)構(gòu)和類型較為單一的網(wǎng)站可通過設(shè)置關(guān)鍵詞對(duì)無用信息進(jìn)行過濾,同時(shí)建立定期的人工審核機(jī)制。
部分性采集策略是指有選擇地對(duì)網(wǎng)頁(yè)的某個(gè)類型或者學(xué)科的內(nèi)容進(jìn)行收集,因此其內(nèi)容的專業(yè)性較強(qiáng),主題也十分鮮明。與完全性采集策略不同的是,部分性采集以價(jià)值判斷為基礎(chǔ),通過制定完善的采集標(biāo)準(zhǔn)限定采集的內(nèi)容,因此標(biāo)準(zhǔn)是否合理就成為部分性采集是否成功的決定性因素。對(duì)此,檔案管理部門在選擇部分性采集策略時(shí),應(yīng)充分考慮到網(wǎng)頁(yè)檔案信息的動(dòng)態(tài)變化性,對(duì)網(wǎng)頁(yè)信息實(shí)行動(dòng)態(tài)監(jiān)控,并及時(shí)調(diào)整采集策略,不斷提高網(wǎng)頁(yè)采集的覆蓋率。