企業做網站網站歸檔技術和標準不完備

日期 : 2021-10-03 22:49:44
        網站歸檔技術和標準不完備。網頁信息采集主要針對靜態或動態網頁及其中文件,隨後提取網頁內的全部信息。靜態網頁與動態網頁的抓取難度也不相同,靜態網頁的抓取從技術上較易實現,隻需按時間頻率定期進行即可;而動態網頁的捕獲則無法單純依靠抓取軟件實現,且以目前的技術條件無法實現安全存儲。此外,隨著網頁技術不斷發展,網頁文件類型和格式不斷更新。

        除了傳統的HTML格式文件以外,Java文件、Ac-tive X文件、Jpg圖片文件等新型格式的網頁文件也層出不窮,但目前尚未有明確標準規範來指導這些文件歸檔。

相關文章