目錄/提綱:……
一、調(diào)查對象
二、調(diào)查內(nèi)容
三、調(diào)查時間
四、有關概念
五、調(diào)查方法
六、調(diào)查問卷
七、組織單位
一、域名數(shù)
二、網(wǎng)站數(shù)
一、網(wǎng)站按性質(zhì)分類
二、網(wǎng)站的基本情況
三、各類型網(wǎng)站信息服務內(nèi)容及信息更新情況
一、全國網(wǎng)站的網(wǎng)頁情況
二、國內(nèi)前家大型網(wǎng)站的網(wǎng)頁情況
三、全國網(wǎng)站的網(wǎng)頁與國內(nèi)前家大型網(wǎng)站的網(wǎng)頁情況比較
一、在線數(shù)據(jù)庫數(shù)量及各類網(wǎng)站擁有在線數(shù)據(jù)庫情況
二、在線數(shù)據(jù)庫按內(nèi)容和記錄數(shù)分類情況
一、域名統(tǒng)計
二、網(wǎng)站統(tǒng)計
三、網(wǎng)頁統(tǒng)計
四、在線數(shù)據(jù)庫統(tǒng)計
一、調(diào)查對象
二、調(diào)查內(nèi)容
三、調(diào)查時間
四、有關概念
五、調(diào)查方法
(一)數(shù)據(jù)獲取方式和渠道
(二)調(diào)查問卷的抽樣方法
六、調(diào)查問卷
七、組織單位
一、域名數(shù)
二、網(wǎng)站數(shù)
一、網(wǎng)站按性質(zhì)分類
二、網(wǎng)站的基本情況
三、各類型網(wǎng)站信息服務內(nèi)容及信息更新情況
一、全國網(wǎng)站的網(wǎng)頁情況
二、國內(nèi)前家大型網(wǎng)站的網(wǎng)頁情況
三、全國網(wǎng)站的網(wǎng)頁與國內(nèi)前家大型網(wǎng)站的網(wǎng)頁情況比較
一、在線數(shù)據(jù)庫數(shù)量及各類網(wǎng)站擁有在線數(shù)據(jù)庫情況
二、在線數(shù)據(jù)庫按內(nèi)容和記錄數(shù)分類情況
一、域名統(tǒng)計
二、網(wǎng)站統(tǒng)計
三、網(wǎng)頁統(tǒng)計
四、在線數(shù)據(jù)庫統(tǒng)計
……
信息資源數(shù)量調(diào)查報告
主持單位:國務院信息辦推廣應用組
承辦單位:中國互聯(lián)網(wǎng)絡信息中心
完成時間:**年月
(本文圖均略)
目錄
第一部分調(diào)查背景
第二部分調(diào)查說明
一、調(diào)查對象
二、調(diào)查內(nèi)容
三、調(diào)查時間
四、有關概念
五、調(diào)查方法
六、調(diào)查問卷
七、組織單位
第三部分調(diào)查結(jié)果
第一章域名、網(wǎng)站數(shù)及地區(qū)分布
一、域名數(shù)
二、網(wǎng)站數(shù)
第二章網(wǎng)站性質(zhì)及服務內(nèi)容
一、網(wǎng)站按性質(zhì)分類
二、網(wǎng)站的基本情況
三、各類型網(wǎng)站信息服務內(nèi)容及信息更新情況
第三章網(wǎng)頁數(shù)量及性質(zhì)特征
一、全國網(wǎng)站的網(wǎng)頁情況
二、國內(nèi)前家大型網(wǎng)站的網(wǎng)頁情況
三、全國網(wǎng)站的網(wǎng)頁與國內(nèi)前家大型網(wǎng)站的網(wǎng)頁情況比較
第四章在線數(shù)據(jù)庫數(shù)量及性質(zhì)
一、在線數(shù)據(jù)庫數(shù)量及各類網(wǎng)站擁有在線數(shù)據(jù)庫情況
二、在線數(shù)據(jù)庫按內(nèi)容和記錄數(shù)分類情況
第五章
總結(jié) 一、域名統(tǒng)計
二、網(wǎng)站統(tǒng)計
三、網(wǎng)頁統(tǒng)計
四、在線數(shù)據(jù)庫統(tǒng)計
圖目錄
圖地區(qū)域名數(shù)量分布
圖站點性質(zhì)分類
圖地區(qū)網(wǎng)站數(shù)量分布
圖不同性質(zhì)類型網(wǎng)站分布圖餅狀圖
圖不同性質(zhì)類型網(wǎng)站分布圖柱狀圖()
圖平均每個網(wǎng)站每天的頁面訪問數(shù)
圖網(wǎng)站每天的頁面訪問數(shù)按類型分布
圖企業(yè)網(wǎng)站每天的頁面訪問數(shù)按行業(yè)分布()
圖制造業(yè)企業(yè)網(wǎng)站每天的頁面訪問數(shù)()
圖業(yè)企業(yè)網(wǎng)站每天的頁面訪問數(shù)()
圖各類網(wǎng)站的網(wǎng)站鏈接情況
圖各網(wǎng)站鏈接數(shù)的網(wǎng)站比例
圖各類網(wǎng)站的信息主要來源情況
圖各類網(wǎng)站提供的語種文字閱讀情況
圖各類網(wǎng)站提供全站信息搜索的情況
圖各類網(wǎng)站的網(wǎng)頁上提供網(wǎng)站地圖的情況
圖各類網(wǎng)站的網(wǎng)頁上提供聯(lián)系方式的情況
圖各類網(wǎng)站服務器擁有情況
圖擁有服務器的網(wǎng)站比例
圖各類網(wǎng)站擁有服務器情況
圖擁有服務器的各類網(wǎng)站所采用的操作系統(tǒng)情況
圖負責網(wǎng)站運營的全職員工人數(shù)情況
圖各類網(wǎng)站負責運營的平均全職員工人數(shù)
圖各類網(wǎng)站負責運營的全職員工人數(shù)擁有情況
圖網(wǎng)站的成立時間餅圖
圖提供各類信息服務的政府網(wǎng)站的比例
圖政府網(wǎng)站交互性服務
圖政府新聞更新周期
圖政府職能業(yè)務介紹更
……(新文秘網(wǎng)http://120pk.cn省略1642字,正式會員可完整閱讀)……
表在線數(shù)據(jù)庫的載體情況
表各類網(wǎng)站在線數(shù)據(jù)庫具體載體形式
表在線數(shù)據(jù)庫收費情況
表在線數(shù)據(jù)庫面向?qū)ο笄闆r
第一部分調(diào)查背景
信息資源是國家的戰(zhàn)略資源,它在國民經(jīng)濟信息化中位于核心的地位。正確開發(fā)、利用信息資源對促進我國信息化的快速發(fā)展,導正我國信息化的發(fā)展方向,拉動國民經(jīng)濟和社會發(fā)展,提高全民族的文化素質(zhì)和創(chuàng)新能力,促進社會進步和繁榮,實施西部大開發(fā)戰(zhàn)略等方面有著十分重要的意義。
互聯(lián)網(wǎng)絡信息資源是信息資源的重要組成部分,自從世紀年代中期開始,互聯(lián)網(wǎng)在我國迅猛發(fā)展,網(wǎng)上中文信息資源快速增長,到**年月日,全國在線數(shù)據(jù)庫達到個,共萬個網(wǎng)頁,數(shù)據(jù)量。網(wǎng)上政府信息、行業(yè)和企業(yè)信息、科技教育信息、文化娛樂信息、新聞信息、旅游信息、區(qū)域特色信息等均已形成一定規(guī)模。
隨著互聯(lián)網(wǎng)絡的飛速發(fā)展,我國互聯(lián)網(wǎng)絡信息資源得到了很大的發(fā)展,但是我國互聯(lián)網(wǎng)絡信息資源不斷進展的同時,存在一些問題需要重視。例如,網(wǎng)絡和數(shù)據(jù)庫存在大量低水平重復建設,難以實現(xiàn)互聯(lián)共享;信息資源的開發(fā)滯后應用,存在大量信息孤島現(xiàn)象等。因此,加大對我國互聯(lián)網(wǎng)絡信息資源開發(fā)和利用的引導力度,迫在眉睫。
為加深政府對我國互聯(lián)網(wǎng)絡信息資源開發(fā)和利用情況的把握,包括信息資源的存量、增量以及地區(qū)和行業(yè)分類特征等,為加快制定有關信息資源發(fā)展政策和措施提供重要參考依據(jù),促進政府對信息資源開發(fā)的有力引導,促進我國互聯(lián)網(wǎng)絡信息資源的充分利用,國務院信息化工作辦公室決定對我國各行、各業(yè)、各地區(qū)互聯(lián)網(wǎng)絡信息資源數(shù)量情況進行全面調(diào)查。
本次調(diào)查是我國互聯(lián)網(wǎng)絡信息資源的第三次數(shù)量調(diào)查,開始于**年月,結(jié)束于**年月,歷時個月。在保持與前二次調(diào)查有一定連續(xù)性、借鑒前二次調(diào)查成功經(jīng)驗的基礎上,在調(diào)查方法、調(diào)查深度、結(jié)果分析等方面有所創(chuàng)新。本次調(diào)查初步探索了我國互聯(lián)網(wǎng)絡信息資源發(fā)展中的問題和規(guī)律,為我國政府進一步正確引導互聯(lián)網(wǎng)絡信息資源的開發(fā)利用提供了重要參考。
第二部分調(diào)查說明
一、調(diào)查對象
所有域名注冊單位屬于中國(不包括香港、澳門、臺灣)的網(wǎng)站總和,包括,,和域名含,,等下的所有網(wǎng)站。
二、調(diào)查內(nèi)容
表調(diào)查內(nèi)容和指標
指標數(shù)據(jù)來源備注
域名數(shù)量數(shù)據(jù)注冊商上報
網(wǎng)站數(shù)量數(shù)據(jù)注冊商上報
網(wǎng)頁數(shù)量
計算機自動搜索
在線數(shù)據(jù)庫數(shù)量問卷調(diào)查
域名各地區(qū)域名分布狀況數(shù)據(jù)注冊商上報
網(wǎng)站各地區(qū)網(wǎng)站分布狀況數(shù)據(jù)注冊商上報按照省級行政區(qū)域劃分
各種性質(zhì)的網(wǎng)站分布狀況按照網(wǎng)站的域名特征劃分
主要類型網(wǎng)站提供的服務問卷調(diào)查政府、商業(yè)、企業(yè)
各行業(yè)網(wǎng)站分布狀況按照標準行業(yè)分類法
網(wǎng)站相關特征每天頁面訪問數(shù)
服務器擁有情況
網(wǎng)站的鏈接數(shù)
網(wǎng)站的員工數(shù)
網(wǎng)站成立時間
頻道數(shù)
網(wǎng)站版本
網(wǎng)站的可訪問性網(wǎng)站地圖等
安全性防火墻、操作系統(tǒng)等
網(wǎng)站效果指標信息發(fā)布可用性度量
業(yè)務結(jié)合
網(wǎng)頁網(wǎng)頁按內(nèi)容形式分類比例計算機搜索包括圖像、音頻和視頻
網(wǎng)頁按性質(zhì)分類比例政府、企業(yè)、商業(yè)等
網(wǎng)頁按地域分布比例省域及七大區(qū)分布
網(wǎng)頁長度以字節(jié)數(shù)計算
網(wǎng)頁的更新周期
網(wǎng)頁編碼狀況簡、繁體中文、英文等
在線數(shù)據(jù)庫按性質(zhì)分類比例問卷調(diào)查政府、企業(yè)、商業(yè)網(wǎng)站等
按地域分布比例華北、華南等七大區(qū)分布
按內(nèi)容分類比例產(chǎn)品、科技信息數(shù)據(jù)庫等
按形式分類比例圖形文字數(shù)據(jù)綜合等
按使用情況分類比例分自用和公用
公用下分免費和收費
收費下分收費方式
按服務方式分類比例面向終端用戶或中介
在線數(shù)據(jù)庫更新狀況-
數(shù)據(jù)庫容量物理存儲量()
是否同時具有其它載體
否、是(光盤、紙質(zhì)等)
三、調(diào)查時間
調(diào)查時間:**年月-**年月;數(shù)據(jù)截至時間:**年月日。
四、有關概念
。诒敬握{(diào)查中,中國互聯(lián)網(wǎng)絡信息資源定義為:中國互聯(lián)網(wǎng)絡上公開發(fā)布的網(wǎng)頁和在線數(shù)據(jù)庫的總和。
。袊ヂ(lián)網(wǎng)絡是指所有域名注冊單位屬于中國大陸的網(wǎng)站總和。
。诰數(shù)據(jù)庫是指以為界面,提供公共檢索的收費或免費的數(shù)據(jù)庫。
.網(wǎng)站是指有獨立域名的站點,其中包括和通用頂級域名()下的站點。此處的獨立域名指的是每個域名最多只對應一個網(wǎng)站域名,如:對域名來說,它只有一個網(wǎng)站,并非它有、……等多個網(wǎng)站。
。虡I(yè)網(wǎng)站指業(yè)務主要在網(wǎng)上進行的電子商業(yè)網(wǎng)站,如新浪、搜狐、網(wǎng)易等網(wǎng)站;企業(yè)網(wǎng)站是相對于商業(yè)網(wǎng)站而言,指業(yè)務主要在網(wǎng)下進行的企業(yè)所建立的網(wǎng)站,如聯(lián)想集團的網(wǎng)站。
。W(wǎng)頁搜索是指對抽取的網(wǎng)站從其首頁(域名)開始搜索,通過網(wǎng)頁上的層層鏈接,抓取所有屬于該網(wǎng)站的網(wǎng)頁的特征及其文本內(nèi)容。
.靜態(tài)網(wǎng)頁是指中不含?和輸入?yún)?shù)的網(wǎng)頁,包括:、、、、等。
.動態(tài)網(wǎng)頁是指中含?或輸入?yún)?shù)的網(wǎng)頁,包括:,,,等在方進行處理的網(wǎng)頁。
。W(wǎng)頁的編碼形式:是根據(jù)網(wǎng)頁本身的信息通過分析得到的,不是通過一篇網(wǎng)頁在中的聲明來判斷的。因為大量國內(nèi)的英文網(wǎng)頁在其聲明中都是簡體中文。
。W(wǎng)頁的內(nèi)容形式:是通過文件后綴獲得的。關于圖像、音頻、視頻的文件后綴定義標準參考標準。
。W(wǎng)頁的更新情況:網(wǎng)頁的更新時間是指搜索到該網(wǎng)頁的當日日期與該網(wǎng)頁的最后更新日期之間的時間段。
五、調(diào)查方法
。ㄒ唬⿺(shù)據(jù)獲取方式和渠道
域名和網(wǎng)站的總量數(shù)據(jù)通過國內(nèi)各國際域名注冊商和聯(lián)合獲得。
網(wǎng)頁的特征數(shù)據(jù)由百度公司利用搜索技術對全國網(wǎng)站進行搜索獲得。搜索時通過判斷同一網(wǎng)頁是否有多個鏈接指向,避免了對這類網(wǎng)頁的重復計算,通過判斷不同網(wǎng)站的地址和首頁字節(jié)數(shù)是否相同,排除了不同域名指向同一網(wǎng)站的情況。
網(wǎng)站的特征數(shù)據(jù)及在線數(shù)據(jù)庫的特征數(shù)據(jù)通過電話問卷調(diào)查的方式獲得。
(二)調(diào)查問卷的抽樣方法
總體界定
按照對中國互聯(lián)網(wǎng)絡信息資源的定義(中國互聯(lián)網(wǎng)絡上公開發(fā)布的網(wǎng)頁、在線數(shù)據(jù)庫的總和),同時考慮到未注冊域名而提供服務的網(wǎng)站數(shù)量較少以及調(diào)查的難度,本次調(diào)查中所指的總體為:中國(不包括香港、澳門、臺灣地區(qū))所有已注冊域名的網(wǎng)站,包括,,和域名含,等下的所有網(wǎng)站。
抽樣框
關于抽樣框,最直接的作法是選擇抽樣框為全國有域名的網(wǎng)站名錄。由于b_m性的原因,抽樣過程需要委托各域名注冊代理商完成,從方便實施并提高數(shù)據(jù)精度的角度考慮選擇抽樣框為全國(不含港、澳、臺)范圍內(nèi)的域名名錄。
由于一個網(wǎng)站可能會有兩個或兩個以上域名,而有的域名沒有建立網(wǎng)站。這樣對于總體而言,就出現(xiàn)了抽樣框單位沒有對應的抽樣單位、抽樣框單位和抽樣單位不一一對應等問題。對此,考慮采用排除、事后加權等方法來解決。
抽樣方法
本次調(diào)查的抽樣方法采用分層按比例抽樣:考慮到各域名類別下網(wǎng)站特征的差別,首先按域名類別分層;之后在每個類別內(nèi)采用定距抽樣的方法來抽取樣本,最后對調(diào)查結(jié)果進行事后加權處理以估計全國范圍的估計量。下面分階段敘述抽樣方法:
第一階段:將樣本量分到各層
因為到目前(**年月)為止只有截止**年月日的全國范圍的域名數(shù)的情況;同時考慮到我們主要是利用各類別域名數(shù)之間的比例關系來確定樣本量在各層的分配,而這種關系應該不會有較大的變化。因此本方案按照截止**年月日的各類別域名數(shù)占全國域名總數(shù)的比例將樣本總量分配到各域名類別。
第二階段:將樣本量分配到各域名注冊代理商
抽樣過程由域名注冊代理商按照抽樣辦法(由中國互聯(lián)網(wǎng)絡信息中心提供)抽取指定數(shù)量的域名作為樣本。樣本按照各域名注冊代理商所注冊擁有的域名數(shù)的比例進行分配。具體計算辦法如下:
。*()
其中:表示第家域名注冊代理商所應抽取第類的域名數(shù),表示第類應抽取的域名樣本數(shù),表示第家域名注冊代理商所擁有第類的域名總數(shù),表示第類的域名總數(shù)。
第三階段:各家域名注冊代理商抽取域名樣本
考慮到盡可能簡化各域名注冊代理商抽取樣本的工作量和保證抽樣的精度,要求各域名注冊代理商在整理了域名名錄(抽樣框)后采用等距抽樣,抽取樣本步驟如下:
步驟:分組
以域名的類別為單位對域名名錄進行分組。
步驟:排序
由域名注冊代理商對其抽樣框(域名名錄及相關信息)內(nèi)各組域名首先按照域名注冊單位所屬省份排序,進而在域名注冊單位所屬省份下按域名注冊先后時間進行排序。
步驟:編號
……(未完,全文共25634字,當前僅顯示4610字,請閱讀下面提示信息。
收藏《**年中國互聯(lián)網(wǎng)絡信息資源數(shù)量調(diào)查報告》)