人民網>>IT>>IT專題>>節會專題>>第十九次中國互聯網絡發展狀況統計報告>>分析報告

第19次中國互聯網絡發展報告:CNNIC調查方法
  2007年01月23日15:34 【字號 】【留言】【論壇】【打印】【關閉
  中國互聯網絡信息中心(CNNIC)2007年1月23日發布第19次中國互聯網絡發展狀況統計報告。本次調查顯示,中國內地網民總人數已達1.37億人。以下為中國互聯網絡信息中心(CNNIC)調查方法。

  依據統計學理論和國際慣例,在前18次調查工作基礎之上,本次調查採用了計算機網上自動搜尋、網上聯機、網下抽樣、相關單位上報數據等調查方法。

  (一)域名數、網站數、IP地址數調查、網頁數、網頁字節數調查

  1.中國的通用頂級域名數及對應網站數:

  通過各通用頂級域名注冊單位協助提供。這些數據包括:所有通用頂級域名(gTLD)和有網站(即有WWW服務)的通用頂級域名(gTLD)總數、所有通用頂級域名(gTLD)和有網站的通用頂級域名(gTLD)按.COM、.NET、.ORG分類的數目、所有通用頂級域名(gTLD)和有網站的通用頂級域名(gTLD)按注冊單位所在省份分類的數目。

  2.中國的CN域名數及對應網站數:

  採用計算機網上自動搜索可得到如下數據:CN下的域名數及地域分布情況﹔CN下網站數及其地域分布情況。

  3.中國域名總數、網站總數:

  將以上1、2兩部分的相關數據分別相加,即可得到中國的域名總數、網站總數、域名和網站的地域分布、網站分類數等數據。

  4.IP地址總數:

  IP地址分省統計的數據來自APNIC,中國互聯網絡信息中心(CNNIC)IP地址數據庫,數據統計方法是將兩個數據庫中已經注冊且可以判明地址所屬省份的數據,按省分別相加得到,由於地址分配使用是動態過程,所統計數據僅供參考。

  5.中國網頁總數、網頁字節總數:

  採用計算機網上自動搜索,對抽取的網站從其首頁(WWW+域名)開始搜索,通過網頁上的層層鏈接,抓取所有屬於該網站的網頁的特征及其文本內容。將由網頁搜索所獲得的所有中國網站的網頁數和網頁字節數分別相加得到中國網頁總數及網頁字節總數。該總數不含內容相同的重復網頁。

  (二)網上聯機調查

  網上聯機調查重在了解網民使用互聯網的行為習慣、對互聯網的態度以及對熱點問題的看法和傾向。具體方法是將問卷放置在CNNIC的網站上,同時在全國各省的信息港與較大ICP/ISP上設置問卷鏈接,由網民主動參與填寫問卷的方式來獲取信息。

  CNNIC在2006年12月9日∼12月31日進行了網上聯機調查。調查得到了國內眾多知名網站、媒體的大力支持,國內許多知名網站均在主頁為本次聯機調查問卷放置了鏈接。本次網上聯機調查共收到調查問卷20,295份,經過有效性檢查處理得到有效答卷20,183份。

  (三)電話抽樣調查

  電話抽樣調查側重於了解中國網民的總量、相關的特征及行為特點等。

  1.調查總體

  結合調查目的,網下調查的目標總體定義為:全國6周歲以上的居民。從訪問實施的角度,把目標總體細分為:1.全國有住宅固定電話的6周歲以上的人群(子總體A),採用電話調查的方式﹔2.全國所有高等院校中的住校學生(子總體B),採用電話調查的方式,本次調查根據第17次調查結果進行推斷﹔3.沒有住宅固定電話、但有小靈通的6周歲以上的人群(子總體C1),採用電話調查的方式。在對全國結果進行推斷時,將三個子總體的統計量應用加權公式進行匯總。

  2.總體A+C1抽樣方法

  按照科學性和可操作性相結合的原則,對總體A+C1按省進行分層。

  ◇抽樣指標的確定

  從全國的情況來看,各省的城市住宅電話與鄉村住宅電話的比例差異很大,由於城市與農村家庭的平均人口數差異很大,所以在用各省數據推斷全國時,考慮的指標是“擁有住宅電話的人數(或稱住宅電話覆蓋的人數)”﹔在確定各省中地市(此處的地市包括地級市和地區行署,每個地市下都包括城鎮和鄉村,以下簡稱地市州)的樣本量時,採用地市州的“人口和經濟指標”建立回歸預測模型估計該地市州的住宅電話數目,並將該地市州的住宅電話數目作為抽樣指標。

  ◇樣本量

  綜合考慮到調查的精度和費用、時間的要求,在保証網民人數最少的省的樣本量能滿足推斷本省網民總數的基本要求下,置信度為95%,設計效應為1.5時,最大絕對誤差為1.6%。由於各省的網民人數和佔本省人口數的比例差異很大,考慮各方面的因素,根據第17次中國互聯網絡信息中心(CNNIC)的調查結果,以各省網民人數為依據,算得每個省的樣本量。本次調查全國的樣本量為32,325個。

  ◇省內各地市的抽樣方法

  第一步:從精度上考慮,為使樣本更接近自加權樣本,在每個省中抽取全部的地市州。省內各地市州的樣本量,按各地市州住宅電話數目比例進行分配。

  第二步:獲得各地市州的所有電話局號,根據該地市州的局號生成電話號碼庫。電話號碼中除局號外的后四位,由隨機數生成。

  第三步:確定調查對象,在電話(包括沒有住宅固定電話的小靈通)撥通后,把接聽電話的人作為被訪對象,詢問家庭基本狀況和他(她)本人上網(不上網)的有關情況、個人背景資料和家庭其他成員的最簡要資料。如果他(她)不上網,但家中有人上網,則再隨機抽取一名上網的成員來接聽電話,回答有關上網的問題以及自己的個人基本資料。

  3.全國加權方法

  對全國的推斷採用對各省的調查結果進行事后加權處理的方法。

  4.抽樣調查成功率

  按美國輿論研究協會(AAPOR)的成功率公式三計算,本次抽樣調查的成功率為39.1%。

  5.數據預處理

  在數據處理之前,對數據中變量的取值、變量之間的邏輯關系等進行檢查,對其中的不合格樣本進行了核對、刪除和補充,並對部分變量進行了事后編碼。

  在統計報告中有一些平均數(比如每周上網小時數等),在計算這些平均數前,首先採用以大於或小於平均數的三個標准差和檢查觀測量的各變量之間的邏輯關系等方法對數據中的異常值進行排除。

(責任編輯:畢磊)
相關專題
· 第十九次中國互聯網絡發展狀況統計報告
精彩推薦:
25年冒死拍攝火山
25年冒死拍攝火山
豬販拉豬險象環生
豬販拉豬險象環生
四川涼山發生泥石流
四川涼山發生泥石流
吊車斗車砸進教室
吊車斗車砸進教室



熱點新聞榜
...更多
  
人民網搜索  互聯網搜索


   

鏡像:日本  教育網  科技網
E-mail:info@peopledaily.com.cn 新聞線索:rm@peopledaily.com.cn

人民日報社概況 | 關於人民網 | 招聘英才 | 幫助中心 | 廣告服務 | 合作加盟 | 網站聲明 | 網站律師 | 聯系我們 | ENGLISH 
京ICP証000006號|
網上傳播視聽節目許可証(0104065)| 京朝工商廣字第0394號
人 民 網 版 權 所 有 ,未 經 書 面 授 權 禁 止 使 用
Copyright © 1997-2007 by www.people.com.cn. all rights reserved