目錄/提綱:……
一、背景:新趨勢(shì),新路徑
(一)大數(shù)據(jù)的概念
(二)大數(shù)據(jù)的特征
(三)非結(jié)構(gòu)化數(shù)據(jù)與政府治理決策
(四)國家對(duì)大數(shù)據(jù)的支持
二、布局:國內(nèi)外,兩平臺(tái)
(一)提前布局,創(chuàng)新機(jī)制
(二)國內(nèi)布局——國家發(fā)改委互聯(lián)網(wǎng)大數(shù)據(jù)分析中心
(三)全球布局——國家信息中心“一帶一路”大數(shù)據(jù)中心
……
干部學(xué)習(xí)講稿:基于大數(shù)據(jù)的政府決策支持(上)
楊道玲
國家信息中心信息化研究部電子政務(wù)研究室副處長
課程前言
各位學(xué)員大家上午好!非常高興有機(jī)會(huì)和大家做一個(gè)交流,今天交流的題目叫“基于大數(shù)據(jù)的政府決策支持”。關(guān)于大數(shù)據(jù),可能各地的同志們、領(lǐng)導(dǎo)們已經(jīng)有了比較充分的了解。今天不講大數(shù)據(jù)學(xué)術(shù)概念,也不講大數(shù)據(jù)理論,想結(jié)合近一兩年來,國家發(fā)改委圍繞大數(shù)據(jù)方面做的一些工作實(shí)踐,
總結(jié)一些大數(shù)據(jù)對(duì)政府決策支持的套路和方法。
今天講的內(nèi)容包括四個(gè)方面:
第一,先簡要的介紹一下當(dāng)前大數(shù)據(jù)面臨新趨勢(shì)、新形勢(shì)是什么。政府的決策到底需要什么樣的數(shù)據(jù)決策支持?
第二,目前大數(shù)據(jù)在對(duì)國家發(fā)改委,對(duì)政府決策支持方面都有什么樣的措施和做法?這些做法哪些可以應(yīng)用到地方各級(jí)政府決策支持中去?
第三,通過五到六個(gè)具體的案例給大家介紹一下,大數(shù)據(jù)在支撐政府的決策支持和支撐政府的治理創(chuàng)新方面,一些新的方法、新的理念和新的模式。
第四,對(duì)大數(shù)據(jù)大應(yīng)用簡要的展望和小結(jié)。大概這么四個(gè)方面的內(nèi)容。
一、背景:新趨勢(shì),新路徑
先講第一個(gè)方面,當(dāng)前大數(shù)據(jù)成為國家戰(zhàn)略,而且大數(shù)據(jù)在國外、全球也是風(fēng)起云涌,很多國家都開始應(yīng)用大數(shù)據(jù),推行政府?dāng)?shù)據(jù)開放和大數(shù)據(jù)促進(jìn)政府治理創(chuàng)新。大數(shù)據(jù)到底是一個(gè)什么樣的態(tài)勢(shì)?先給大家做一個(gè)背景性的介紹。
(一)大數(shù)據(jù)的概念
關(guān)于大數(shù)據(jù)的概念,我這里不去做學(xué)術(shù)性的闡釋,在2015年的時(shí)候,國務(wù)院發(fā)了三個(gè)技術(shù)性的文件,這三個(gè)文件分別是2015年年初的云計(jì)算,大概是7月份,促進(jìn)互聯(lián)網(wǎng)+的一個(gè)文件,緊接著有一個(gè)促
……(新文秘網(wǎng)http://120pk.cn省略1078字,正式會(huì)員可完整閱讀)……
。
(二)大數(shù)據(jù)的特征
大數(shù)據(jù)到底有多大?我左邊有一張圖,有一個(gè)表,左邊是麥肯錫預(yù)測(cè)的。說到2020年,從2009年的2020年,十年了,數(shù)據(jù)量有可能翻44倍到35個(gè)ZB,大家可能不清楚,35個(gè)ZB到底是多大?我右邊有一個(gè)表,這是我今天早上截圖截下來的。大家看二進(jìn)制的換算,1KB等于1024,B2的十次方,從KB到MB到GB,我們現(xiàn)在硬盤用的是GB,有的大的存儲(chǔ)的器是TB,TB下面是PB,每一個(gè)等級(jí)之間是1024倍,就是2的十次方倍,到PB下面是EB、ZB,最大的現(xiàn)在是YB。這個(gè)是在大概的進(jìn)率換算單位。如果按照十次分的換算,我們把1024簡單的理解為十的三次方就是1000,按照1000來算,ZB就是十的21次方,就是這么大的數(shù)據(jù)量。應(yīng)該可以說叫超級(jí)海量的數(shù)據(jù)。
IDC國際數(shù)據(jù)公司,它的預(yù)測(cè)跟麥肯錫的預(yù)測(cè)基本上是類似的,他們有三個(gè)結(jié)論。第一,說當(dāng)前數(shù)據(jù)增長進(jìn)入了爆發(fā)期。2011年,全球數(shù)據(jù)總量是1.8個(gè)ZB,大家看ZB是我們現(xiàn)在倒數(shù)第二大的單位,1.8個(gè)ZB。預(yù)計(jì)2020年是40個(gè)ZB,十年他認(rèn)為增長超過20倍。不管超過20倍也好,40倍也好,表明了我們?cè)谖磥淼氖,現(xiàn)在沒有十年了,未來的四年,我們數(shù)據(jù)量比2010年相比,是要至少翻一番以上。應(yīng)該不是翻一番,翻幾十倍以上。
第二個(gè)結(jié)論是美國和中國是最大的兩個(gè)增長極,目前它認(rèn)為大數(shù)據(jù)資源美國占了32%,歐洲是19%,中國是13%,到2020年中國要上升為21%,處于世界第二位。這個(gè)可能大家對(duì)數(shù)據(jù)概念沒有感覺,但是我們自己生活中,這種數(shù)據(jù)量不斷地增加、不斷地?cái)U(kuò)充,呈現(xiàn)出幾何基數(shù)的增長,這個(gè)咱們可能是有非常深刻體驗(yàn)的。90年代時(shí)候用的是普通的小型的3.5存盤,那個(gè)盤是1.44個(gè)MB,1.44兆,后來用了光盤,現(xiàn)在用了硬盤,硬盤開始是40個(gè)G,現(xiàn)在是幾百個(gè)G,現(xiàn)在甚至有上T的硬盤,就是我們普通個(gè)人使用的。存儲(chǔ)密度的增加,表明數(shù)據(jù)量容量是不斷擴(kuò)充的,表明需求是不斷增加的。
第三個(gè)特征,非結(jié)構(gòu)化的數(shù)據(jù)占比比較大。這里涉及一個(gè)概念叫非結(jié)構(gòu)化和結(jié)構(gòu)化.現(xiàn)在認(rèn)為非結(jié)構(gòu)化數(shù)據(jù)占75%,什么叫非結(jié)構(gòu)化?我們先看看什么結(jié)構(gòu)化。
這兩張表我相信很多同志都見過,而且我們第一張表,個(gè)人經(jīng)歷,可能一生中無數(shù)時(shí)期填這樣一個(gè)表。但這個(gè)表很有特點(diǎn),就是字段數(shù)相對(duì)比較固定的,比如說姓名,你這個(gè)名字是三個(gè)字符還是幾個(gè)字符,它是固定的。第二,性別,是男是女,就兩個(gè)選項(xiàng)。身高,它是數(shù)字,結(jié)尾是米或者厘米。所有這一系列的字段都是可以經(jīng)過機(jī)器處理,而且都是可以直接導(dǎo)入數(shù)據(jù)庫進(jìn)行處理的。
還有右邊的圖,我們舉個(gè)例子,某某縣,人口經(jīng)濟(jì)構(gòu)成統(tǒng)計(jì)表,這個(gè)表咱們也可能經(jīng)常見到,這種也是可以直接導(dǎo)入經(jīng)濟(jì)計(jì)算的。這種信息我們稱之為叫結(jié)構(gòu)化信息,因?yàn)樗鼈冊(cè)跀?shù)據(jù)庫里面是一塊塊的模塊完全對(duì)應(yīng)起來。
(三)非結(jié)構(gòu)化數(shù)據(jù)與政府治理決策
1、非結(jié)構(gòu)化數(shù)據(jù)主體
什么是非結(jié)構(gòu)化?最主要這五類,大家看想想生活中是不是這五類信息反而比統(tǒng)計(jì)性信息要多?
第一類,是搜索引擎,這個(gè)都用過,每天在百度上輸入的時(shí)候,輸入搜索詞,我們的搜索詞都是非標(biāo)準(zhǔn)的。每個(gè)人,比如說我們搜索一個(gè)事情的話,每個(gè)人用的詞可能都不一樣,全屬于人工的或者自然的語言。這個(gè)量是非常大的,百度就此做了搜索引擎,抓取信息,然后通過我們搜索詞,構(gòu)建出搜索的熱度,能夠反而向你推送各種相關(guān)的信息,靠什么?就靠這種分析。還有以前吵過的競價(jià)排名,競價(jià)排名排的是什么?也是搜索詞。這些東西它都可能是各方面的語言進(jìn)行組配,非標(biāo)準(zhǔn)語言,非結(jié)構(gòu)化的。
第二類,社交媒體,咱們可能都用過,論壇、微博、微信,包括QQ很多的及時(shí)通訊,還有貼吧。這里面發(fā)各類的帖子它都不是結(jié)構(gòu)化的。我們隨機(jī)的一句話,隨意的一篇文章,可長可短等等,段落等等,都是根據(jù)我們發(fā)布者主體意識(shí)進(jìn)行決定的。
第三類,視頻或音頻,這個(gè)不展開了,這個(gè)大家都非常熟悉。包括我們今天用的是視頻,視頻肯定是比音頻數(shù)據(jù)要大,我一個(gè)視頻包含的數(shù)據(jù)量可能是我們文字信息的N多次方倍。
第四類,位置服務(wù),很多地圖,在地圖上進(jìn)行疊加了若干個(gè)圖層,這種位置信息,查找一個(gè)線路,包括現(xiàn)在滴滴打車,查找餐館等等,這都用了位置服務(wù)。所有位置服務(wù)在地圖上產(chǎn)生的數(shù)據(jù)量非常大,而且是隨機(jī)的,不同的用戶可能使用不同的服務(wù)。但是這是數(shù)據(jù)累積起來之后,就是發(fā)現(xiàn)很多規(guī)律,比如說在今天有多少用戶搜索了某某個(gè)產(chǎn)品,通過時(shí)間序列累積之后就發(fā)現(xiàn)很多趨勢(shì),這個(gè)趨勢(shì)里面反過來推,搜索這類產(chǎn)品和這個(gè)地方的人都可能是哪些類型的用戶,做用戶畫像往回推,這可能形成一個(gè)針對(duì)性的服務(wù),這對(duì)商家來說它就非常需要,想知道我的用戶到底是誰,他們有什么樣的需求,他是什么樣的特征,是男是女的,年齡段、學(xué)歷層次,他們平時(shí)還有其他什么樣的購物愛好,或者體驗(yàn)愛好等等。圖像信息,圖片圖像這個(gè)也很多。這是非結(jié)構(gòu)化的數(shù)據(jù)。
2、非結(jié)構(gòu)化數(shù)據(jù)對(duì)政府決策的要求
這些大量的數(shù)據(jù),特別是大量的非結(jié)構(gòu)化數(shù)據(jù),互聯(lián)網(wǎng)的數(shù)據(jù)產(chǎn)生之后,到底對(duì)我們政府決策帶來什么樣一些沖擊或者問題?面臨什么樣的挑戰(zhàn)?當(dāng)前新形勢(shì)下,我們提出要政府的治理,治理體系和治理能力現(xiàn)代化。這個(gè)治理能力、治理體系現(xiàn)代化對(duì)我們政府治理提出了新的要求,要求什么?決策要快速、要及時(shí)。第二,不能再拍腦袋出臺(tái)政策,要基于大量的用戶調(diào)查,這個(gè)大量是多大的量?我們以前是做問卷調(diào)查,或者找?guī)讉(gè)聽政的方式,找?guī)讉(gè)代表,現(xiàn)在可能不夠了。第三,新的業(yè)態(tài)、新的應(yīng)用在不斷地產(chǎn)生,如果政府的治理跟不上新形勢(shì),就會(huì)很被動(dòng)。所以我們現(xiàn)在治理的現(xiàn)代化,對(duì)我們要求是全方位掌握信息、全樣本的了解信息。
3、非結(jié)構(gòu)化數(shù)據(jù)下傳統(tǒng)政府治理的缺點(diǎn)
而傳統(tǒng)的政府治理的缺點(diǎn),我 ……(未完,全文共12732字,當(dāng)前僅顯示3029字,請(qǐng)閱讀下面提示信息。
收藏《干部學(xué)習(xí)講稿:基于大數(shù)據(jù)的政府決策支持(上)》)