干部學習講稿:大數(shù)據(jù)在醫(yī)療領域的應用(下)
寧家駿
國家信息化專家咨詢委員會委員
二、大數(shù)據(jù)與云計算相向而行、發(fā)展迅速
(三)大數(shù)據(jù)時代及其特點
我們說現(xiàn)在我們進入大數(shù)據(jù)時代,為什么叫大數(shù)據(jù)時代?大家知道,是因為人類前進的腳步有了重大的變化,我們已經(jīng)從農(nóng)業(yè)社會進入到工業(yè)社會,又從工業(yè)社會進入到了信息社會,當今我們面臨著一個生活、工作和思維方式的巨大變革的時期,就是我們說的大數(shù)據(jù)的時代。
為什么叫大數(shù)據(jù)時代呢?也是因為我們?nèi)祟悓π畔⒌睦煤驼J識的手段,經(jīng)過了5次巨大的變革。比如開始最早的時候,我們的猿人,我們的先祖直立起來,能夠進行語言的交換,這是第一輪。之后,在公元3500年有了文字。之后,大家知道是我們國家的驕傲,到了15世紀,我們畢升發(fā)明了活字印刷。到了19世紀開始有了電子,比如說電話、廣播。到了上世紀有了電視。但是現(xiàn)在大家知道,從20世紀末開始到本世紀,人們更加青睞的互聯(lián)網(wǎng);ヂ(lián)網(wǎng)最大的問題就給我們帶來了方便。大家過去查個東西很麻煩,以前我們大家知道,比如說過去國家圖書館,你去查資料挺麻煩,你要查一個國外的一個數(shù)據(jù)庫的東西,是報刊的東西,也非常麻煩,還要花很多錢,現(xiàn)在很方便。所以這是我們看到時代的變化,在這樣一個時代點上,它推動了我們認知的格局,就是你認識世界、了解世界,你實際是變化,所以這一點是非常重要的。
就是我們開通了新的望遠鏡,開通薩德,這個坦率說,對我們威脅還是非常大,所以這也就是我們?yōu)槭裁船F(xiàn)在更加重視這種數(shù)據(jù)的分析,比如說韓國部署了薩德,最大的一個
……(新文秘網(wǎng)http://120pk.cn省略1030字,正式會員可完整閱讀)……
賣的,價格最貴的啤酒跟尿布放得最近,這樣照顧一些人,反正我拿著方便,我也不管什么,這提高了它上漲的效應。
所以大數(shù)據(jù)的價值重在于挖掘,而挖掘就是分析,我們不僅僅是為了數(shù)據(jù)而數(shù)據(jù),而分析就是找出它們的關聯(lián)程度,找出它們的交點,找出它們的規(guī)律,來提高我們的洞察力。所以我們說大數(shù)據(jù)它顛覆了很多傳統(tǒng),比如說過去,我們在各種研究里經(jīng)常講抽樣調(diào)查,現(xiàn)在當然也不能完全代替,但是這個抽樣就有問題,你抽的是不是合理?是不是有代表性?你比如說現(xiàn)在經(jīng)常老百姓吐槽我們現(xiàn)在一些價格的調(diào)整,說搞了聽證會,說聽證會上選的代表,一致都同意漲價,網(wǎng)民都吐槽,說你們這一點代表都沒有。所以實際上說,就過去搞抽樣調(diào)查,也有這個問題,因為你那樣本,選擇的合理、規(guī)范,是不是標準?是不是具有代表性?但現(xiàn)在大數(shù)據(jù)我不搞抽象調(diào)查,我是搞全體的,樣本是全部,我這樣得出來的結論可能就比抽樣要準確得多。
這樣一個情況下我們說大數(shù)據(jù)時代它的核心做的是洞察,洞察有以下幾個特色。一個我們可以洞察工作的重點,這點國內(nèi)外都一樣,因為美國也是,它城市里頭也有發(fā)生丟井蓋,或者井蓋破損,結果怎么解決這問題呢?美國人也是,也是用了物聯(lián)網(wǎng)技術,他把井蓋都貼上RFID標簽,將來一旦沒有了,出事了,他自動就警報。
另外可以洞察未來的趨勢,這個也是一個很經(jīng)典的例子,2008年,谷歌就利用網(wǎng)上搜集,搜索到個人,所以它的用戶搜索的數(shù)據(jù)都跟某些看排名,說一發(fā)現(xiàn)這段時間大家都在搜流感有關的一些詞,可能發(fā)生流感,后來就準確預報出來。我們國內(nèi)其實也有這個例子,2013年,百度的數(shù)據(jù)分析師就查到網(wǎng)民在國慶節(jié)前集中去查詢九寨溝的信息,到九寨怎么走?住在哪?怎么玩?當時百度的數(shù)據(jù)分析師就給有關部門,包括四川省旅游局九寨溝送了這個報告,說今年十一可能游客有爆發(fā)性的增長,你們要特別小心。但是很遺憾,這個報告有關部門沒重視,結果就造成了什么呢?那個到九寨溝的游客太多,大家知道,進溝是要用他們當?shù)貙S玫能,車不夠,上不去車,結果游客就發(fā)生了一些不愉快的事情,什么砸售票處、砸車,這個國際影響很不好。
大數(shù)據(jù)的洞察還體現(xiàn)在它可以洞察出管理的規(guī)律,就像前面我們說的像首爾公共車的部分,還可以洞察出我們生產(chǎn)調(diào)度管理的這種其他的缺陷。另外大數(shù)據(jù)可以用來洞察我們有生產(chǎn)管理的調(diào)度。這一點這個華為也是用這個解決了問題。大家知道,華為這個手機出來之后,大家很受歡迎,但是有一段時間這個手機脫銷,它其中的問題,大家知道,華為的手機它這個供應鏈上,也是有一些關鍵的器件,靠其他的企業(yè)來提供,但是當一些企業(yè)跟不上它這個調(diào)度的時候就會掉鏈。所以后來華為就利用大數(shù)據(jù),包括我們國家信息中心的那個大數(shù)據(jù)研究的團隊,和他們合作,對每一個供應鏈上的ERP系統(tǒng)的數(shù)據(jù)進行獲取,然后進行分析,每一個環(huán)節(jié),每一個零件企業(yè)的ERP的數(shù)據(jù)把它會在一起,然后就可以看到,比如哪個企業(yè)它這個環(huán)節(jié)供不上東西,然后就及時的來提醒他加快進度也好,或者加快進料也好,就使得這個供應鏈就好了。大數(shù)據(jù)作為洞察,還可以洞察客戶的需求。比如現(xiàn)在電子商務,你要經(jīng)常在淘寶上買東西,他可以給你畫像,因為你老買東西,他知道你身高多少,穿多大的衣服,幾碼的鞋,你喜歡什么顏色的?另外還可以洞察你的員工的表現(xiàn),可以洞察你客戶的
誠信,你可以洞察合適的人選等等。
所以大數(shù)據(jù)成為當今新的一個數(shù)據(jù)采集的手段,比如說可以用于在打擊犯罪里頭分析一些犯罪嫌疑人的行為,進行預測,可以作為預防犯罪一個很重要的。你看我們現(xiàn)在的視頻的監(jiān)控信息,包括一些犯罪嫌疑人指紋的信息,掌紋的信息,甚至人臉圖像的信息,都成為我們打擊犯罪的重要手段。
(四)大數(shù)據(jù)的建立
要做好一個大數(shù)據(jù),要設計一個大型的系統(tǒng)。首先我們說這個系統(tǒng)應該能夠存儲數(shù)據(jù),能夠處理數(shù)據(jù),能夠開發(fā)出相應的應用,然后可以把這些應用放到一個合適的平臺上,比如說像現(xiàn)在大家更喜歡把很多應用放在手機上。這個大家隨時都可以用,比如現(xiàn)在大家老用的像這種高德地圖、百度地圖,這種交通流量也是用的大數(shù)據(jù)。
這里不能不跟大家提到,就是目前大多數(shù)系統(tǒng)里頭都用了一個比較成熟的技術,叫hadoop,這個詞大家知道一下就可以,它是目前一個開源架構的簡稱,這個基本上是由谷歌開發(fā)出來。然后把它作為一個現(xiàn)代支撐大數(shù)據(jù)應用的一個公共平臺。
我們當今要建設一個大數(shù)據(jù)的系統(tǒng),就要搭平臺、采數(shù)據(jù)、建模型,然后再編寫應用,最后是以圖呈現(xiàn)的方式,是一種最好的模式。我們看到,現(xiàn)在比如說華能一些企業(yè)都給領導開發(fā)了這種大數(shù)據(jù)的這種領導的決策系統(tǒng)。像華能做的這個東西,它可以每個領導早晨一上班,就可以看到,在這個pad上或者手機智能終端上推送,他們企業(yè)昨天一天經(jīng)營所有的數(shù)據(jù),比如發(fā)了多少度電,每個電廠發(fā)了多少度電,每個電廠發(fā)這些電輸出了多少,成本是多少,其中包括這個成本是用了哪個煤礦的煤,煤價是多少,運費是多少?而且每天都給你分析它的效益有提升,還是有下降,所以這些是非常重要的。所以我們要建好數(shù)據(jù)采集了模型。
另外更重要的是,數(shù)據(jù)在應用的時候要建立好數(shù)據(jù)分析的模型,一般來說,現(xiàn)在有四大的模型,就是分類的模型、聚類的模型、預測的模型和關聯(lián)的模型。建這些模型需要有很多基礎必須要有的知識,同時要采用一些經(jīng)典算法,我這里不展開給大家介紹。通過建好模型做好分析,提供我們這種決策樹,來為各級領導做決策提供這種輔助的支持。
最后我們剛才說的這個環(huán)節(jié),一圖勝千言,大家比較習慣還是愿意看這種圖。這個圖能夠很生動 ……(未完,全文共12158字,當前僅顯示2892字,請閱讀下面提示信息。
收藏《干部學習講稿:大數(shù)據(jù)在醫(yī)療領域的應用(下)》)