如何擁抱大數(shù)據(jù)時(shí)代
——訪中國(guó)人民大學(xué)中國(guó)調(diào)查與數(shù)據(jù)中心主任袁衛(wèi)
袁衛(wèi) 中國(guó)人民大學(xué)中國(guó)調(diào)查與數(shù)據(jù)中心主任,曾任中國(guó)人民大學(xué)常務(wù)副校長(zhǎng)。現(xiàn)任第六屆國(guó)務(wù)院學(xué)位委員會(huì)應(yīng)用經(jīng)濟(jì)學(xué)學(xué)科評(píng)議組、統(tǒng)計(jì)學(xué)學(xué)科評(píng)議組召集人,教育部社會(huì)科學(xué)委員會(huì)委員、中國(guó)統(tǒng)計(jì)教育學(xué)會(huì)副會(huì)長(zhǎng)兼高校分會(huì)會(huì)長(zhǎng)、全國(guó)應(yīng)用統(tǒng)計(jì)專(zhuān)業(yè)碩士教育指導(dǎo)委員會(huì)常務(wù)副主任。
什么是大數(shù)據(jù)?也許你不能準(zhǔn)確地給它下一個(gè)定義,但是,你知道或者不知道,它就在那里,已經(jīng)滲透到你工作、生活的方方面面。我們?cè)撊绾螒?yīng)對(duì)這場(chǎng)被一些人稱(chēng)為“第四次科技革命”的全球新競(jìng)爭(zhēng)?又如何培養(yǎng)適應(yīng)大數(shù)據(jù)時(shí)代要求的高層次人才?日前,記者就此采訪了中國(guó)人民大學(xué)中國(guó)調(diào)查與數(shù)據(jù)中心主任、中國(guó)人民大學(xué)原常務(wù)副校長(zhǎng)袁衛(wèi)教授。
中國(guó)擁有數(shù)據(jù)資源優(yōu)勢(shì)
記者:對(duì)于老百姓而言,大數(shù)據(jù)還是個(gè)新詞匯,能否介紹一下大數(shù)據(jù)產(chǎn)生的時(shí)代背景以及目前國(guó)內(nèi)外研究、應(yīng)用的狀況?
袁衛(wèi):在上世紀(jì)80年代初,就已經(jīng)有了大數(shù)據(jù)的概念和相關(guān)應(yīng)用,但是它深入社會(huì)和百姓的視野,則是最近幾年的事情。2012年,美國(guó)政府由白宮牽頭,啟動(dòng)了一個(gè)“大數(shù)據(jù)發(fā)展計(jì)劃”,這個(gè)計(jì)劃的推出被視為進(jìn)入大數(shù)據(jù)時(shí)代的標(biāo)志性事件,其重要性堪比1992年美國(guó)政府推出的“信息高速公路計(jì)劃”(被視為進(jìn)入網(wǎng)絡(luò)時(shí)代的標(biāo)志)。在相似的時(shí)間,歐盟各國(guó)陸續(xù)開(kāi)放了很多政府?dāng)?shù)據(jù),日本也啟動(dòng)了一個(gè)大數(shù)據(jù)項(xiàng)目,聯(lián)合國(guó)2012年發(fā)布大數(shù)據(jù)報(bào)告,全球掀起了大數(shù)據(jù)研究和應(yīng)用的熱潮。
大數(shù)據(jù)的發(fā)展,是以網(wǎng)絡(luò)和計(jì)算機(jī)技術(shù)的高速發(fā)展為依托的。1965年英特爾創(chuàng)始人之一的摩爾先生提出,未來(lái)的網(wǎng)絡(luò)計(jì)算機(jī)發(fā)展,大體上每隔1年到2年,等面積集成電路中的晶體管數(shù)量將會(huì)增加一倍,即計(jì)算速度會(huì)提高一倍,同等的計(jì)算,成本會(huì)降低一半。經(jīng)過(guò)近50年的實(shí)踐,驗(yàn)證了摩爾先生的預(yù)測(cè),也就是人們常說(shuō)的“摩爾定律”。計(jì)算機(jī)和網(wǎng)絡(luò)科技的高速發(fā)展,使得大量網(wǎng)絡(luò)數(shù)據(jù),包括音頻的、視頻的、圖片的、文本的各種各樣的數(shù)據(jù),得以保存,并轉(zhuǎn)化為我們可以深入分析的數(shù)據(jù)。于是,大數(shù)據(jù)的研究和應(yīng)用也就水到渠成了。
記者:在大數(shù)據(jù)這個(gè)領(lǐng)域,我們和發(fā)達(dá)國(guó)家的差距大嗎?
袁衛(wèi):上世紀(jì)八九十年代,我們?cè)诤芏嗫萍碱I(lǐng)域和國(guó)外差距很大,但是進(jìn)入互聯(lián)網(wǎng)時(shí)代以后,這種狀況逐漸改觀。進(jìn)入大數(shù)據(jù)時(shí)代,我們可進(jìn)一步縮小與美國(guó)等科技發(fā)達(dá)國(guó)家的差距,甚至具有后發(fā)優(yōu)勢(shì),原因有三個(gè)方面:其一,在互聯(lián)網(wǎng)時(shí)代,各種最先進(jìn)的技術(shù)可以快速傳播,基本上可以做到全球同步;其二,和微軟的操作系統(tǒng)等軟件不同,大數(shù)據(jù)絕大多數(shù)軟件是開(kāi)源的,很多網(wǎng)絡(luò)技術(shù)也是公開(kāi)的,中國(guó)的科學(xué)技術(shù)與教育工作者,只要具有足夠的智慧和能力,完全可以追趕甚至在某個(gè)領(lǐng)域超過(guò)美國(guó);其三,我們?cè)跀?shù)據(jù)資源上具有優(yōu)勢(shì)。中國(guó)有13.5億人,13.5億個(gè)活動(dòng)主體組織了各種社會(huì)經(jīng)濟(jì)關(guān)系,建立起各種社會(huì)、網(wǎng)絡(luò)聯(lián)系,在各種社會(huì)經(jīng)濟(jì)活動(dòng)中產(chǎn)生大量的數(shù)據(jù),這些數(shù)據(jù)是可以充分挖掘的資源。我們起步稍晚,但是具有后發(fā)優(yōu)勢(shì),在某些領(lǐng)域甚至可以達(dá)到國(guó)際先進(jìn)水平,比如中國(guó)推進(jìn)的智慧城市建設(shè)就很不錯(cuò),還有微信社交平臺(tái)、阿里小貸等,體現(xiàn)了中國(guó)的特色。
統(tǒng)計(jì)學(xué)科迎來(lái)“最好的時(shí)期”
記者:您是統(tǒng)計(jì)學(xué)方面的權(quán)威專(zhuān)家。在您看來(lái),大數(shù)據(jù)對(duì)于統(tǒng)計(jì)學(xué)的發(fā)展有何影響?
袁衛(wèi):統(tǒng)計(jì)學(xué)就是數(shù)據(jù)科學(xué),大數(shù)據(jù)對(duì)統(tǒng)計(jì)學(xué)的發(fā)展影響巨大。我個(gè)人認(rèn)為,大數(shù)據(jù)對(duì)于統(tǒng)計(jì)學(xué)的發(fā)展,既是機(jī)遇又是挑戰(zhàn)。
說(shuō)它是機(jī)遇,是因?yàn)榇髷?shù)據(jù)研究和應(yīng)用會(huì)帶來(lái)大量人才需求,這對(duì)統(tǒng)計(jì)學(xué)的發(fā)展是一個(gè)巨大的利好,可以說(shuō),目前統(tǒng)計(jì)學(xué)發(fā)展正處于歷史上最好的時(shí)期。這幾年,從全國(guó)范圍看,統(tǒng)計(jì)學(xué)專(zhuān)業(yè)畢業(yè)生就業(yè)狀況都不錯(cuò),今后會(huì)更好。
說(shuō)它是挑戰(zhàn),是因?yàn)榇髷?shù)據(jù)可能部分顛覆傳統(tǒng)的統(tǒng)計(jì)方法。比如有人認(rèn)為,傳統(tǒng)的統(tǒng)計(jì)方法講究抽樣,但是大數(shù)據(jù)使得我們可以對(duì)接近總量的數(shù)據(jù)進(jìn)行分析,這樣進(jìn)行抽樣調(diào)查的需求就會(huì)減少;還有人認(rèn)為,傳統(tǒng)的統(tǒng)計(jì)分析注重因果關(guān)系,但大數(shù)據(jù)情況下,只需明確兩者之間有關(guān)系即可。另外,過(guò)去強(qiáng)調(diào)分析的準(zhǔn)確性,而在大數(shù)據(jù)情況下,允許存在一定的誤差,等等。
我認(rèn)為,大數(shù)據(jù)對(duì)統(tǒng)計(jì)學(xué)帶來(lái)的上述挑戰(zhàn)確實(shí)存在,但是不會(huì)導(dǎo)致傳統(tǒng)抽樣調(diào)查的需求減少。因?yàn)榇髷?shù)據(jù)雖然數(shù)據(jù)量很大,但絕大多數(shù)情況下這些大樣本都不是隨機(jī)的,推斷總體都有系統(tǒng)偏差,因而抽樣調(diào)查等統(tǒng)計(jì)方法仍然是不可取代的。此外,在很多時(shí)候,科研和商業(yè)應(yīng)用、科學(xué)決策還是需要進(jìn)行準(zhǔn)確的統(tǒng)計(jì)分析的。
從人才培養(yǎng)的角度看,統(tǒng)計(jì)學(xué)在教學(xué)內(nèi)容、教學(xué)方法、人才培養(yǎng)模式等方面需要進(jìn)行變革,以適應(yīng)大數(shù)據(jù)時(shí)代的人才素質(zhì)要求,這是統(tǒng)計(jì)學(xué)科發(fā)展面臨的另一挑戰(zhàn)。