5月9日下午,電氣信息學(xué)院在管理學(xué)院報告廳舉辦了《大數(shù)據(jù)技術(shù)與應(yīng)用》專題學(xué)術(shù)講座,邀請吉林建筑大學(xué)計算機(jī)系主任徐勇教授主講。電氣信息學(xué)院計算機(jī)教研室和信息安全教研室全體師生參加了講座。講座由電氣信息學(xué)院副院長劉舒婷主持。

徐勇教授把本次講座分成四個模塊,從大數(shù)據(jù)的來源、什么是大數(shù)據(jù)、大數(shù)據(jù)的應(yīng)用及Hadoop介紹四個方面為師生們進(jìn)行了講解。首先講述了大數(shù)據(jù)的歷史、來源,早在1980年,著名未來學(xué)家托夫勒在其所著的《第三次浪潮》中提出“大數(shù)據(jù)”這個概念,《自然》雜志在2008年9月推出了名為“大數(shù)據(jù)”的封面專欄。徐勇教授特別指出,從2009年開始“大數(shù)據(jù)”成為互聯(lián)網(wǎng)技術(shù)行業(yè)中的熱門詞匯,尤其是針對“大數(shù)據(jù)”的特點,由維克托·邁爾-舍恩伯格和肯尼斯·庫克耶在《“大數(shù)據(jù)”時代》中提出了“大數(shù)據(jù)”的四個典型特征:一是數(shù)據(jù)體量巨大(Volume);二是數(shù)據(jù)類型繁多(Variety);三是價值密度低(Value);四是處理速度快(Velocity)。這便是“大數(shù)據(jù)”著名的4V特點。
接下來,徐勇教授還突出強(qiáng)調(diào)了大數(shù)據(jù)在現(xiàn)代社會的應(yīng)用,他列出社交軟件、商務(wù)軟件、門戶網(wǎng)站等我們現(xiàn)在常用的互聯(lián)網(wǎng)軟件,表明現(xiàn)在的互聯(lián)網(wǎng)公司都是大數(shù)據(jù)公司。他還生動的舉例了身邊的例子,如尿不濕與啤酒,這兩個看來是互不相干的商品,但是如果出現(xiàn)很多父親為小孩買尿不濕順便再買啤酒的信息反饋時,這兩個商品就會在超市里被擺放的比較近一些,它們之間就產(chǎn)生了商業(yè)關(guān)聯(lián)。這些生動的生活事例,展示出目前大數(shù)據(jù)在身邊現(xiàn)實生活中的廣泛用途,徐勇教授繼而談出了現(xiàn)在大數(shù)據(jù)所具有的商業(yè)價值。此外,徐勇教授對Hadoop大數(shù)據(jù)處理軟件進(jìn)行了介紹,并講述了Hadoop的功能與用法。

徐勇教授的專題講座,話題新穎活潑,語言幽默風(fēng)趣,使師生們受到了啟發(fā),開拓了視野。在問答環(huán)節(jié),師生們踴躍提問,各抒己見,徐教授也一一作出解答。同學(xué)們體會說,徐教授的專題講座留給我們許多需要深入思考的問題,比如現(xiàn)在一些大企業(yè)的數(shù)據(jù)量已經(jīng)接近EB量級,而且數(shù)據(jù)類型的多樣性也對數(shù)據(jù)的處理能力提出更高要求;還有數(shù)據(jù)價值密度的高低與數(shù)據(jù)總量的大小成反比,如一小時的視頻,其中有用數(shù)據(jù)可能僅有一二秒,如何通過強(qiáng)大的機(jī)器算法更迅速完成數(shù)據(jù)的價值“提純”,這些都是目前大數(shù)據(jù)背景下亟待解決的難題。當(dāng)然,這些問題也提高了我們進(jìn)一步學(xué)習(xí)的興趣。我們一定會牢記徐教授對大家的寄語,即期望年輕一代在大數(shù)據(jù)時代下要有全新的思維方式,要有“開放性”、“深刻性”與“創(chuàng)新性”的品行。(電氣信息學(xué)院供稿)
