5月9日下午,電氣信息學(xué)院在管理學(xué)院報(bào)告廳舉辦了《大數(shù)據(jù)技術(shù)與應(yīng)用》專(zhuān)題學(xué)術(shù)講座,邀請(qǐng)吉林建筑大學(xué)計(jì)算機(jī)系主任徐勇教授主講。電氣信息學(xué)院計(jì)算機(jī)教研室和信息安全教研室全體師生參加了講座。講座由電氣信息學(xué)院副院長(zhǎng)劉舒婷主持。

徐勇教授把本次講座分成四個(gè)模塊,從大數(shù)據(jù)的來(lái)源、什么是大數(shù)據(jù)、大數(shù)據(jù)的應(yīng)用及Hadoop介紹四個(gè)方面為師生們進(jìn)行了講解。首先講述了大數(shù)據(jù)的歷史、來(lái)源,早在1980年,著名未來(lái)學(xué)家托夫勒在其所著的《第三次浪潮》中提出“大數(shù)據(jù)”這個(gè)概念,《自然》雜志在2008年9月推出了名為“大數(shù)據(jù)”的封面專(zhuān)欄。徐勇教授特別指出,從2009年開(kāi)始“大數(shù)據(jù)”成為互聯(lián)網(wǎng)技術(shù)行業(yè)中的熱門(mén)詞匯,尤其是針對(duì)“大數(shù)據(jù)”的特點(diǎn),由維克托·邁爾-舍恩伯格和肯尼斯·庫(kù)克耶在《“大數(shù)據(jù)”時(shí)代》中提出了“大數(shù)據(jù)”的四個(gè)典型特征:一是數(shù)據(jù)體量巨大(Volume);二是數(shù)據(jù)類(lèi)型繁多(Variety);三是價(jià)值密度低(Value);四是處理速度快(Velocity)。這便是“大數(shù)據(jù)”著名的4V特點(diǎn)。
接下來(lái),徐勇教授還突出強(qiáng)調(diào)了大數(shù)據(jù)在現(xiàn)代社會(huì)的應(yīng)用,他列出社交軟件、商務(wù)軟件、門(mén)戶(hù)網(wǎng)站等我們現(xiàn)在常用的互聯(lián)網(wǎng)軟件,表明現(xiàn)在的互聯(lián)網(wǎng)公司都是大數(shù)據(jù)公司。他還生動(dòng)的舉例了身邊的例子,如尿不濕與啤酒,這兩個(gè)看來(lái)是互不相干的商品,但是如果出現(xiàn)很多父親為小孩買(mǎi)尿不濕順便再買(mǎi)啤酒的信息反饋時(shí),這兩個(gè)商品就會(huì)在超市里被擺放的比較近一些,它們之間就產(chǎn)生了商業(yè)關(guān)聯(lián)。這些生動(dòng)的生活事例,展示出目前大數(shù)據(jù)在身邊現(xiàn)實(shí)生活中的廣泛用途,徐勇教授繼而談出了現(xiàn)在大數(shù)據(jù)所具有的商業(yè)價(jià)值。此外,徐勇教授對(duì)Hadoop大數(shù)據(jù)處理軟件進(jìn)行了介紹,并講述了Hadoop的功能與用法。

徐勇教授的專(zhuān)題講座,話(huà)題新穎活潑,語(yǔ)言幽默風(fēng)趣,使師生們受到了啟發(fā),開(kāi)拓了視野。在問(wèn)答環(huán)節(jié),師生們踴躍提問(wèn),各抒己見(jiàn),徐教授也一一作出解答。同學(xué)們體會(huì)說(shuō),徐教授的專(zhuān)題講座留給我們?cè)S多需要深入思考的問(wèn)題,比如現(xiàn)在一些大企業(yè)的數(shù)據(jù)量已經(jīng)接近EB量級(jí),而且數(shù)據(jù)類(lèi)型的多樣性也對(duì)數(shù)據(jù)的處理能力提出更高要求;還有數(shù)據(jù)價(jià)值密度的高低與數(shù)據(jù)總量的大小成反比,如一小時(shí)的視頻,其中有用數(shù)據(jù)可能僅有一二秒,如何通過(guò)強(qiáng)大的機(jī)器算法更迅速完成數(shù)據(jù)的價(jià)值“提純”,這些都是目前大數(shù)據(jù)背景下亟待解決的難題。當(dāng)然,這些問(wèn)題也提高了我們進(jìn)一步學(xué)習(xí)的興趣。我們一定會(huì)牢記徐教授對(duì)大家的寄語(yǔ),即期望年輕一代在大數(shù)據(jù)時(shí)代下要有全新的思維方式,要有“開(kāi)放性”、“深刻性”與“創(chuàng)新性”的品行。(電氣信息學(xué)院供稿)
