10月8日晚,上海交通大學(xué)數(shù)學(xué)科學(xué)學(xué)院副教授、碩士研究生導(dǎo)師林建忠應(yīng)母校邀請(qǐng)?jiān)趫D書館小報(bào)告廳作了主題為“大數(shù)據(jù)分析的原理與應(yīng)用——稀疏線性模型的變量選擇與特征提取”的學(xué)術(shù)報(bào)告暨數(shù)統(tǒng)學(xué)院博力學(xué)術(shù)論壇第二場(chǎng)學(xué)術(shù)報(bào)告會(huì)。報(bào)告會(huì)由黨委副書記涂道勇主持,部分本科生及研究生,共135人參加。
報(bào)告會(huì)上,林建忠首先從生物醫(yī)學(xué)、經(jīng)濟(jì)和金融等方面介紹了大數(shù)據(jù)的背景,用一些例子說明了大數(shù)據(jù)下自變量的多樣性,從而介紹了嶺回歸、Lasso和彈性網(wǎng)等方法來解決稀疏變量的選取問題,并依次介紹了這三種方法的理論思路及實(shí)踐應(yīng)用:嶺回歸對(duì)線性模型的系數(shù)加了一個(gè)L2范式約束,通過偏置-方差的平衡方法來達(dá)到更好的預(yù)測(cè)性能;Lasso對(duì)系數(shù)加了一個(gè)L1范式的約束,使部分系數(shù)取0,能自動(dòng)進(jìn)行特征選擇;彈性網(wǎng)是結(jié)合了嶺回歸和Lasso的正則化方法,彈性網(wǎng)可以自動(dòng)進(jìn)行特征篩選,能夠約束模型系數(shù),并且能同時(shí)選擇關(guān)聯(lián)的預(yù)測(cè)變量。
林建忠由表及里、由淺入深的講解,激起了同學(xué)們對(duì)大數(shù)據(jù)的興趣,擴(kuò)展了大家對(duì)大數(shù)據(jù)處理方式的視野。最后,報(bào)告在熱烈的掌聲中結(jié)束。(文\周姬)