來源:大數(shù)據(jù)文摘 時(shí)間:2017-07-04 16:30:45 作者:
如果你希望在數(shù)據(jù)科學(xué)方面開始職業(yè)生涯,你可以通過避免以下9個(gè)代價(jià)大的初學(xué)者易犯錯(cuò)誤,來減少你數(shù)天,數(shù)周甚至數(shù)月的痛苦折磨。
但是如果你不足夠小心,這些錯(cuò)誤將會(huì)浪費(fèi)你最寶貴的資源:你的時(shí)間、精力和動(dòng)力。
我們將這9個(gè)錯(cuò)誤分為三種類型:
學(xué)習(xí)中的錯(cuò)誤
申請工作中的錯(cuò)誤
工作面試中的錯(cuò)誤
在學(xué)習(xí)數(shù)據(jù)科學(xué)時(shí)
第一種錯(cuò)誤比較隱蔽很難被發(fā)現(xiàn)。它產(chǎn)生于人們對數(shù)據(jù)科學(xué)相關(guān)領(lǐng)域的錯(cuò)誤印象,并且會(huì)慢慢地不露聲色地耗盡你的時(shí)間和精力。
1.在理論上花太多的時(shí)間
許多初學(xué)者陷入了理論研究并花費(fèi)了太多的時(shí)間,包括數(shù)學(xué)相關(guān)的(線性代數(shù),統(tǒng)計(jì)學(xué)等)也包括機(jī)器學(xué)習(xí)相關(guān)的(算法,積分等)理論。
這種方法效率低下有三個(gè)主要原因:
首先,(學(xué)習(xí)理論)是緩慢而令人氣餒的。如果你曾經(jīng)感到對所有東西都一頭霧水,你可能陷入了這個(gè)學(xué)習(xí)陷阱。
第二,你也不會(huì)記住這些概念。數(shù)據(jù)科學(xué)是一個(gè)應(yīng)用領(lǐng)域,鞏固技能的最佳方法是實(shí)踐。
最后,你很可能失去動(dòng)力然后放棄,如果你一直無法看到怎樣將你所學(xué)的知識聯(lián)系到現(xiàn)實(shí)世界的話。
傳統(tǒng)上這種重理論的研究方法在學(xué)術(shù)界較普遍,但大多數(shù)從業(yè)者還是更適合結(jié)果導(dǎo)向的思維模式。
為了避免這個(gè)錯(cuò)誤:
平衡研究學(xué)習(xí)與實(shí)踐項(xiàng)目。
別怕知識不完整。隨著學(xué)習(xí)進(jìn)度,你自然會(huì)填補(bǔ)空白。
了解每個(gè)部分在整體框架中的作用。
2.寫了太多從零開始寫的算法
第二個(gè)錯(cuò)誤也會(huì)導(dǎo)致學(xué)生只見樹木不見森林。一開始,你完全不需要從零開始編寫每個(gè)算法。
雖然說為了學(xué)習(xí)這樣寫一些算法是很好的,但現(xiàn)實(shí)是算法正在成為商品。得益于成熟的機(jī)器學(xué)習(xí)庫和基于云的解決方案,大多數(shù)從業(yè)人員事實(shí)上都不會(huì)從零開始編寫算法。
今天,了解如何在合適的情況下(以正確的方式)應(yīng)用正確的算法更為重要。
為了避免這個(gè)錯(cuò)誤:
使用通用機(jī)器學(xué)習(xí)庫,如Scikit-Learn(Python)或Caret(R)。
如果你要從零開始編寫一個(gè)算法,要明白這樣做是為了學(xué)習(xí)而不是提高應(yīng)用操作。
了解現(xiàn)代機(jī)器學(xué)習(xí)算法的發(fā)展前景及其優(yōu)缺點(diǎn)。
3.直接跳進(jìn)深水區(qū)
有些人進(jìn)入數(shù)據(jù)科學(xué)這個(gè)領(lǐng)域是因?yàn)樗麄兿胍獦?gòu)建未來科技:無人駕駛汽車,高級機(jī)器人,計(jì)算機(jī)視覺等。這些技術(shù)由深度學(xué)習(xí)和自然語言處理等技術(shù)驅(qū)動(dòng)。
但是,掌握基本原理很重要。每個(gè)奧運(yùn)跳水運(yùn)動(dòng)員都需要先學(xué)習(xí)如何游泳,道理是一樣的。
為了避免這個(gè)錯(cuò)誤:
首先掌握作為高級課題基石的“經(jīng)典”機(jī)器學(xué)習(xí)的技術(shù)和算法。
知道經(jīng)典機(jī)器學(xué)習(xí)仍然具有巨大的開發(fā)潛力。雖然算法已經(jīng)成熟,但我們?nèi)匀惶幱陂_發(fā)有成效的應(yīng)用方法的早期階段。
學(xué)習(xí)一種系統(tǒng)的方法來解決任何形式的機(jī)器學(xué)習(xí)問題
非專業(yè)人士請勿模仿
申請工作時(shí)
以下錯(cuò)誤都可能導(dǎo)致你在求職過程中錯(cuò)過一些很好的機(jī)會(huì)。即使你完全合格,你也可以通過避免這些雷區(qū)來最大限度地發(fā)揮你的優(yōu)勢。
4.在簡歷中使用過多的技術(shù)術(shù)語
許多申請人在寫簡歷時(shí)最大的錯(cuò)誤是使用過多的技術(shù)術(shù)語。
相反,你的簡歷應(yīng)該把自己描繪清楚,簡歷中的要點(diǎn)應(yīng)該講述一個(gè)故事。你的簡歷應(yīng)該說明你能為組織帶來的影響,特別是如果你申請的是初級職位。
為了避免這個(gè)錯(cuò)誤:
不要簡單地列出你使用的編程語言或編程庫。描述你如何使用它們并解釋結(jié)果。
少即是多。強(qiáng)調(diào)最重要的技能,可刪除其他內(nèi)容使之更突出。
制作簡歷匯總版本,以便你可以針對不同崗位分離出不同的定制版本。這保持每個(gè)版本干凈。
5.高估學(xué)位的價(jià)值
有時(shí),畢業(yè)生可能高估了他們學(xué)位的價(jià)值。雖然擁有相關(guān)領(lǐng)域強(qiáng)有力的學(xué)位肯定會(huì)提高你的機(jī)會(huì),但這并不是充分條件,也不是最重要的因素。
這里要說清楚的是,我們并不是說畢業(yè)生們傲慢自大...
在大多數(shù)情況下,學(xué)術(shù)環(huán)境中所教授的與企業(yè)中應(yīng)用的機(jī)器學(xué)習(xí)是截然不同的。在企業(yè)中需要權(quán)衡截止期限、客戶和技術(shù)障礙,而這些在學(xué)術(shù)界中并不需要。
為了避免這個(gè)錯(cuò)誤:
通過大量現(xiàn)實(shí)世界數(shù)據(jù)項(xiàng)目實(shí)踐來輔助課程。
學(xué)習(xí)一種系統(tǒng)的解決機(jī)器學(xué)習(xí)問題的方法。
參加相關(guān)實(shí)習(xí),即使是兼職。
在領(lǐng)英上約當(dāng)?shù)氐臄?shù)據(jù)科學(xué)家出來喝咖啡聊聊天。
6.搜索(潛在工作機(jī)會(huì)的)范圍太狹窄
數(shù)據(jù)科學(xué)是一個(gè)相對較新的領(lǐng)域,而且這個(gè)組織仍在不斷發(fā)展,以適應(yīng)日益增長的數(shù)據(jù)影響。如果你只搜索以“數(shù)據(jù)科學(xué)家”開頭的職位,那么你可能漏掉了更多可能。
許多職位沒有被標(biāo)注為“數(shù)據(jù)科學(xué)”,但是它們可以讓你在類似的崗位發(fā)展相似的技能。
為了避免這個(gè)錯(cuò)誤:
按所需技能進(jìn)行搜索(機(jī)器學(xué)習(xí),數(shù)據(jù)可視化,SQL等)。
按工作職責(zé)進(jìn)行搜索(預(yù)測建模,A/B測試,數(shù)據(jù)分析等)。
按崗位使用的技術(shù)進(jìn)行搜索(Python,R,Scikit-Learn,Keras等)。
按職位進(jìn)行搜索(數(shù)據(jù)分析師,量化分析師,機(jī)器學(xué)習(xí)工程師等)。
面試期間
最后一類錯(cuò)誤則是面試中的絆腳石。你已經(jīng)披荊斬棘走到這一步,所以現(xiàn)在是時(shí)候完美收官了。
7.對討論項(xiàng)目毫無準(zhǔn)備
在回答“你會(huì)如何做”這類面試問題時(shí),最保險(xiǎn)的做法是用你參與的項(xiàng)目作為例子。你應(yīng)該用一些具體的例子來說明你是怎么處理某些情況而不是用假設(shè)來闡述。
此外,許多招聘經(jīng)理會(huì)要求你有自立的能力,因?yàn)閿?shù)據(jù)科學(xué)這個(gè)角色天然包括項(xiàng)目管理的要素。這意味著你應(yīng)該了解整個(gè)數(shù)據(jù)科學(xué)工作流程,并知道如何將所有內(nèi)容整理在一起。
為了避免這個(gè)錯(cuò)誤:
完成完整的項(xiàng)目,保證你練習(xí)了每一個(gè)重要的步驟(即數(shù)據(jù)清理,模型訓(xùn)練等)。
組織你的方法論。數(shù)據(jù)科學(xué)應(yīng)該是反復(fù)論證過的,而不是偶然的。
回顧并且練習(xí)描述你過去在實(shí)習(xí),工作或課程中參與的項(xiàng)目。
8.低估知識領(lǐng)域的價(jià)值
擁有開發(fā)技術(shù)技能和機(jī)器學(xué)習(xí)知識是獲得數(shù)據(jù)科學(xué)職位的基本先決條件。但是,要真正脫穎而出,你應(yīng)該對你申請的具體行業(yè)了解更多。
記住,數(shù)據(jù)科學(xué)從來不存在于虛無中。
為了避免這個(gè)錯(cuò)誤:
如果你要面試一個(gè)銀行的職位,請刷一些基本的財(cái)務(wù)概念。
如果你要面試一個(gè)財(cái)富500強(qiáng)企業(yè)的戰(zhàn)略崗位,做一些案例練習(xí)并且學(xué)習(xí)一下企業(yè)利潤的驅(qū)動(dòng)因素。
如果你要面試一家創(chuàng)業(yè)公司,了解其市場,并嘗試了解如何幫其獲得競爭優(yōu)勢。
簡而言之,一點(diǎn)點(diǎn)額外的努力就可以帶來很大的好處!
9.忽視溝通技巧
目前,在大多數(shù)企業(yè)中,與開發(fā)團(tuán)隊(duì)或分析師團(tuán)隊(duì)相比,數(shù)據(jù)科學(xué)團(tuán)隊(duì)仍然很小。因此,不同于初級軟件工程師被高級軟件工程師直接管理,數(shù)據(jù)科學(xué)家往往在職能更交叉的崗位中工作。
而且面試官還會(huì)期待你具備與不同技術(shù)和數(shù)學(xué)背景的同事溝通的能力。
為了避免這個(gè)錯(cuò)誤:
練習(xí)向非專業(yè)人員解釋技術(shù)概念。例如,嘗試向朋友解釋你最喜歡的算法。
準(zhǔn)備好常見面試問題的回答要點(diǎn),并練習(xí)表述你的答案。
練習(xí)分析各種數(shù)據(jù)集,提取關(guān)鍵特征并展示你的發(fā)現(xiàn)。
結(jié)論
在本指南中,你學(xué)習(xí)了數(shù)據(jù)科學(xué)初學(xué)者最常犯的9個(gè)錯(cuò)誤:
在理論上花太多的時(shí)間。
寫了太多從零開始寫的算法。
直接進(jìn)入深水區(qū),例如,深度學(xué)習(xí)(速度太快了!)。
在簡歷中使用過多的技術(shù)術(shù)語。
高估學(xué)位的價(jià)值。
搜索(潛在工作機(jī)會(huì)的)范圍太狹窄。
對討論的項(xiàng)目毫無準(zhǔn)備。
低估知識領(lǐng)域的價(jià)值。
忽視溝通技巧。
責(zé)任編輯:陳近梅