精品无人区无码乱码毛片国产_性做久久久久久免费观看_天堂中文在线资源_7777久久亚洲中文字幕

首頁 自媒自媒體大數(shù)據(jù)文摘正文

快速入行數(shù)據(jù)科學(xué),老司機(jī)帶你避開這九個(gè)大坑!

  如果你希望在數(shù)據(jù)科學(xué)方面開始職業(yè)生涯,你可以通過避免以下9個(gè)代價(jià)大的初學(xué)者易犯錯(cuò)誤,來減少你數(shù)天,數(shù)周甚至數(shù)月的痛苦折磨。

  但是如果你不足夠小心,這些錯(cuò)誤將會(huì)浪費(fèi)你最寶貴的資源:你的時(shí)間、精力和動(dòng)力。

  我們將這9個(gè)錯(cuò)誤分為三種類型:

  學(xué)習(xí)中的錯(cuò)誤

  申請工作中的錯(cuò)誤

  工作面試中的錯(cuò)誤

  在學(xué)習(xí)數(shù)據(jù)科學(xué)時(shí)

  第一種錯(cuò)誤比較隱蔽很難被發(fā)現(xiàn)。它產(chǎn)生于人們對數(shù)據(jù)科學(xué)相關(guān)領(lǐng)域的錯(cuò)誤印象,并且會(huì)慢慢地不露聲色地耗盡你的時(shí)間和精力。

  1.在理論上花太多的時(shí)間

  許多初學(xué)者陷入了理論研究并花費(fèi)了太多的時(shí)間,包括數(shù)學(xué)相關(guān)的(線性代數(shù),統(tǒng)計(jì)學(xué)等)也包括機(jī)器學(xué)習(xí)相關(guān)的(算法,積分等)理論。

  這種方法效率低下有三個(gè)主要原因:

  首先,(學(xué)習(xí)理論)是緩慢而令人氣餒的。如果你曾經(jīng)感到對所有東西都一頭霧水,你可能陷入了這個(gè)學(xué)習(xí)陷阱。

  第二,你也不會(huì)記住這些概念。數(shù)據(jù)科學(xué)是一個(gè)應(yīng)用領(lǐng)域,鞏固技能的最佳方法是實(shí)踐。

  最后,你很可能失去動(dòng)力然后放棄,如果你一直無法看到怎樣將你所學(xué)的知識聯(lián)系到現(xiàn)實(shí)世界的話。

  傳統(tǒng)上這種重理論的研究方法在學(xué)術(shù)界較普遍,但大多數(shù)從業(yè)者還是更適合結(jié)果導(dǎo)向的思維模式。

  為了避免這個(gè)錯(cuò)誤:

  平衡研究學(xué)習(xí)與實(shí)踐項(xiàng)目。

  別怕知識不完整。隨著學(xué)習(xí)進(jìn)度,你自然會(huì)填補(bǔ)空白。

  了解每個(gè)部分在整體框架中的作用。

  2.寫了太多從零開始寫的算法

  第二個(gè)錯(cuò)誤也會(huì)導(dǎo)致學(xué)生只見樹木不見森林。一開始,你完全不需要從零開始編寫每個(gè)算法。

  雖然說為了學(xué)習(xí)這樣寫一些算法是很好的,但現(xiàn)實(shí)是算法正在成為商品。得益于成熟的機(jī)器學(xué)習(xí)庫和基于云的解決方案,大多數(shù)從業(yè)人員事實(shí)上都不會(huì)從零開始編寫算法。

  今天,了解如何在合適的情況下(以正確的方式)應(yīng)用正確的算法更為重要。

  為了避免這個(gè)錯(cuò)誤:

  使用通用機(jī)器學(xué)習(xí)庫,如Scikit-Learn(Python)或Caret(R)。

  如果你要從零開始編寫一個(gè)算法,要明白這樣做是為了學(xué)習(xí)而不是提高應(yīng)用操作。

  了解現(xiàn)代機(jī)器學(xué)習(xí)算法的發(fā)展前景及其優(yōu)缺點(diǎn)。

  3.直接跳進(jìn)深水區(qū)

  有些人進(jìn)入數(shù)據(jù)科學(xué)這個(gè)領(lǐng)域是因?yàn)樗麄兿胍獦?gòu)建未來科技:無人駕駛汽車,高級機(jī)器人,計(jì)算機(jī)視覺等。這些技術(shù)由深度學(xué)習(xí)和自然語言處理等技術(shù)驅(qū)動(dòng)。

  但是,掌握基本原理很重要。每個(gè)奧運(yùn)跳水運(yùn)動(dòng)員都需要先學(xué)習(xí)如何游泳,道理是一樣的。

  為了避免這個(gè)錯(cuò)誤:

  首先掌握作為高級課題基石的“經(jīng)典”機(jī)器學(xué)習(xí)的技術(shù)和算法。

  知道經(jīng)典機(jī)器學(xué)習(xí)仍然具有巨大的開發(fā)潛力。雖然算法已經(jīng)成熟,但我們?nèi)匀惶幱陂_發(fā)有成效的應(yīng)用方法的早期階段。

  學(xué)習(xí)一種系統(tǒng)的方法來解決任何形式的機(jī)器學(xué)習(xí)問題

  非專業(yè)人士請勿模仿

  申請工作時(shí)

  以下錯(cuò)誤都可能導(dǎo)致你在求職過程中錯(cuò)過一些很好的機(jī)會(huì)。即使你完全合格,你也可以通過避免這些雷區(qū)來最大限度地發(fā)揮你的優(yōu)勢。

  4.在簡歷中使用過多的技術(shù)術(shù)語

  許多申請人在寫簡歷時(shí)最大的錯(cuò)誤是使用過多的技術(shù)術(shù)語。

  相反,你的簡歷應(yīng)該把自己描繪清楚,簡歷中的要點(diǎn)應(yīng)該講述一個(gè)故事。你的簡歷應(yīng)該說明你能為組織帶來的影響,特別是如果你申請的是初級職位。

  為了避免這個(gè)錯(cuò)誤:

  不要簡單地列出你使用的編程語言或編程庫。描述你如何使用它們并解釋結(jié)果。

  少即是多。強(qiáng)調(diào)最重要的技能,可刪除其他內(nèi)容使之更突出。

  制作簡歷匯總版本,以便你可以針對不同崗位分離出不同的定制版本。這保持每個(gè)版本干凈。

  5.高估學(xué)位的價(jià)值

  有時(shí),畢業(yè)生可能高估了他們學(xué)位的價(jià)值。雖然擁有相關(guān)領(lǐng)域強(qiáng)有力的學(xué)位肯定會(huì)提高你的機(jī)會(huì),但這并不是充分條件,也不是最重要的因素。

  這里要說清楚的是,我們并不是說畢業(yè)生們傲慢自大...

  在大多數(shù)情況下,學(xué)術(shù)環(huán)境中所教授的與企業(yè)中應(yīng)用的機(jī)器學(xué)習(xí)是截然不同的。在企業(yè)中需要權(quán)衡截止期限、客戶和技術(shù)障礙,而這些在學(xué)術(shù)界中并不需要。

  為了避免這個(gè)錯(cuò)誤:

  通過大量現(xiàn)實(shí)世界數(shù)據(jù)項(xiàng)目實(shí)踐來輔助課程。

  學(xué)習(xí)一種系統(tǒng)的解決機(jī)器學(xué)習(xí)問題的方法。

  參加相關(guān)實(shí)習(xí),即使是兼職。

  在領(lǐng)英上約當(dāng)?shù)氐臄?shù)據(jù)科學(xué)家出來喝咖啡聊聊天。

  6.搜索(潛在工作機(jī)會(huì)的)范圍太狹窄

  數(shù)據(jù)科學(xué)是一個(gè)相對較新的領(lǐng)域,而且這個(gè)組織仍在不斷發(fā)展,以適應(yīng)日益增長的數(shù)據(jù)影響。如果你只搜索以“數(shù)據(jù)科學(xué)家”開頭的職位,那么你可能漏掉了更多可能。

  許多職位沒有被標(biāo)注為“數(shù)據(jù)科學(xué)”,但是它們可以讓你在類似的崗位發(fā)展相似的技能。

  為了避免這個(gè)錯(cuò)誤:

  按所需技能進(jìn)行搜索(機(jī)器學(xué)習(xí),數(shù)據(jù)可視化,SQL等)。

  按工作職責(zé)進(jìn)行搜索(預(yù)測建模,A/B測試,數(shù)據(jù)分析等)。

  按崗位使用的技術(shù)進(jìn)行搜索(Python,R,Scikit-Learn,Keras等)。

  按職位進(jìn)行搜索(數(shù)據(jù)分析師,量化分析師,機(jī)器學(xué)習(xí)工程師等)。

  面試期間

  最后一類錯(cuò)誤則是面試中的絆腳石。你已經(jīng)披荊斬棘走到這一步,所以現(xiàn)在是時(shí)候完美收官了。

  7.對討論項(xiàng)目毫無準(zhǔn)備

  在回答“你會(huì)如何做”這類面試問題時(shí),最保險(xiǎn)的做法是用你參與的項(xiàng)目作為例子。你應(yīng)該用一些具體的例子來說明你是怎么處理某些情況而不是用假設(shè)來闡述。

  此外,許多招聘經(jīng)理會(huì)要求你有自立的能力,因?yàn)閿?shù)據(jù)科學(xué)這個(gè)角色天然包括項(xiàng)目管理的要素。這意味著你應(yīng)該了解整個(gè)數(shù)據(jù)科學(xué)工作流程,并知道如何將所有內(nèi)容整理在一起。

  為了避免這個(gè)錯(cuò)誤:

  完成完整的項(xiàng)目,保證你練習(xí)了每一個(gè)重要的步驟(即數(shù)據(jù)清理,模型訓(xùn)練等)。

  組織你的方法論。數(shù)據(jù)科學(xué)應(yīng)該是反復(fù)論證過的,而不是偶然的。

  回顧并且練習(xí)描述你過去在實(shí)習(xí),工作或課程中參與的項(xiàng)目。

  8.低估知識領(lǐng)域的價(jià)值

  擁有開發(fā)技術(shù)技能和機(jī)器學(xué)習(xí)知識是獲得數(shù)據(jù)科學(xué)職位的基本先決條件。但是,要真正脫穎而出,你應(yīng)該對你申請的具體行業(yè)了解更多。

  記住,數(shù)據(jù)科學(xué)從來不存在于虛無中。

  為了避免這個(gè)錯(cuò)誤:

  如果你要面試一個(gè)銀行的職位,請刷一些基本的財(cái)務(wù)概念。

  如果你要面試一個(gè)財(cái)富500強(qiáng)企業(yè)的戰(zhàn)略崗位,做一些案例練習(xí)并且學(xué)習(xí)一下企業(yè)利潤的驅(qū)動(dòng)因素。

  如果你要面試一家創(chuàng)業(yè)公司,了解其市場,并嘗試了解如何幫其獲得競爭優(yōu)勢。

  簡而言之,一點(diǎn)點(diǎn)額外的努力就可以帶來很大的好處!

  9.忽視溝通技巧

  目前,在大多數(shù)企業(yè)中,與開發(fā)團(tuán)隊(duì)或分析師團(tuán)隊(duì)相比,數(shù)據(jù)科學(xué)團(tuán)隊(duì)仍然很小。因此,不同于初級軟件工程師被高級軟件工程師直接管理,數(shù)據(jù)科學(xué)家往往在職能更交叉的崗位中工作。

  而且面試官還會(huì)期待你具備與不同技術(shù)和數(shù)學(xué)背景的同事溝通的能力。

  為了避免這個(gè)錯(cuò)誤:

  練習(xí)向非專業(yè)人員解釋技術(shù)概念。例如,嘗試向朋友解釋你最喜歡的算法。

  準(zhǔn)備好常見面試問題的回答要點(diǎn),并練習(xí)表述你的答案。

  練習(xí)分析各種數(shù)據(jù)集,提取關(guān)鍵特征并展示你的發(fā)現(xiàn)。

  結(jié)論

  在本指南中,你學(xué)習(xí)了數(shù)據(jù)科學(xué)初學(xué)者最常犯的9個(gè)錯(cuò)誤:

  在理論上花太多的時(shí)間。

  寫了太多從零開始寫的算法。

  直接進(jìn)入深水區(qū),例如,深度學(xué)習(xí)(速度太快了!)。

  在簡歷中使用過多的技術(shù)術(shù)語。

  高估學(xué)位的價(jià)值。

  搜索(潛在工作機(jī)會(huì)的)范圍太狹窄。

  對討論的項(xiàng)目毫無準(zhǔn)備。

  低估知識領(lǐng)域的價(jià)值。

  忽視溝通技巧。

責(zé)任編輯:陳近梅

分享: