職業聚光燈:我作為資料科學家的工作

在矽谷的任何一家咖啡店坐一會兒,毫無疑問你會無意中聽到有人在談論資料分析。是什麼?誰在處理這些數字?資料科學家的工作是在大量資料中發現模式,並將其與現實世界的決策聯絡起來。...
Illustration for article titled Career Spotlight: What I Do as a Data Scientist

在矽谷的任何一家咖啡店坐一會兒,毫無疑問你會無意中聽到有人在談論資料分析。是什麼?誰在處理這些數字?資料科學家的工作是在大量資料中發現模式,並將其與現實世界的決策聯絡起來。

在大量資料中尋找趨勢是一個非常簡單的概念,但在執行中肯定很困難。為了進一步瞭解資料科學家的工作,我們採訪了丹·馬林格(Dan Mallinger),他從事Think Big的資料科學實踐,利用自己的學術背景幫助諮詢商業和工程決策。

告訴我們一些你自己和你的經歷。

我是一名資料科學家,擁有數學科學和組織心理學學位;我還接受過電腦科學和社會學方面的重要學術培訓。我的職業生涯是在統計、分析和技術領域度過的,但幾乎完全是在商業集團的領導下度過的,這也為我的職業前景奠定了基礎。今天,我是Think Big的資料科學總監,已經在公司工作了四年。

是什麼驅使你選擇職業道路?

我一生中的大部分時間都對人類的組織有著好奇心,對定量決策有著濃厚的興趣。在大學裡,我是一個想把阿克塞爾羅德和漢密爾頓的社會學和社會心理學研究成果應用於博弈論課程的學生。致力於幫助企業成為資料驅動型企業似乎是這種身份的專業延伸。

你是怎麼找到工作的?你需要什麼樣的教育和經驗?

在職業上,我在職業生涯的早期從事統計、研究和技術方面的工作。我的工作與我現在的工作類似,即用開源技術分析真實世界的資料,但在“資料科學家”這個詞出現之前。從那以後,我在2010年進入了大資料領域,但我花了一年左右的時間才真正體會到Hadoop和類似工具能為資料科學做些什麼。在那之後,我與Think Big的總裁Rick Farnell碰面,他讓我非常興奮,因為資料科學在企業中產生了巨大的影響,他在專業服務領域建立了一個資料科學團隊。雖然我的統計和技術經驗很重要,但我認為我在社會科學方面的教育和與商業團隊合作的經驗對我的角色最為關鍵。它們使我能夠思考各種挑戰,思考數學背後的機構,並著眼於組織內部的運作。

除了正常人所看到的,你會做什麼?你大部分時間都在做什麼?

大多數人都聽說過“資料爭論”,現在知道它是執行資料科學的重要組成部分。然而,許多人不知道跨職能的資料科學是如何的,以及在協調業務、分析和技術團隊方面花費了多少時間。尤其是在企業中,團隊有多個相互競爭的議程,讓這些團隊說相同的語言並調整優先順序是工作的重要部分。

人們對你的工作常有哪些誤解?

資料科學中最大的一個誤解是,它完全是關於“演算法”的。我經常遇到一些人和未來的資料科學家,他們認為我們的工作是在神經網路和支援向量機之間做出決定。事實上,資料科學從將商業案例轉化為分析議程開始。與選擇演算法相比,開發假設、理解資料、探索模式和衡量影響所花費的時間要多得多。

什麼是你的平均工作時間(your average work hours)?

資料科學家是專業人士,應該期待一週的專業工作。如今,這似乎是每週60小時。

哪些個人小貼士和捷徑讓你的工作更輕鬆?

有兩個小貼士可以讓我們的團隊更輕鬆地完成資料科學的工作:第一,保持一個內部部落格,在那裡可以快速記錄每天的結果(即使有視覺效果)。這些不是正式的報告,而是隨時間推移的見解的臨時文件,支援跨資料科學、專案經理等對見解和資料的共同理解。它還支援其他科學家在以後幾個月內檢視相同的資料。

第二個技巧是在做任何建模之後**一個“runbook”。這是執行什麼模型、為什麼開發它們以及如何重覆所做的任何分析的文件。這確保了我們的工作是可重覆的,即使是你自己。當你忙的時候,很容易忘記三個月前的分析。

你與同事或同行有什麼不同?他們會怎麼做?

我花在追求新技術上的時間比我的許多同齡人都少。相反,我專註於一個我熟悉的核心集合。今天,Hadoop上的Hive、R和Python等工具讓我受益匪淺。我看到團隊在嘗試“新”的方法時失去了無數的週期,他們花更多的時間嘗試讓新技術發揮作用,而不是在方法上創新。這是一個微妙的平衡,但我儘量等到看到新工具的合理應用,而不是等到我感到現有工具不足的痛苦。

工作中最糟糕的部分是什麼?你怎麼處理?

作為一名資料科學家,最令人沮喪的事情是建立模型或做一些不屬於組織正在進行的過程的工作。雖然一定數量的資料科學是研發,但我們希望我們的工作有意義,並被組織所利用。典型的例子是Netflix獎,它從來沒有實施,因為它被認為是太昂貴(雖然肯定有在行業內的重要性)。為瞭解決這個問題,我們在開始一個專案之前會列出清單。這些確保我們瞭解業務案例,有與結果相關的關鍵績效指標(KPI),並且有一條可操作的道路,以確保我們的工作是完整和持久的。

工作中最令人愉快的部分是什麼?

我喜歡看到客戶變得資料驅動。客戶現在擁有執行的模型、支援回答問題的工具,並且已經開發出有意義的流程,將它們從資料到KPI再到決策。這是資料科學的真正目標,看到它的實際應用是很美好的。

你對那些需要你服務的人有什麼建議嗎?

很少有人談論的一件事是資料科學中的人員流失率(人們離職)有多高。雖然這其中的一些原因可以用競爭性市場來解釋,但我早就相信,這很大程度上是因為企業在制定使用資料科學家的計劃之前就**了資料科學家,或者期望資料科學家解決泡沫帶來的商業困境。我經常看到客戶組織中的資料科學家,他們坐在技術小組中,**的模型從來沒有以一種有意義的方式使用過。我看到這些團體因缺乏使命而解散。

你不會僱水管工給你蓋房子;你希望他們與其他專業人士合作,甚至由建築師指導。同樣,不要讓一個資料科學家來幫你建立一個企業。你的工作職責很可能是尋找統計和技術技能。在你開始招聘之前,就要有一個目標和計劃,把這些技能和你的業務驅動因素結合起來。

一個人在你的工作中能掙到什麼樣的錢?

這當然是一個不同的角色,但報酬很高。即使是第一年的資料科學家通常也能賺8萬美元。經驗豐富的資料科學家的薪水因他們在組織中所處的位置而異。那些在技術上起領導作用的團隊肯定能賺兩倍多。但是,收入最高的資料科學家是那些已經學會在商業領域工作的人,類似於分析在企業中的典型結構。這些可以達到40萬美元。

你是如何在你的領域裡晉升的?

有多條路徑。一些資料科學家坐在技術組織(對於那些在大資料空間中更常見)並有著與許多工程師一樣的增長路徑——提升到團隊管理。其他的則是業務下工作(類似於企業中傳統分析的結構),可能會發展到管理層、解決方案和產品所有權等。我不知道我們是否已經看到過從這個新領域到首席分析官(至少在大公司)的許多提升路徑,但我懷疑這些途徑會來自業務方面。

你的客戶認為什麼價值過低/過高?

他們低估了明確定義和溝通KPI的重要性。這些吞吐量的度量,而不是輸出,是資料科學家最有可能度量和交流的關於模型影響的東西。在企業中,生產能力和收入之間的關係是複雜的,評估起來也很慢。有了明確定義的KPI,資料科學和業務之間的溝通就成為中心,建立了明確的任務和目標,是資料驅動的核心。它還幫助資料科學家回答一個經常被問到的問題:“我什麼時候停止迭代一個模型?”當模型效能超過一個百分比或錯誤率時,當它是一個KPI時,人們可以清楚地識別成功,或者,當一個人在旋轉輪子時。

你會給那些有志於加入你的職業的人什麼建議?

學習分析和溝通的時間和學習模型的時間一樣多。機器學習的普及導致了一大批資料科學家對分析資料的計算機抱著幻想,但卻無法交流結果。我見過一些資料科學家試圖透過教C-levels什麼是隨機森林(有明顯的輻射)來解釋結果。溝通分析不是教你的執行長成為一名資料科學家,而是解釋模型並將其與重要的結果聯絡起來。可悲的是,即使是與此相關的統計方法,如敏感性和穩健性分析,也被遺忘了,因為“演算法”在許多資料科學課程中佔據主導地位。


圖片改編自尼莫(皮克斯灣)。

  • 發表於 2021-05-19 11:27
  • 閱讀 ( 52 )
  • 分類:網際網路

你可能感興趣的文章

5門課程對資料科學的溫和介紹

... 再加上更多的職業導向,你想成為一名資料科學家嗎?關於Udemy的免費課程應該能回答你更多的問題。 ...

  • 發佈於 2021-03-17 16:12
  • 閲讀 ( 60 )

職業聚光燈:我作為一名高管護衛的工作

...。一位“高管保護專家”主動聯絡我們,與我們分享他的職業生涯,並解釋在安全行業工作的感受。告訴我們你目前的職位,以及你在這工作多久了。目前,我是南加州一位高凈值商人的高管保護專家(EPS)。EP專家是大多數人...

  • 發佈於 2021-05-17 07:36
  • 閲讀 ( 46 )

作為一名資料科學家,你需要的技能和期望的薪水

資料科學是一個不斷增長的職業領域,它的報酬很高。如果你對程式設計、數學和/或統計感興趣,這個職業對你來說是完美的。然而,有三種不同的資料科學角色供您考慮。Springboard解釋說,資料科學團隊解決資料問題,例如建...

  • 發佈於 2021-05-17 10:04
  • 閲讀 ( 42 )

職業聚光燈:我作為財務顧問的工作

...20多年。我從研究生畢業就開始做華爾街交易員,在我的職業生涯中做過各種各樣的工作。在2011年加入美林之前,我在瑞銀擔任了10多年的領導職務,包括擔任總裁辦公室主任。雖然這個角色很難離開,但我冒險加入了美林。這...

  • 發佈於 2021-05-17 18:05
  • 閲讀 ( 50 )

職業聚光燈:我作為一名放射學家的工作

...建立的最大的協作放射學資源。是什麼驅使你選擇了你的職業道路,你是如何找到工作的?你需要什麼樣的教育和經驗?我基本上是在醫學和放射學兩個方面都碰上了。當我還是一個13歲的男孩的時候,我覺得切開別人的頭骨聽...

  • 發佈於 2021-05-17 21:11
  • 閲讀 ( 54 )

職業聚光燈:我作為911排程員的工作

...趕到現場,讓每個人都瞭解最新情況。是什麼驅使你選擇職業道路?我選擇這個職業是因為我真的想幫助別人,事實上我開始上學是為了成為一名消防員,但作為我所在地區的一名消防員,你也必須是一名急救醫療技術員。我開...

  • 發佈於 2021-05-18 00:15
  • 閲讀 ( 45 )

職業聚光燈:我作為天體物理學家的工作

...他研究領域,與其他研究人員建立聯絡,並通常開始你的職業生涯。我在加州理工大學舊金山州立大學做過博士後,現在我又回到華碩,成為一個大型研究網路(稱為NExSS)的成員。是什麼驅使你選擇職業道路?聽上去老生常談...

  • 發佈於 2021-05-18 00:58
  • 閲讀 ( 48 )

職業聚光燈:我作為一名土地測量師的工作

...地塊邊界的過程。這是一個有著獨特的身體和智力挑戰的職業。我們需要知道如何解釋密集的立法或計算一個複雜的螺旋曲線,但也要知道如何銳化彎刀或挖掘凍土與霜棒!有關不列顛哥倫比亞土地測量的更多資訊,請訪問不列...

  • 發佈於 2021-05-18 02:29
  • 閲讀 ( 64 )

職業聚光燈:我作為一名製造工程師的工作

當一個裝置執行良好時,你可能很少考慮它是如何**的,更不用說成千上萬的裝置是如何**的了。公眾對設計的重視有很多,但搞清楚如何大規模複製某些東西本身就是一項工程壯舉。...

  • 發佈於 2021-05-18 09:43
  • 閲讀 ( 49 )

職業聚光燈:我作為私人教練所做的

...動專案的大型藥物試驗擔任專案助理。是什麼驅使你選擇職業道路?影響我對健身行業興趣的主要轉折點來自於我在背部創傷後進行物理治療的經歷。透過我在康復方面的經歷,我逐漸認識到物理治療在恢復整體能力方面的重要...

  • 發佈於 2021-05-18 10:45
  • 閲讀 ( 50 )
倫嘉康思
倫嘉康思

0 篇文章

作家榜

  1. admin 0 文章
  2. 孫小欽 0 文章
  3. JVhby0 0 文章
  4. fvpvzrr 0 文章
  5. 0sus8kksc 0 文章
  6. zsfn1903 0 文章
  7. w91395898 0 文章
  8. SuperQueen123 0 文章

相關推薦