這個問題總能見到一些朋友問。新人問,因為數(shù)據分析這個事兒聽起來挺抽象又很高大上,具體需要做哪些,大家不知道。有些已經在做數(shù)據分析的老人也會問,因為自己當前做的工作和入行之前理解的似乎不太一樣。
今天就系統(tǒng)來說一說這個問題:數(shù)據分析師們,每天到底在干些什么?
如果對數(shù)據分析行業(yè)不太了解,教大家一個最簡單的方法,就是去招聘網站上看數(shù)據分析崗位的招聘要求(這個方法適用于各個行業(yè)),通常來說職位描述中提到的內容,就是該崗位入職后可能需要做的事情。當然,不排除面試造火箭,入職扭螺絲的情況。
下面就進入正題。因為不同行業(yè)(互聯(lián)網、電商、零售、醫(yī)療……)、不同方向(產品、運營、銷售……)的數(shù)據分析崗位之間仍有因業(yè)態(tài)不同而產生的差別,此處不做細分講解,講的是偏業(yè)務型分析師普遍性的工作內容。
比較全面,建議看完。
臨時性需求的溝通和管理。
很多人以為數(shù)據分析就是和數(shù)據打交道,其實不然,溝通需求也是數(shù)據分析師們每天主要的工作內容之一,數(shù)據分析師每天會接收到來自業(yè)務方的各種需求,可以分為數(shù)據支持需求和分析型的需求。
比如運營想看某段時間內xx的xx指標的表現(xiàn)情況,請分析師拉一下相關數(shù)據;某個指標有異動,請分析師歸因;某場活動結束了,幫忙做一個活動數(shù)據復盤……這些臨時的需求在確認、溝通、開會上往往就會占用很多時間,因此深入了解業(yè)務、快速get到業(yè)務的需求和目的,合理地做好需求的管理排期,都是一名優(yōu)秀數(shù)據分析師的必修課。
這里提一個建議:不要一接到需求就無腦執(zhí)行,明確需求才是第一步,不妨多問問需求提供方,究竟要做什么事情、什么目的。在把數(shù)據結果給需求提供方時,再提一句:預計什么時候看到結果和反饋,我們到了那個時間點一起看反饋結果。這樣的完整的過程才談得上是一個閉環(huán)。
數(shù)據提取
數(shù)據提取簡稱取數(shù),就是根據數(shù)據分析的目的或業(yè)務方的需求,從數(shù)據庫中提取所需數(shù)據的過程,可以算是正式數(shù)據分析流程的第一步。但公司的大數(shù)據平臺或者數(shù)據倉庫建設不完善,數(shù)據基礎建設不規(guī)范、或者對業(yè)務庫表的不熟悉等等因素,都會導致數(shù)據提取效率較低,再加上頻繁來自業(yè)務方高頻的取數(shù)需求,這就導致很多人會陷入到取數(shù)的工作中,大家是否聽說過sql boy、茶(查)樹(數(shù))菇(姑)的稱呼,其實就是對陷入取數(shù)怪圈的數(shù)據人的一種戲稱。有些新人雖然掛著數(shù)據分析的title,但每天80%都干的是取數(shù)的工作。工作第一年經常取數(shù)無需憂慮,但是這個狀態(tài)保持3年以上,就一定要爭取轉變了。
數(shù)據處理與分析
數(shù)據處理是指對初步收集到的數(shù)據進行加工、整理,可能是數(shù)據分析過程中最耗費時間的,尤其取決于數(shù)據質量。中小型公司和小數(shù)據量的情況下,數(shù)據分析師們通常會用Excel來處理數(shù)據,在大數(shù)據量的情況下,SQL和python的使用更為常見。
明確好分析目的和分析方法,準備好數(shù)據后,就可以著手開始分析了。分析師們需要通過分析工具、分析方法對數(shù)據進行探索,從中發(fā)現(xiàn)因果關系、內容聯(lián)系和業(yè)務規(guī)律等,為商業(yè)目的提供參考。
對于懂業(yè)務的分析師來說,數(shù)據分析的過程其實不占用太多時間,面對業(yè)務提出來的需求和存在問題,基本能快速明確分析思路。
分析總結
這是一整套數(shù)據分析全流程的終點站,通常一些臨時性的分析需求,數(shù)據分析師們做一個結果和重點明確的需求回復郵件即可;完整的、復雜的數(shù)據分析,一般會使用PPT來制作數(shù)據分析報告,如果涉及到了多位業(yè)務相關人員,還可能需要做presentation。因此抓重點、PPT制作和說話的能力,也是一位優(yōu)秀的數(shù)據分析是不可或缺的。
制作、維護報表
每個公司都會需要將重點關注的數(shù)據指標做到一個表中,去周期性的更新和維護,這一步就需要寫sql查詢、生成報表。一般公司的報表數(shù)量可能多達上百個,部分公司會有專門的報表工程師進行開發(fā)和維護,也有的公司是由數(shù)據分析師來進行。很多數(shù)據分析師上午來公司的第一件事,就是監(jiān)控自己對應業(yè)務的報表是否有數(shù)據異常現(xiàn)象發(fā)生,及時發(fā)現(xiàn)、解決問題。如果是在部分數(shù)據平臺建設不完善的公司,數(shù)據分析師還要將當天的監(jiān)控情況進行圖文描述,郵件抄送給業(yè)務方的關鍵人。因此在做這項工作時,對數(shù)據指標的敏感性、對業(yè)務的理解都是很重要的。
數(shù)據可視化
主要是設計可視化看板。設計看板時的一般步驟是:確認指標、設計可視化方式,最后如果公司購入了FineReport等可視化工具的,就由分析師自行使用工具設計看板,當然也可以提需求給前后端的同事讓他們進行開發(fā)。這里很考察數(shù)據可視化的思維,把數(shù)字往折線圖、柱狀圖、餅圖上一套,這大部分人都知道,更重要的是需要思考,哪一種圖能夠更好的體現(xiàn)指標的特性和關注的目的,是看走勢,還是分布,看絕對值,還是百分比。
這里提醒一句話:可視化一定是為數(shù)據和業(yè)務服務的,切勿將可視化效果凌駕于業(yè)務效果之上。
專項分析
專項分析是很多初入門的數(shù)據分析師非常渴望能參與的,因為上面提到的很多工作內容其實都是在輔助和配合,而專項分析則可以由數(shù)據分析師去主導推進數(shù)據項目,整體性地完成一項業(yè)務的全方位分析、分析體系建設、優(yōu)化等,從而定位業(yè)務問題、提供業(yè)務發(fā)展建議,發(fā)現(xiàn)新的業(yè)務發(fā)展點,真正實現(xiàn)崗位價值,尤其是一些復雜、深度的分析,像涉及到建模的項目,需要做分詞、聚類、回歸等,只能由專業(yè)的數(shù)據分析師來執(zhí)行。
比如對接銷售部門,可能需要根據公司的銷售情況搭建銷售分析體系,建立銷售預測模型,生成客戶畫像;對接產品、運營相關部門,數(shù)據分析師就需要負責公司各產品線的用戶相關數(shù)據體系搭建、流程優(yōu)化、建立AB test產品迭代體系、測試方面的專項分析。
也非常建議新人數(shù)據分析師們能抓住機會參與到一個完整的分析項目中去,這對了解分析流程和業(yè)務,以及對未來的跳槽都是有幫助的。
數(shù)據基礎建設
這個因公司而異,公司規(guī)模越大,其下的數(shù)據崗位就會越細分,會有專人去做數(shù)據平臺搭建、數(shù)據倉庫、數(shù)據分析……但大部分的中小型公司,數(shù)據分析師往往身兼多職,建設數(shù)據平臺、做數(shù)據規(guī)范、梳理建立數(shù)據指標體系等等。比如在梳理指標體系時,數(shù)據分析師會需要和業(yè)務一起確定當前重點關注的指標、進行優(yōu)先級排布、指標定義、統(tǒng)計規(guī)則、埋點規(guī)則……這些基礎建設和定義性的工作可以說是奠基性的,基礎打好、數(shù)據明確好,后續(xù)的數(shù)據分析效率會得到顯著提升,否則面臨臟亂差的數(shù)據,第一步的取數(shù)和洗數(shù)就是一道坎。
一般來說,越初級的數(shù)據分析崗位,在前面幾個取數(shù)、做表、臨時需求溝通上面花費的時間就越多,有一定工作和業(yè)務經驗后,數(shù)據分析師們的工作就逐漸開始向分析項目、資源協(xié)調、總結上傾斜。
原文地址:https://mp.weixin.qq.com/s?__biz=Mzg4OTUyMzY4OQ==&mid=2247496487&idx=1&sn=1086bf03d10dea246b191871621b53c4&chksm=cfe82fa1f89fa6b783184e8bde6f26dd27b0d015510d0655549c076c3bcead5d937ca5856000&mpshare=1&