資料分析有什麼思路

時間 2022-08-27 07:06:41

1樓:環球青藤

1、明確思路

明確資料分析的目的以及思路是確保資料分析過程有效進行的首要條件。它作用的是可以為資料的收集、處理及分析提供清晰的指引方向。可以說思路是整個分析流程的起點。

首先目的不明確則會導致方向性的錯誤。當明確目的後,就要建分析框架,把分析目的分解成若干個不同的分析要點,即如何具體開展資料分析,需要從哪幾個角度進行分析,採用哪些分析指標。

2、收集資料

收集資料是按照確定的資料分析框架收集相關資料的過程,它為資料分析提供了素材和依據。這裡所說的資料報括第一手資料與第二手資料,第一手資料主要指可直接獲取的資料比如公司自己的業務資料庫中的業務資料,第二手資料主要指經過加工整理後得到的資料例如一些公開出版物或者第三方的資料**。

3、處理資料

處理資料是指對收集到的資料進行加工整理,形成適合資料分析的樣式,它是資料分析前必不可少的階段。資料處理的基本目的是從大量的、雜亂無章、難以理解的資料中,抽取並推導出對解決問題有價值、有意義的資料。資料處理主要包括資料清洗、資料轉化、資料提取、資料計算等處理方法。

4、分析資料

分析資料是指用適當的分析方法及工具,對處理過的資料進行分析,提取有價值的資訊,形成有效結論的過程。由於資料分析多是通過軟體來完成的,這就要求資料分析師不僅要掌握各種資料分析方法,還要熟悉資料分析軟體的操作。

5、視覺化

一般情況下,資料是通過**和圖形的方式來呈現的,我們常說用圖表說話就是這個意思。常用的資料圖表包括餅圖、柱形圖、條形圖、折線圖、散點圖、雷達圖等,當然可以對這些圖表進一步整理加工,使之變為我們所需要的圖形,例如金字塔圖、矩陣圖、漏斗圖等。

6、撰寫報告

撰寫資料分析報告其實是對整個資料分析過程的乙個總結與呈現,通過清晰的結構和**並茂的展現方式去展具有建設意義的解決方案。

2樓:派可資料

常見的分析方法有:分類分析,矩陣分析,漏斗分析,相關分析,邏輯樹分析,趨勢分析,行為軌跡分析,等等。 我用hr的工作來舉例,說明上面這些分析要怎麼做,才能得出洞見。

01) 分類分析

比如分成不同部門、不同崗位層級、不同年齡段,來分析人才流失率。比如發現某個部門流失率特別高,那麼就可以去分析。

02) 矩陣分析

比如公司有價值觀和能力的考核,那麼可以把考核結果做出矩陣圖,能力強價值匹配的員工、能力強價值不匹配的員工、能力弱價值匹配的員工、能力弱價值不匹配的員工各佔多少比例,從而發現公司的人才健康度。

03) 漏斗分析

比如記錄招聘資料,投遞簡歷、通過初篩、通過一面、通過二面、通過終面、接下offer、成功入職、通過試用期,這就是乙個完整的招聘漏斗,從資料中,可以看到哪個環節還可以優化。

04) 相關分析

比如公司各個分店的人才流失率差異較大,那麼可以把各個分店的員工流失率,跟分店的一些特性(地理位置、薪酬水平、福利水平、員工年齡、管理人員年齡等)要素進行相關性分析,找到最能夠挽留員工的關鍵因素。

05) 邏輯樹分析

比如近期發現員工的滿意度有所降低,那麼就進行拆解,滿意度跟薪酬、福利、職業發展、工作氛圍有關,然後薪酬分為基本薪資和獎金,這樣層層拆解,找出滿意度各個影響因素裡面的變化因素,從而得出洞見。

06) 趨勢分析

比如人才流失率過去12個月的變化趨勢。

07)行為軌跡分析

比如跟蹤乙個銷售人員的行為軌跡,從入職、到開始產生業績、到業績快速增長、到疲憊期、到逐漸穩定。

3樓:左右資料

趙興峰老師主講資料分析師全體系育成課程,最常用的資料分析思路與方法:對比分析,對比分析案例、思路、方法、模型及對比分析三要素

4樓:成都聚數雲海

資料分析的常規思路:

一、熟悉業務、了解資料**

這一點是資料分析的前提。資料分析,除了我們面對的資料之外,更多的是這些資料背後隱藏的各種業務。對於業務深入的了解,有助於更好的發現分析的維度,快速鎖定問題和原因。

二、明確分析的目的

資料分析不是模型演算法和視覺化的堆砌,而是有目的地發現某種現象,支撐某些決策。所以在分析之前,一定要明確自己分析的目的,切忌照搬其他的專案的分析內容,或者隨意組合手上的分析模型演算法,這樣會導致分析結果華而不實。

三、多視角觀察

要想達到某種分析目的,需要從多個視角觀察資料,這樣不僅可以對資料整體有個全面的了解,也有助於發現潛在的資訊。

做好準備工作後,接下來就進入正題,開始分析:

一、它是什麼?

資料分析一定是針對某一些物件的,就像消費記錄針對的是某一店鋪。那首先要做的,就是通過資料來描述這一物件。所以,主要從兩個方面關注乙個物件,整體描述和特徵:

1、基礎統計

統計是最直接的方法,而且應用起來也很簡單。常用的方法有總和、平均數、最大最小值、中位數、方差、增長率、型別佔比、分布、頻率頻次等等。這裡不多做介紹。

2、聚類

「物以類聚,人以群分」,聚類屬於非監督學習,聚類可以將一組資料分成多個類別,每個類別內部的資料相似,但兩個類別之間相異。聚類有助於發現資料分布上的特點,可以大量減少分析的資料量。比如在軌跡分析和**中,通過聚類,我們會發現某個人主要出現在三個地方,宿舍周圍、食堂周圍、教學樓周圍,那麼當我們**他在哪的時候,就可以從對無數經緯度座標的分析變成對三個地點的分析。

3、特徵分析

特徵工程是很龐大,正如描述的那樣,資料和特徵決定了機器學習的上限,而模型和演算法只能逼近這個上限而已。特徵工程包含了特徵提取和特徵選擇,由於其演算法眾多且比較複雜,這裡不一一介紹。特徵分析首先要明確分析的單位,包括時間、空間和型別等等。

就像軌跡**中,分析每十分鐘的所在地要比分析每秒鐘的經緯度座標要實際得多,而分析每小時的所在地又太過粗糙。然後就是特徵提取,特徵提取的演算法有很多,線性的pca(主成分分析)、lda(線性判別分析)、ica(獨立成分分析),文字的f-ide、期望交叉熵,影象的hog、lbp等。特徵分析的主要目的是降維、減少冗餘,提高儲存計算能力。

二、它發生了什麼?

它發生了什麼包涵正常和異常,而我們通常會更加關注異常,這裡也著重於異常分析。它發生了什麼與它是什麼在分析思路和方法上是一致的,只是針對不同的階段,比如時間上本月與上月。對於異常分析,主要有兩部分,發現異常和推送預警。

推送預警比較簡單,只要注意預警的級別和推送的人。而異常發現,除了能直接觀察的異常,比如我們的學霸這次居然有一科沒及格,更多的需要注意暗物質。所謂暗物質,就是無法直接觀測的現象和關聯。

在異常判斷的時候,通常會根據具體的業務設定一些係數,通過這些係數的突變來發現潛在的異常。

三、為什麼發生?

每當發生什麼的時候,我們都會問一句為什麼?為什麼是對資料的深層次挖掘與診斷,精確的問題診斷有利於正確的決策。一般可以用到以下的方法:

1、趨勢、同比環比

這是很簡單的方法,既觀察其過去和其他週期的情況,這裡不多介紹。

2、下鑽

下鑽絕對是最常用且有效的找原因的辦法,既一層層抽絲撥繭,直到找到最根源的原因。只是在下鑽的過程中,一定要注意下鑽的區域和方向,就像挖井一樣,並不是隨便找個地方向任何方向打下去就會出水的。我們可以分為多個層次下鑽,既一開始只關注大的分類的變化,如服裝、飲食等等,再從變化較大的類開始繼續下鑽。

3、相關分析

相關分析是對不同特徵或資料間的關係進行分析,發現業務的關鍵影響和驅動因素。例如時間到春運了,車票就不好買了一樣。相關分析常用的方法有協方差、相關係數、回歸和資訊熵等,其中相關係數和回歸也可以用於下面將會提到的**。

其中相關是回歸的前提,相關係數表示了兩個變數有關係,而回歸則表示兩個變數是何種關係。其中相關係數與回歸也可以延伸到典型相關分析(多元)與多元回歸。例如經典的「啤酒和尿布」,如果想要知道啤酒銷量為什麼增加,可以分析下它與尿布銷量的相關性。

四、它還會發生什麼?

它還會發生什麼就是純粹的**了,**的演算法有很多,但也並不是說所有的**都需要借助難以理解的演算法。比如萬精油的趨勢、增長率、同比環比、基本概率等,有的時候就很能說明問題。但在這裡,還是介紹一些常用的**方法:

1、特別的點

對於實時性和連續性要求不高的**,這絕對是最省心省力的辦法,但是這與具體的業務深度掛鉤,所以,重要的事說多遍,一定要熟悉業務和多視角觀察。

2、分類與回歸

分類與回歸都是通過已知的資料構建和驗證乙個函式f,使得y=f(x),對於未知的x,通過f**y,不同在於回歸的輸出是連續的而分類的輸出是離散的。例如,我們**明天的溫度是回歸,而**明天是下雨天還是晴天則是分類。分類方法有邏輯回歸、決策樹、支援向量機,而回歸一般會用到線性回歸。

當然,**演算法還有很多,只是需要根據**的資料的具體情況選擇正確的方法,這些可以從我們的演算法工程師們那裡得到很好的建議,當然前提是我們要將資料的特點和需要**的東西準確的告訴他們。

五、該怎麼辦?

該怎麼辦是資料分析的最終目的。大多數情況下,當知道了問題出在哪,為什麼出這個問題的時候,都知道接下來該怎麼辦了。那麼接下來就介紹一些即使知道哪齣問題了也不知道該怎麼辦的時候可以用的方法:

1、擬合與圖論

這是在做路線規劃的時候最常用的,比如某商場頻發商品被偷的事件,我們發現有幾個地方的商品特容易被偷,那可以將這些地方串連起來,擬合成一條巡邏的路線給保安。同樣,也可以通過構建圖並用求最短路徑的演算法(dijkstra、floyd等)構建巡邏的路徑。

2、協同過濾

協同過濾屬於是利用集體智慧型的辦法,就像那個經典的面試題一樣,當你遇到乙個誰也沒遇到過的問題時,你該怎麼辦?那就是問那些比你更厲害的人他們會怎麼辦。

還有一種情況,也是資料分析師很常見的。就是當拿到資料,卻完全沒有目的,也就是探索性分析。這種情況借助資料分析工具,做一些大致的探索性分析,看一下資料趨勢,逐步深入。

資料分析的方法有哪些,常用的資料分析方法有哪些?

1 列表法 將資料按一定規律用列表方式表達出來,是記錄和處理最常用的方法。的設計要求對應關係清楚,簡單明瞭,有利於發現相關量之間的相關關係 此外還要求在標題欄中註明各個量的名稱 符號 數量級和單位等。2 作圖法 作圖法可以最醒目地表達各個物理量間的變化關係。從圖線上可以簡便求出實驗需要的某些結果,還...

資料分析的方法有哪些,常用的資料分析方法有哪些?

回答望對您有幫助,祝您幸福快樂每一天!spss,多因素分析 但是不了解資料的性質,統計方法的基本原理,以及以往人們是如何處理類似資料,想輕鬆的得到正確的結果.不太容易 更新一下 你這些資料不能判斷是否線形 對我這樣乙個不懂你這個技術領域的人甚至都不能判斷這是否是連續變數 因為 cm sccm w 這...

亞馬遜怎麼做資料分析,亞馬遜資料分析方法有哪些?

亞馬遜平台說白了也是做生意,做生意需要看到哪些資料呢?首先當然是賣出去多少件,賣了多少錢,這是非常重要的。這些就是我們說的銷量和銷售額。其次是你的產品是全價賣出去還是降價或者折扣賣出去的,是 產品賣得多還是低價產品賣得多?這個是衡量你產品是否有賺錢的基礎,低價產品一般都是衝量,才是利潤的基礎。怎麼知...

資料分析培訓有哪些課程,專案資料分析師培訓課程內容是什麼?

cpda 資料分析師課程如下 1.資料分析概述 第一天 2.戰略管理 第一天 企業戰略管理的模型與方法 3.資料產生 第一天 4.資料匯入與預處理 第二天 包括 大資料匯入 傳統資料匯入 資料清洗 資料加工 5.資料分析 第二天 資料分析方法 描述型資料分析 6.資料探勘 第二天 挖掘概述,kmea...

亞馬遜資料分析方法有哪些

資料分析是基於一定的目的,通過監控資料,處理資料後,加以分析得到指導工作,解決問題的資料變現過程。接下來的幾個基礎方法都是根據亞馬遜後台或前台的資料,然後運用excel表或用公式,巨集,資料透視表加以自動化處理資料分析。1 趨勢分析 趨勢分析是基於時間維度,對流量進行趨勢總結,在excel上可以右鍵...