作為一名數(shù)據(jù)科學(xué)家/分析師,你的工作是制作一份包含許多商業(yè)決策見(jiàn)解的報(bào)告。報(bào)表可以由幾個(gè)有用的工具(如microsoftexcel、SAP)生成,也可以使用編程語(yǔ)言(如SAS、R或Python)進(jìn)行定制。結(jié)果可以通過(guò)內(nèi)部電子郵件發(fā)送給其他人,也可以通過(guò)儀表板發(fā)布。

和其他人一樣,我在日常生活中使用python制作報(bào)告或演示文稿。我通常的任務(wù)是在2-3小時(shí)內(nèi)進(jìn)行分析,并提交給管理團(tuán)隊(duì)。

為了得到我想要的結(jié)果,我必須啟動(dòng)Jupiter筆記本內(nèi)核并快速編寫(xiě)代碼來(lái)生成數(shù)字。在那之后,我可以把結(jié)果放在微軟的PowerPoint上,并在一天結(jié)束前附上一些基本的腳注,然后把它們發(fā)給我的主管,讓他們演示并做出重要的決定。

一個(gè)痛點(diǎn)是,由于時(shí)間限制,我必須消化信息,編寫(xiě)代碼生成結(jié)果,并將其以一種漂亮的格式放入Microsoft PowerPoint中呈現(xiàn)。

不幸的是,我使用的編程語(yǔ)言可能不適合管理團(tuán)隊(duì)的閱讀,例如,在數(shù)字中添加逗號(hào)或不使用科學(xué)符號(hào)來(lái)顯示大數(shù)字。

如果你提交報(bào)告時(shí)沒(méi)有注意到這些方面,管理團(tuán)隊(duì)可能會(huì)對(duì)你的報(bào)告有很多抱怨,有時(shí),他們會(huì)把報(bào)告扔到垃圾堆里,一眼也不看。那會(huì)讓你非常惱火,因?yàn)槟阈枰獣r(shí)間和精力。

要解決這個(gè)問(wèn)題,你可以將編程語(yǔ)言的結(jié)果放入microsoftexcel,然后根據(jù)需要手動(dòng)更改格式。Excel是一個(gè)很好的工具。不好的地方是你必須手工做。如果我們能在編程過(guò)程中實(shí)現(xiàn)自動(dòng)化呢。那太好了,不是嗎?

下面讓我們看一下我為這個(gè)示例生成的數(shù)據(jù)幀。這是公司需要的收入額。如你所見(jiàn),這是pandas數(shù)據(jù)幀返回的默認(rèn)結(jié)果。沒(méi)有任何配置。

我經(jīng)常從我的主管或首席執(zhí)行官那里得到的一個(gè)評(píng)論是:“你能讓它更易讀,更容易比較嗎?”。

解決辦法可能是把這個(gè)數(shù)字除以一百萬(wàn),然后把單位放在表的上方。你要記住的一點(diǎn)是,在你的演講中應(yīng)該保持一致。如果有100張表需要復(fù)制呢?很難,對(duì)吧。

你可以用編程的方式解決它。

我收到的最常見(jiàn)的評(píng)論是:“你能把數(shù)字四舍五入,并使用符號(hào),如M表示百萬(wàn)或K表示千?這將使你的表看起來(lái)更好,并減少不必要的信息?!焙芏鄷r(shí)候,我們不需要這么精確。

下面是一個(gè)函數(shù),用于將數(shù)據(jù)框中的數(shù)字轉(zhuǎn)換為所需的格式。