數(shù)據質量的評價指標主要包括數(shù)據的準確性(accuracy)、完整性(completeness)、簡潔性(concision)及適用性(applicability),其中數(shù)據的準確性、完整性和簡潔性是為了保證數(shù)據的適用性。下面針對數(shù)據質量的主要評價指標進行詳細的介紹。 查看全文>>
Python+大數(shù)據技術文章2022-06-28 |傳智教育 |數(shù)據質量的評價指標
無論是在Scala中還是Java中,類都是對象的抽象,而對象都是類的具體實例;類不占用內存,而對象占用存儲空間。由于面向對象的核心是對象,若想要在應用程序中使用對象,就必須得先創(chuàng)建一個類。類是用于描述一組對象的共同特征和行為。 查看全文>>
Python+大數(shù)據技術文章2022-06-17 |傳智教育 |Scala面向對象的特性
邏輯結構反映的是數(shù)據元素之間的關系,它們與數(shù)據元素在計算機中的存儲位置無關,是數(shù)據結構在用戶面前所呈現(xiàn)的形式。根據不同的邏輯結構來分,數(shù)據結構可分為集合、線性結構、樹形結構和圖形結構4種形式,接下來分別進行簡要介紹。 查看全文>>
Python+大數(shù)據技術文章2022-06-08 |傳智教育 |描述元素與元素間的邏輯關系,數(shù)據結構類型劃分
一個正常運營的產品每天會產生大量的數(shù)據,如果把這些數(shù)據都收集起來進行分析,不僅會使工作量增加,浪費大量時間,很可能還會得不到想要的分析結果。作為一名數(shù)據分析人員,更不應該為了分析而分析,而是應該緊緊圍繞你的分析目的(了解現(xiàn)狀、分析業(yè)務變動原因、預測發(fā)展趨勢等)去進行分析。所以,在開始數(shù)據收集工作之前,就應該先把數(shù)據分析的目的梳理清楚,防止出現(xiàn)”答非所問”的數(shù)據分析結果。 查看全文>>
Python+大數(shù)據技術文章2022-05-31 |傳智教育 |數(shù)據分析常見的誤區(qū)
今天的Python大數(shù)據培訓課程我們講一下MapTask工作原理,MapTask作為MapReduce工作流程的前半部分,它主要經歷了5個階段,分別是Read階段、Map階段、Collect階段、Spill階段和Combine階段,如圖4-7所示。 查看全文>>
Python+大數(shù)據技術文章2022-05-26 |傳智教育 |Python大數(shù)據培訓,MapTask工作原理
數(shù)據庫是存儲和管理數(shù)據的倉庫,但數(shù)據庫并不能直接存儲數(shù)據,數(shù)據是存儲在表中的,在存儲數(shù)據的過程中一定會用到數(shù)據庫服務器,所謂的數(shù)據庫服務器就是指在計算機上安裝一個數(shù)據庫管理程序,如MySQL。數(shù)據庫、表、數(shù)據庫服務器之間的關系,如圖所示。 查看全文>>
Python+大數(shù)據技術文章2022-05-25 |傳智教育 |數(shù)據庫中數(shù)據的儲存結構和方式
在Scala中,集合有三大類:List、Set以及Map,所有的集合都擴展自Iterable特質。Scala集合分為可變的(mutable)和不可變(immutable)的集合。其中,可變集合可以在適當?shù)牡胤奖桓禄驍U展,意味著可以對集合進行修改、添加、移除元素;不可變集合類,相比之下,初始化后就永遠不會改變。 查看全文>>
Python+大數(shù)據技術文章2022-05-23 |傳智教育 |List,Set,Map
MySQL安裝完成后,需要啟動服務進程,否則客戶端無法連接數(shù)據庫。在前面的配置過程中,已經將MySQL安裝為Windows服務,當Windows啟動時MySQL服務也會隨著啟動,然而有時需要手動控制MySQL服務的啟動與停止,此時可以通過兩種方式來實現(xiàn)。 查看全文>>
Python+大數(shù)據技術文章2022-05-23 |傳智教育 |MySQL的使用