定義
對(duì)于“大數(shù)據(jù)”(Big data)研究機(jī)構(gòu)Gartner給出了這樣的定義?!按髷?shù)據(jù)”是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力來適應(yīng)海量、高增長率和多樣化的信息資產(chǎn)。
麥肯錫全球研究所給出的定義是:一種規(guī)模大到在獲取、存儲(chǔ)、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和價(jià)值密度低四大特征。
大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對(duì)這些含有意義的數(shù)據(jù)進(jìn)行專業(yè)化處理。換而言之,如果把大數(shù)據(jù)比作一種產(chǎn)業(yè),那么這種產(chǎn)業(yè)實(shí)現(xiàn)盈利的關(guān)鍵,在于提高對(duì)數(shù)據(jù)的“加工能力”,通過“加工”實(shí)現(xiàn)數(shù)據(jù)的“增值”。
從技術(shù)上看,大數(shù)據(jù)與云計(jì)算的關(guān)系就像一枚硬幣的正反面一樣密不可分。大數(shù)據(jù)必然無法用單臺(tái)的計(jì)算機(jī)進(jìn)行處理,必須采用分布式架構(gòu)。它的特色在于對(duì)海量數(shù)據(jù)進(jìn)行分布式數(shù)據(jù)挖掘。但它必須依托云計(jì)算的分布式處理、分布式數(shù)據(jù)庫和云存儲(chǔ)、虛擬化技術(shù)。
隨著云時(shí)代的來臨,大數(shù)據(jù)(Big data)也吸引了越來越多的關(guān)注。分析師團(tuán)隊(duì)認(rèn)為,大數(shù)據(jù)(Big data)通常用來形容一個(gè)公司創(chuàng)造的大量非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)在下載到關(guān)系型數(shù)據(jù)庫用于分析時(shí)會(huì)花費(fèi)過多時(shí)間和金錢。大數(shù)據(jù)分析常和云計(jì)算聯(lián)系到一起,因?yàn)閷?shí)時(shí)的大型數(shù)據(jù)集分析需要像MapReduce一樣的框架來向數(shù)十、數(shù)百或甚至數(shù)千的電腦分配工作。
大數(shù)據(jù)需要特殊的技術(shù),以有效地處理大量的容忍經(jīng)過時(shí)間內(nèi)的數(shù)據(jù)。適用于大數(shù)據(jù)的技術(shù),包括大規(guī)模并行處理(MPP)數(shù)據(jù)庫、數(shù)據(jù)挖掘、分布式文件系統(tǒng)、分布式數(shù)據(jù)庫、云計(jì)算平臺(tái)、互聯(lián)網(wǎng)和可擴(kuò)展的存儲(chǔ)系統(tǒng)。
最小的基本單位是bit,按順序給出所有單位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。
它們按照進(jìn)率1024(2的十次方)來計(jì)算:
1 Byte =8 bit
1 KB = 1,024 Bytes = 8192 bit
1 MB = 1,024 KB = 1,048,576 Bytes
1 GB = 1,024 MB = 1,048,576 KB
1 TB = 1,024 GB = 1,048,576 MB
1 PB = 1,024 TB = 1,048,576 GB
1 EB = 1,024 PB = 1,048,576 TB
1 ZB = 1,024 EB = 1,048,576 PB
1 YB = 1,024 ZB = 1,048,576 EB
1 BB = 1,024 YB = 1,048,576 ZB
1 NB = 1,024 BB = 1,048,576 YB
1 DB = 1,024 NB = 1,048,576 BB
特征
|| ||
結(jié)構(gòu)
大數(shù)據(jù)包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)越來越成為數(shù)據(jù)的主要部分。據(jù)IDC的調(diào)查報(bào)告顯示:企業(yè)中80%的數(shù)據(jù)都是非結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)每年都按指數(shù)增長60%。大數(shù)據(jù)就是互聯(lián)網(wǎng)發(fā)展到現(xiàn)今階段的一種表象或特征而已,沒有必要神話它或?qū)λ3志次分模谝栽朴?jì)算為代表的技術(shù)創(chuàng)新大幕的襯托下,這些原本看起來很難收集和使用的數(shù)據(jù)開始容易被利用起來了,通過各行各業(yè)的不斷創(chuàng)新,大數(shù)據(jù)會(huì)逐步為人類創(chuàng)造更多的價(jià)值。
其次,想要系統(tǒng)的認(rèn)知大數(shù)據(jù),必須要全面而細(xì)致的分解它,著手從三個(gè)層面來展開:
第一層面是理論,理論是認(rèn)知的必經(jīng)途徑,也是被廣泛認(rèn)同和傳播的基線。在這里從大數(shù)據(jù)的特征定義理解行業(yè)對(duì)大數(shù)據(jù)的整體描繪和定性;從對(duì)大數(shù)據(jù)價(jià)值的探討來深入解析大數(shù)據(jù)的珍貴所在;洞悉大數(shù)據(jù)的發(fā)展趨勢(shì);從大數(shù)據(jù)隱私這個(gè)特別而重要的視角審視人和數(shù)據(jù)之間的長久博弈。
第二層面是技術(shù),技術(shù)是大數(shù)據(jù)價(jià)值體現(xiàn)的手段和前進(jìn)的基石。在這里分別從云計(jì)算、分布式處理技術(shù)、存儲(chǔ)技術(shù)和感知技術(shù)的發(fā)展來說明大數(shù)據(jù)從采集、處理、存儲(chǔ)到形成結(jié)果的整個(gè)過程。
第三層面是實(shí)踐,實(shí)踐是大數(shù)據(jù)的最終價(jià)值體現(xiàn)。在這里分別從互聯(lián)網(wǎng)的大數(shù)據(jù),政府的大數(shù)據(jù),企業(yè)的大數(shù)據(jù)和個(gè)人的大數(shù)據(jù)四個(gè)方面來描繪大數(shù)據(jù)已經(jīng)展現(xiàn)的美好景象及即將實(shí)現(xiàn)的藍(lán)圖。
數(shù)據(jù)要素
概念
數(shù)據(jù)技術(shù)的發(fā)展伴隨著數(shù)據(jù)應(yīng)用需求的演變,影響著數(shù)據(jù)投入生產(chǎn)的方式和規(guī)模,數(shù)據(jù)在相應(yīng)技術(shù)和產(chǎn)業(yè)背景的演變中逐漸成為促進(jìn)生產(chǎn)的關(guān)鍵要素。因此,“數(shù)據(jù)要素”一詞是面向數(shù)字經(jīng)濟(jì),在討論生產(chǎn)力和生產(chǎn)關(guān)系的語境中對(duì)“數(shù)據(jù)”的指代,是對(duì)數(shù)據(jù)促進(jìn)生產(chǎn)價(jià)值的強(qiáng)調(diào)。即數(shù)據(jù)要素指的是根據(jù)特定生產(chǎn)需求匯聚、整理、加工而成的計(jì)算機(jī)數(shù)據(jù)及其衍生形態(tài),投入于生產(chǎn)的原始數(shù)據(jù)集、標(biāo)準(zhǔn)化數(shù)據(jù)集、各類數(shù)據(jù)產(chǎn)品及以數(shù)據(jù)為基礎(chǔ)產(chǎn)生的系統(tǒng)、信息和知識(shí)均可納入數(shù)據(jù)要素討論的范疇。24
數(shù)據(jù)產(chǎn)品
1.數(shù)據(jù)庫商品
(1)概念/定義
數(shù)據(jù)庫是結(jié)構(gòu)化信息或數(shù)據(jù)的有序集合,一般以電子形式存儲(chǔ)在計(jì)算機(jī)系統(tǒng)中。通常由數(shù)據(jù)庫管理系統(tǒng) (DBMS) 來控制。在現(xiàn)實(shí)中,數(shù)據(jù)、DBMS 及關(guān)聯(lián)應(yīng)用一起被稱為數(shù)據(jù)庫系統(tǒng),通常簡稱為數(shù)據(jù)庫。25
(2)數(shù)據(jù)庫分類
關(guān)系數(shù)據(jù)庫:關(guān)系數(shù)據(jù)庫在 20 世紀(jì) 80 年代成為了主流。在關(guān)系數(shù)據(jù)庫中,項(xiàng)被組織為一組具有列和行的表。這為訪問結(jié)構(gòu)化信息提供了一種有效、靈活的方法。
面向?qū)ο髷?shù)據(jù)庫:面向?qū)ο髷?shù)據(jù)庫中的信息以對(duì)象的形式表示,這與面向?qū)ο蟮木幊滔囝愃啤?/p>
分布式數(shù)據(jù)庫:分布式數(shù)據(jù)庫由位于不同站點(diǎn)的兩個(gè)或多個(gè)文件組成。數(shù)據(jù)庫可以存儲(chǔ)在多臺(tái)計(jì)算機(jī)上,位于同一個(gè)物理位置,或分散在不同的網(wǎng)絡(luò)上。
數(shù)據(jù)倉庫:數(shù)據(jù)倉庫是數(shù)據(jù)的中央存儲(chǔ)庫,是專為快速查詢和分析而設(shè)計(jì)的數(shù)據(jù)庫。
NoSQL 數(shù)據(jù)庫:NoSQL 或非關(guān)系數(shù)據(jù)庫,支持存儲(chǔ)和操作非結(jié)構(gòu)化及半結(jié)構(gòu)化數(shù)據(jù)(與關(guān)系數(shù)據(jù)庫相反,關(guān)系數(shù)據(jù)庫定義了應(yīng)如何組合插入數(shù)據(jù)庫的數(shù)據(jù))。隨著 Web 應(yīng)用的日益普及和復(fù)雜化,NoSQL 數(shù)據(jù)庫得到了越來越廣泛的應(yīng)用。
圖形數(shù)據(jù)庫:圖形數(shù)據(jù)庫根據(jù)實(shí)體和實(shí)體之間的關(guān)系來存儲(chǔ)數(shù)據(jù)。
OLTP 數(shù)據(jù)庫:OLTP 數(shù)據(jù)庫是一種高速分析數(shù)據(jù)庫,專為多個(gè)用戶執(zhí)行大量事務(wù)而設(shè)計(jì)。
云數(shù)據(jù)庫:云數(shù)據(jù)庫指基于私有云、公有云或混合云計(jì)算平臺(tái)的結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)集合,可分為傳統(tǒng)云數(shù)據(jù)庫和數(shù)據(jù)庫即服務(wù) (DBaaS) 兩種類型。在 DBaaS 中,管理和維護(hù)工作均由服務(wù)提供商負(fù)責(zé)。
多模型數(shù)據(jù)庫:多模型數(shù)據(jù)庫指的是將不同類型的數(shù)據(jù)庫模型整合到一個(gè)集成的后端中,以此來滿足各種不同的數(shù)據(jù)類型的需求。
文檔/JSON 數(shù)據(jù)庫:文檔數(shù)據(jù)庫專為存儲(chǔ)、檢索和管理面向文檔的信息而設(shè)計(jì),它是一種以 JSON 格式(而不是采用行和列)存儲(chǔ)數(shù)據(jù)的現(xiàn)代方法。
自治駕駛數(shù)據(jù)庫:基于云的自治駕駛數(shù)據(jù)庫(也稱作自治數(shù)據(jù)庫)是一種全新的極具革新性的數(shù)據(jù)庫,它利用機(jī)器學(xué)習(xí)技術(shù)自動(dòng)執(zhí)行數(shù)據(jù)庫調(diào)優(yōu)、保護(hù)、備份、更新,以及傳統(tǒng)上由數(shù)據(jù)庫管理員 (DBA) 執(zhí)行的其他常規(guī)管理任務(wù)。25
向量數(shù)據(jù)庫(Vector Database):向量數(shù)據(jù)庫是專門用來存儲(chǔ)和查詢向量的數(shù)據(jù)庫。這些向量通常來自于對(duì)文本、語音、圖像、視頻等的向量化。與傳統(tǒng)數(shù)據(jù)庫相比,向量數(shù)據(jù)庫可以處理更多非結(jié)構(gòu)化數(shù)據(jù)。在機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中,數(shù)據(jù)通常以向量形式表示,因此向量數(shù)據(jù)庫在這些領(lǐng)域中非常有用。
2.核驗(yàn)接口
(1)概念/定義
核驗(yàn)接口是指通過網(wǎng)絡(luò)或其他方式,將需要核驗(yàn)的信息傳輸?shù)街付ǖ慕涌冢M(jìn)行核驗(yàn)并返回核驗(yàn)結(jié)果的一種接口。在實(shí)名認(rèn)證、身份驗(yàn)證、數(shù)據(jù)安全等方面,核驗(yàn)接口都有著廣泛的應(yīng)用。
(2)常見的核驗(yàn)接口
身份信息核驗(yàn)接口:用于核驗(yàn)身份證號(hào)碼和姓名是否一致,可以包括身份證二要素核驗(yàn)(核驗(yàn)姓名、身份證號(hào)是否一致)和身份證四要素核驗(yàn)(核驗(yàn)姓名、身份證號(hào)、有效期始、有效期止是否一致)。
個(gè)人實(shí)名認(rèn)證接口:用于進(jìn)行個(gè)人實(shí)名認(rèn)證,驗(yàn)證個(gè)人身份信息的真實(shí)性和合法性。
企業(yè)四要素核驗(yàn)接口:用于核驗(yàn)企業(yè)的組織機(jī)構(gòu)代碼、營業(yè)執(zhí)照號(hào)碼、納稅人識(shí)別號(hào)碼等信息是否一致。
銀行卡信息核驗(yàn)接口:用于銀行卡類型查詢、銀行卡真?zhèn)魏蓑?yàn),校驗(yàn)銀行卡四要素(姓名、手機(jī)號(hào)碼、身份證號(hào)碼和銀行卡號(hào))信息是否一致。
3.查詢接口
(1)概念/定義
查詢接口是指通過網(wǎng)絡(luò)或其他方式,將查詢請(qǐng)求傳輸?shù)街付ǖ慕涌?,進(jìn)行查詢并返回查詢結(jié)果的一種接口。在數(shù)據(jù)庫中,查詢接口可以用于查詢數(shù)據(jù)表中的數(shù)據(jù)。
(2)常見的查詢接口
公共信息查詢接口:天氣查詢、國內(nèi)油價(jià)查詢、交通違章代碼查詢和空氣質(zhì)量查詢等數(shù)據(jù)查詢接口。
常識(shí)類信息查詢接口:如星座查詢、垃圾分類識(shí)別查詢、節(jié)假日信息查詢和郵編查詢等數(shù)據(jù)查詢接口。
企業(yè)信息查詢接口:包括企業(yè)簡介信息查詢、企業(yè)工商信息變更查詢、企業(yè)LOGO、企業(yè)專利信息等數(shù)據(jù)查詢接口。
4.數(shù)據(jù)模型結(jié)果
(1)概念/定義
數(shù)據(jù)模型結(jié)果是指數(shù)據(jù)建模過程的輸出結(jié)果,它是對(duì)數(shù)據(jù)對(duì)象及其之間關(guān)系的結(jié)構(gòu)化表示。在數(shù)據(jù)產(chǎn)品中,數(shù)據(jù)模型結(jié)果可以包括表格、圖表、圖形等可視化形式,幫助用戶理解數(shù)據(jù)及其關(guān)聯(lián)關(guān)系。
(2)常見的數(shù)據(jù)模型結(jié)果應(yīng)用
在金融業(yè)中,數(shù)據(jù)模型結(jié)果可以用于分析市場(chǎng)趨勢(shì)和客戶需求,從而實(shí)現(xiàn)精準(zhǔn)營銷和風(fēng)險(xiǎn)管理。
在零售業(yè)中,數(shù)據(jù)模型結(jié)果可以用于分析商品銷售情況、顧客行為和偏好,進(jìn)行優(yōu)化庫存管理、改善定價(jià)策略并提供個(gè)性化推薦服務(wù)等應(yīng)用。
在電信行業(yè)中,數(shù)據(jù)模型結(jié)果可以用于分析網(wǎng)絡(luò)流量分析從而提升網(wǎng)絡(luò)質(zhì)量和網(wǎng)絡(luò)利用率、用于用戶行為和偏好分析管理客戶關(guān)系以及精準(zhǔn)營銷等應(yīng)用。
在醫(yī)療行業(yè)中,數(shù)據(jù)模型結(jié)果可以分析患者病歷數(shù)據(jù),實(shí)現(xiàn)疾病預(yù)測(cè),以及發(fā)展個(gè)性化治療,考慮個(gè)人的遺傳變異因素,改善醫(yī)療保健效果,減少副作用,降低醫(yī)療成本。
國內(nèi)大數(shù)據(jù)產(chǎn)業(yè)鏈分布結(jié)構(gòu)
數(shù)據(jù)采集與處理
(1)概念/定義
數(shù)據(jù)采集與處理是大數(shù)據(jù)的關(guān)鍵技術(shù)之一,它從互聯(lián)網(wǎng)、傳感器和信息系統(tǒng)等來源獲取的大量帶有噪聲的數(shù)據(jù)進(jìn)行預(yù)處理,包括數(shù)據(jù)清洗、填補(bǔ)和規(guī)范化等流程,使無序的數(shù)據(jù)更加有序,便于處理,以達(dá)到快速分析處理的目的。
(2)常見應(yīng)用場(chǎng)景
金融行業(yè):大數(shù)據(jù)采集與處理在金融行業(yè)中的應(yīng)用非常廣泛。例如,銀行可以通過采集和處理大量的交易數(shù)據(jù)來進(jìn)行風(fēng)險(xiǎn)評(píng)估和欺詐檢測(cè)。
零售業(yè):大數(shù)據(jù)采集與處理是零售商了解消費(fèi)者的購買行為和偏好,從而進(jìn)行精準(zhǔn)的市場(chǎng)定位和個(gè)性化營銷的重要支撐。通過采集和分析大量的銷售數(shù)據(jù)和顧客反饋,零售商可以優(yōu)化庫存管理、供應(yīng)鏈和銷售策略。
醫(yī)療行業(yè):大數(shù)據(jù)采集與處理在健康醫(yī)療領(lǐng)域中有著重要的應(yīng)用。醫(yī)療機(jī)構(gòu)可以通過采集和分析患者的醫(yī)療記錄、生物傳感器數(shù)據(jù)和基因組數(shù)據(jù)來進(jìn)行疾病預(yù)測(cè)、診斷和治療。此外,大數(shù)據(jù)還可以用于監(jiān)測(cè)公共衛(wèi)生事件和流行病爆發(fā)。
物聯(lián)網(wǎng):物聯(lián)網(wǎng)設(shè)備產(chǎn)生的海量數(shù)據(jù)需要進(jìn)行采集和處理。大數(shù)據(jù)采集與處理可以幫助物聯(lián)網(wǎng)應(yīng)用實(shí)現(xiàn)實(shí)時(shí)監(jiān)測(cè)、遠(yuǎn)程控制和智能決策。例如,智能家居可以通過采集和分析家庭設(shè)備的數(shù)據(jù)來實(shí)現(xiàn)自動(dòng)化控制和能源管理。
社交媒體:社交媒體平臺(tái)產(chǎn)生了大量的用戶生成內(nèi)容和社交數(shù)據(jù)。通過采集和處理這些數(shù)據(jù),社交媒體平臺(tái)可以提供個(gè)性化的推薦、廣告定向和輿情分析等功能。
城市管理:大數(shù)據(jù)采集與處理可以幫助城市管理者實(shí)現(xiàn)智慧城市的建設(shè)。通過采集和分析城市交通、環(huán)境、能源等方面的數(shù)據(jù),城市管理者可以優(yōu)化交通流量、改善環(huán)境質(zhì)量和提高能源利用效率。
數(shù)據(jù)存儲(chǔ)與管理
(1)概念/定義
數(shù)據(jù)存儲(chǔ)與管理是指將處理前或處理后的數(shù)據(jù)以特定格式記錄在計(jì)算機(jī)內(nèi)部或外部存儲(chǔ)介質(zhì)上,并對(duì)數(shù)據(jù)進(jìn)行管理和調(diào)用的過程。此過程有助于減少數(shù)據(jù)孤島現(xiàn)象,并確保數(shù)據(jù)的可靠性、安全性、可用性和可擴(kuò)展性。
(2)常見的應(yīng)用場(chǎng)景
金融行業(yè):金融機(jī)構(gòu)需要存儲(chǔ)和管理大量的交易數(shù)據(jù)、客戶數(shù)據(jù)和市場(chǎng)數(shù)據(jù)。數(shù)據(jù)存儲(chǔ)和管理可以幫助金融機(jī)構(gòu)進(jìn)行風(fēng)險(xiǎn)管理、反欺詐分析、客戶關(guān)系管理等。
零售業(yè):零售商需要存儲(chǔ)和管理大量的銷售數(shù)據(jù)、庫存數(shù)據(jù)和顧客數(shù)據(jù)。數(shù)據(jù)存儲(chǔ)和管理可以輔助零售商進(jìn)行銷售分析、庫存管理、個(gè)性化營銷等工作。
健康醫(yī)療:醫(yī)療機(jī)構(gòu)需要存儲(chǔ)和管理患者的醫(yī)療記錄、病歷數(shù)據(jù)和醫(yī)學(xué)影像數(shù)據(jù)。數(shù)據(jù)存儲(chǔ)和管理可以幫助醫(yī)療機(jī)構(gòu)進(jìn)行疾病診斷、治療計(jì)劃制定、醫(yī)學(xué)研究等。
物聯(lián)網(wǎng):物聯(lián)網(wǎng)設(shè)備產(chǎn)生的數(shù)據(jù)需要進(jìn)行存儲(chǔ)和管理。例如對(duì)采集的農(nóng)田土壤、氣象、水質(zhì)等數(shù)據(jù)進(jìn)行數(shù)據(jù)存儲(chǔ)和管理,為實(shí)現(xiàn)智能農(nóng)業(yè)的精準(zhǔn)灌溉和農(nóng)作物生長監(jiān)測(cè)提供支持。
社交媒體:社交媒體平臺(tái)需要存儲(chǔ)和管理用戶生成的內(nèi)容、社交關(guān)系數(shù)據(jù)和用戶行為數(shù)據(jù)。數(shù)據(jù)存儲(chǔ)和管理可以幫助社交媒體平臺(tái)進(jìn)行用戶推薦、內(nèi)容分發(fā)、廣告定向等。
城市管理:城市管理部門需要存儲(chǔ)和管理城市交通數(shù)據(jù)、環(huán)境監(jiān)測(cè)數(shù)據(jù)和公共服務(wù)數(shù)據(jù)。數(shù)據(jù)存儲(chǔ)和管理可以幫助城市管理部門進(jìn)行交通優(yōu)化、環(huán)境保護(hù)、智慧城市建設(shè)等。
電信行業(yè):電信運(yùn)營商需要存儲(chǔ)和管理大量的通信數(shù)據(jù)、用戶數(shù)據(jù)和網(wǎng)絡(luò)數(shù)據(jù)。數(shù)據(jù)存儲(chǔ)和管理可以幫助電信運(yùn)營商進(jìn)行網(wǎng)絡(luò)優(yōu)化、用戶分析、故障排查等。
數(shù)據(jù)挖掘/分析
(1)概念/定義
**數(shù)據(jù)挖掘:**數(shù)據(jù)挖掘是一種計(jì)算機(jī)輔助技術(shù),用于分析以處理和探索大型數(shù)據(jù)集。借助數(shù)據(jù)挖掘工具和方法,組織可以發(fā)現(xiàn)其數(shù)據(jù)中隱藏的模式和關(guān)系。數(shù)據(jù)挖掘?qū)⒃紨?shù)據(jù)轉(zhuǎn)化為實(shí)用的知識(shí)。其目標(biāo)不是提取或挖掘數(shù)據(jù)本身,而是對(duì)已有的大量數(shù)據(jù),提取有意義或有價(jià)值的知識(shí)。19
**數(shù)據(jù)分析:**數(shù)據(jù)分析是指根據(jù)分析目的,用適當(dāng)?shù)慕y(tǒng)計(jì)分析方法及工具,對(duì)收集來的數(shù)據(jù)進(jìn)行處理與分析,提取有價(jià)值的信息,發(fā)揮數(shù)據(jù)的作用。
因此,狹義上的數(shù)據(jù)分析與數(shù)據(jù)挖掘的本質(zhì)一樣,都是從數(shù)據(jù)里面發(fā)現(xiàn)關(guān)于業(yè)務(wù)的知識(shí)(有價(jià)值的信息),從而幫助業(yè)務(wù)運(yùn)營、改進(jìn)產(chǎn)品以及幫助企業(yè)做更好的決策,所以俠義的數(shù)據(jù)分析與數(shù)據(jù)挖掘構(gòu)成廣義的數(shù)據(jù)分析。
(2)常見應(yīng)用場(chǎng)景
金融行業(yè):在金融服務(wù)中利用數(shù)據(jù)挖掘應(yīng)用程序來解決復(fù)雜的欺詐、合規(guī)、風(fēng)險(xiǎn)管理和客戶流失問題,同時(shí),大數(shù)據(jù)分析可以幫助金融機(jī)構(gòu)進(jìn)行市場(chǎng)趨勢(shì)分析、投資組合優(yōu)化和個(gè)性化推薦。
醫(yī)療行業(yè):醫(yī)療機(jī)構(gòu)可以利用大數(shù)據(jù)分析患者的病歷數(shù)據(jù)、醫(yī)學(xué)影像和基因組數(shù)據(jù),以輔助疾病診斷、藥物研發(fā)和個(gè)性化治療。例如在疾病診斷上,通過對(duì)大量的醫(yī)療數(shù)據(jù)進(jìn)行挖掘和分析,可以發(fā)現(xiàn)潛在的疾病模式和風(fēng)險(xiǎn)因素,實(shí)現(xiàn)疾病的早期預(yù)測(cè)。
零售業(yè):大數(shù)據(jù)挖掘和分析可以幫助零售商了解消費(fèi)者的購買行為和偏好,從而進(jìn)行精準(zhǔn)的市場(chǎng)定位和個(gè)性化營銷。通過分析大量的銷售數(shù)據(jù)和顧客反饋,零售商可以優(yōu)化庫存管理、供應(yīng)鏈和銷售策略。
物聯(lián)網(wǎng):物聯(lián)網(wǎng)設(shè)備產(chǎn)生的海量數(shù)據(jù)需要進(jìn)行數(shù)據(jù)挖掘和分析。大數(shù)據(jù)分析可以幫助物聯(lián)網(wǎng)應(yīng)用實(shí)現(xiàn)實(shí)時(shí)監(jiān)測(cè)、遠(yuǎn)程控制和智能決策。例如,智能家居可以通過分析家庭設(shè)備的數(shù)據(jù)來實(shí)現(xiàn)自動(dòng)化控制和能源管理。
電信行業(yè):例如通過對(duì)網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行挖掘和分析,公司可以根據(jù)帶寬使用模式并提供定制的服務(wù)升級(jí)或建議,通過對(duì)用戶通話數(shù)據(jù)的挖掘分析,可以幫助電信運(yùn)營商發(fā)現(xiàn)異常行為和欺詐行為。
數(shù)據(jù)可視化/呈現(xiàn)
(1)概念/定義
數(shù)據(jù)可視化是使用圖表、圖形或地圖等可視元素來表示數(shù)據(jù)的過程。該過程將難以理解和運(yùn)用的數(shù)據(jù)轉(zhuǎn)化為更易于處理的可視化表示。數(shù)據(jù)可視化工具可自動(dòng)提高視覺交流過程的準(zhǔn)確性并提供詳細(xì)信息,以便決策者可以確定數(shù)據(jù)之間的關(guān)系并發(fā)現(xiàn)隱藏的模式或趨勢(shì)。20
(2)常見應(yīng)用場(chǎng)景
商業(yè)決策:通過數(shù)據(jù)可視化,企業(yè)可以更直觀地了解業(yè)務(wù)數(shù)據(jù)和市場(chǎng)趨勢(shì),從而做出更準(zhǔn)確的商業(yè)決策。例如,通過數(shù)據(jù)可視化展示銷售數(shù)據(jù)和客戶反饋,企業(yè)可以了解產(chǎn)品的銷售情況和客戶需求,從而優(yōu)化產(chǎn)品設(shè)計(jì)和市場(chǎng)推廣。
智慧城市:通過數(shù)據(jù)可視化,城市管理部門可以更直觀地了解城市的交通、環(huán)境、能源等方面的數(shù)據(jù),從而實(shí)現(xiàn)智慧城市的建設(shè)。例如,通過數(shù)據(jù)可視化展示交通流量和路況,城市管理部門可以實(shí)現(xiàn)交通優(yōu)化和擁堵緩解。
醫(yī)療健康:通過數(shù)據(jù)可視化,醫(yī)療機(jī)構(gòu)可以更直觀地了解患者的病歷數(shù)據(jù)和醫(yī)學(xué)影像,從而實(shí)現(xiàn)疾病的診斷和治療。例如,通過數(shù)據(jù)可視化展示醫(yī)學(xué)影像和基因組數(shù)據(jù),醫(yī)生可以更準(zhǔn)確地診斷疾病和制定治療方案。
金融服務(wù):通過數(shù)據(jù)可視化,金融機(jī)構(gòu)可以更直觀地了解市場(chǎng)趨勢(shì)和客戶需求,從而實(shí)現(xiàn)精準(zhǔn)營銷和風(fēng)險(xiǎn)管理。例如,通過數(shù)據(jù)可視化展示市場(chǎng)數(shù)據(jù)和客戶反饋,金融機(jī)構(gòu)可以了解客戶需求和市場(chǎng)趨勢(shì),從而制定個(gè)性化的產(chǎn)品和服務(wù)。
物聯(lián)網(wǎng):通過數(shù)據(jù)可視化,物聯(lián)網(wǎng)應(yīng)用可以更直觀地了解設(shè)備的運(yùn)行狀態(tài)和數(shù)據(jù)流量,從而實(shí)現(xiàn)實(shí)時(shí)監(jiān)測(cè)和遠(yuǎn)程控制。例如,通過數(shù)據(jù)可視化展示設(shè)備的運(yùn)行數(shù)據(jù)和傳感器數(shù)據(jù),物聯(lián)網(wǎng)應(yīng)用可以實(shí)現(xiàn)設(shè)備的遠(yuǎn)程控制和智能決策,如圖。
數(shù)據(jù)治理/應(yīng)用(解決方案)
1.大數(shù)據(jù)在金融行業(yè)的應(yīng)用
交易欺詐識(shí)別:通過大數(shù)據(jù)分析,可以識(shí)別出交易欺詐行為,幫助金融機(jī)構(gòu)減少損失,如中國交通銀行信用卡中心電子渠道實(shí)時(shí)反欺詐監(jiān)控交易系統(tǒng)。
精準(zhǔn)營銷:通過分析客戶的消費(fèi)行為和偏好,可以實(shí)現(xiàn)精準(zhǔn)營銷,提高營銷效果,如京東金融基于大數(shù)據(jù)的行為分析系統(tǒng)、恒豐銀行基于大數(shù)據(jù)的客戶關(guān)系管理系統(tǒng)。
信貸風(fēng)險(xiǎn)評(píng)估:通過分析客戶的信用記錄、收入和支出等信息,可以評(píng)估客戶的信貸風(fēng)險(xiǎn),幫助金融機(jī)構(gòu)做出更好的決策,如恒豐銀行全面風(fēng)險(xiǎn)預(yù)警系統(tǒng)、人人貸風(fēng)控體系。
智能投顧:通過大數(shù)據(jù)分析客戶的投資偏好和風(fēng)險(xiǎn)承受能力,可以為客戶提供個(gè)性化的投資建議,如通聯(lián)浙商大數(shù)據(jù)智選消費(fèi)基金,通聯(lián)支付通過對(duì)自有的消費(fèi)類支付相關(guān)數(shù)據(jù),可以實(shí)時(shí)了解行業(yè)(尤其是消費(fèi)行業(yè))銷售需求的情況,按行業(yè)匯總各商戶的刷卡支付情況,獲得行業(yè)最新的景氣邊際變化,進(jìn)而將資金更多的配置在景氣向好的行業(yè)上,然后利用經(jīng)典量化模型,精選相應(yīng)行業(yè)內(nèi)的上市公司,并基于此發(fā)行了一支名為“浙商大數(shù)據(jù)智選消費(fèi)”的偏股混合型基金。21
2.大數(shù)據(jù)在醫(yī)療行業(yè)的應(yīng)用
分析電子病歷:醫(yī)生共享電子病歷可以收集和分析數(shù)據(jù),尋找能夠降低醫(yī)療成本的方法。醫(yī)生和醫(yī)療服務(wù)提供商之間共享患者數(shù)據(jù),能夠減少重復(fù)檢查,改善患者體驗(yàn),如百度智能醫(yī)療平臺(tái)實(shí)現(xiàn)電子病歷規(guī)范化和結(jié)構(gòu)化。
健康風(fēng)險(xiǎn)預(yù)測(cè):通過分析大量的健康數(shù)據(jù),可以預(yù)測(cè)人群的慢性病風(fēng)險(xiǎn),幫助醫(yī)療機(jī)構(gòu)和個(gè)人采取相應(yīng)的預(yù)防和干預(yù)措施,提高健康管理的效果,如平安云的智能醫(yī)療解決方案具有智能健康風(fēng)險(xiǎn)預(yù)測(cè)功能。
輔助診斷決策:通過學(xué)習(xí)海量教材、臨床指南、藥典及三甲醫(yī)院優(yōu)質(zhì)病歷,打造遵循循證醫(yī)學(xué)的臨床輔助決策系統(tǒng),用以提升醫(yī)療質(zhì)量,降低醫(yī)療風(fēng)險(xiǎn)。如百度智能醫(yī)療平臺(tái)的臨床輔助決策系統(tǒng)。
互聯(lián)網(wǎng)醫(yī)院:互聯(lián)網(wǎng)醫(yī)院是指利用互聯(lián)網(wǎng)技術(shù),為患者提供在線咨詢、預(yù)約掛號(hào)、遠(yuǎn)程診療等醫(yī)療服務(wù)?;ヂ?lián)網(wǎng)醫(yī)院可以通過大數(shù)據(jù)分析,為患者提供個(gè)性化的醫(yī)療建議和服務(wù),如丁香醫(yī)生。
3.大數(shù)據(jù)在零售行業(yè)的應(yīng)用
個(gè)性化推薦:通過分析顧客的購買歷史、瀏覽行為和偏好,利用大數(shù)據(jù)技術(shù)進(jìn)行個(gè)性化推薦,提高銷售轉(zhuǎn)化率和顧客滿意度。
庫存管理:通過分析銷售數(shù)據(jù)和供應(yīng)鏈數(shù)據(jù),預(yù)測(cè)產(chǎn)品需求和庫存水平,幫助零售商優(yōu)化庫存管理,減少過剩和缺貨情況。
客戶細(xì)分:通過分析顧客的購買行為和消費(fèi)習(xí)慣,將顧客分為不同的細(xì)分群體,為每個(gè)群體提供個(gè)性化的營銷策略和服務(wù)。
價(jià)格優(yōu)化:通過分析市場(chǎng)競爭和顧客需求,優(yōu)化定價(jià)策略,實(shí)現(xiàn)最佳的價(jià)格和利潤平衡。
供應(yīng)鏈優(yōu)化:通過分析供應(yīng)鏈數(shù)據(jù),優(yōu)化供應(yīng)鏈流程和物流配送,提高供應(yīng)鏈的效率和可靠性。
數(shù)據(jù)安全與合規(guī)
1.概念/定義
根據(jù)《中華人民共和國數(shù)據(jù)安全法》,數(shù)據(jù)是指任何以電子或者其他方式對(duì)信息的記錄。數(shù)據(jù)安全是指通過采取必要措施,確保數(shù)據(jù)處于有效保護(hù)和合法利用的狀態(tài),以及具備保障持續(xù)安全狀態(tài)的能力。各地區(qū)、各部門對(duì)本地區(qū)、本部門工作中收集和產(chǎn)生的數(shù)據(jù)及數(shù)據(jù)安全負(fù)責(zé)。22
2.數(shù)據(jù)全生命周期安全
(1)數(shù)據(jù)采集安全:指為確保在組織系統(tǒng)中生成新數(shù)據(jù),或者從外部收集數(shù)據(jù)過程的合法、合規(guī)及安全性,而采取的一系列措施。
(2)數(shù)據(jù)傳輸安全:指為防止傳輸過程中的數(shù)據(jù)泄漏,而采取的一系列數(shù)據(jù)加密保護(hù)策略和安全防護(hù)措施。
(3)存儲(chǔ)安全:指為確保存儲(chǔ)介質(zhì)上的數(shù)據(jù)安全性,而采取的一系列措施,如在數(shù)據(jù)分類分級(jí)的基礎(chǔ)上,結(jié)合業(yè)務(wù)場(chǎng)景,明確不同類別和級(jí)別數(shù)據(jù)的加密存儲(chǔ)要求。
(4)數(shù)據(jù)備份與恢復(fù):指通過規(guī)范數(shù)據(jù)存儲(chǔ)的冗余管理工作機(jī)制,保障數(shù)據(jù)的高可用性,如建立數(shù)據(jù)備份與恢復(fù)平臺(tái),按照備份清單定期執(zhí)行備份,并對(duì)備份數(shù)據(jù)完整性和可用性進(jìn)行驗(yàn)證。
(5)使用安全:指為保障在組織內(nèi)部對(duì)數(shù)據(jù)進(jìn)行計(jì)算、分析、可視化等操作過程的安全性,而采取的一些列措施,如采取對(duì)不同類型不同級(jí)別的數(shù)據(jù)進(jìn)行脫敏處理,對(duì)數(shù)據(jù)處理活動(dòng)進(jìn)行監(jiān)控等操作。
(6)數(shù)據(jù)處理環(huán)境安全:指為確保組織的數(shù)據(jù)處理系統(tǒng)、終端、平臺(tái)等環(huán)境的安全性,而采取的一系列措施。
(7)數(shù)據(jù)內(nèi)部共享安全:指為確保組織內(nèi)部之間的數(shù)據(jù)交互過程安全而采取的一系列措施。
(8)數(shù)據(jù)外部共享安全:指為確保不同組織之間的數(shù)據(jù)交互過程安全而采取的一系列措施。
(9)數(shù)據(jù)銷毀安全:指通過對(duì)數(shù)據(jù)及其存儲(chǔ)介質(zhì)實(shí)施相應(yīng)的操作手段,使得數(shù)據(jù)徹底消除且無法通過任何手段恢復(fù)。23
3.企業(yè)數(shù)據(jù)安全治理實(shí)踐
(1)中國聯(lián)通集團(tuán)數(shù)據(jù)安全治理實(shí)踐
該方案以防止數(shù)據(jù)泄漏與數(shù)據(jù)濫用為目標(biāo),以零信任安全為理念將自主研發(fā)的數(shù)據(jù)追蹤溯源系統(tǒng)、數(shù)據(jù)安全網(wǎng)關(guān)系統(tǒng)等數(shù)據(jù)安全產(chǎn)品實(shí)際應(yīng)用到具體的數(shù)據(jù)生產(chǎn)場(chǎng)景中,以解決數(shù)據(jù)安全問題,保障公司大數(shù)據(jù)業(yè)務(wù)的快速發(fā)展,保護(hù)用戶個(gè)人隱私,維護(hù)社會(huì)穩(wěn)定,保障國家安全。總體框架如圖所示,目前,該方案已在浙江省大數(shù)據(jù)發(fā)展管理局、廣東省政務(wù)服務(wù)數(shù)據(jù)管理局等多個(gè)政府部門落地實(shí)施,運(yùn)行效果良好,降低了政務(wù)信息共享交換環(huán)節(jié)數(shù)據(jù)泄露、數(shù)據(jù)篡改、數(shù)據(jù)濫用等問題的風(fēng)險(xiǎn)。23
(2)螞蟻集團(tuán)數(shù)據(jù)安全治理實(shí)踐
螞蟻集團(tuán)在過去幾年的數(shù)據(jù)安全實(shí)踐中,持續(xù)加大對(duì)數(shù)據(jù)、算法、產(chǎn)品的建設(shè)力度,不斷強(qiáng)化流程規(guī)范的制定和實(shí)際落地,同時(shí)大幅提升數(shù)據(jù)安全基線、度量、審計(jì)、心智等重要環(huán)節(jié)工作,總結(jié)出一套行之有效、覆蓋數(shù)據(jù)處理全生命周期的數(shù)據(jù)安全復(fù)合治理管理模式。螞蟻數(shù)據(jù)安全復(fù)合治理管理模式如圖所示。23
(3)百度數(shù)據(jù)安全治理實(shí)踐
百度基于現(xiàn)有的數(shù)據(jù)安全策略及相關(guān)規(guī)范要求集成多維安全檢測(cè)和防護(hù)能力,建立了覆蓋數(shù)據(jù)全生命周期的數(shù)據(jù)安全與隱私保護(hù)解決方案,可實(shí)現(xiàn)“事前主動(dòng)識(shí)別,事中靈活控制,事后全維追蹤”的目標(biāo),百度數(shù)據(jù)安全治理實(shí)踐路線如圖所示,可為高價(jià)值數(shù)據(jù)、敏感數(shù)據(jù)和私有化部署數(shù)據(jù)等數(shù)據(jù)提供安全評(píng)估和保障。23
意義
現(xiàn)在的社會(huì)是一個(gè)高速發(fā)展的社會(huì),科技發(fā)達(dá),信息流通,人們之間的交流越來越密切,生活也越來越方便,大數(shù)據(jù)就是這個(gè)高科技時(shí)代的產(chǎn)物。阿里巴巴創(chuàng)辦人馬云來臺(tái)演講中就提到,未來的時(shí)代將不是IT時(shí)代,而是DT的時(shí)代,DT就是Data Technology數(shù)據(jù)科技,顯示大數(shù)據(jù)對(duì)于阿里巴巴集團(tuán)來說舉足輕重。
有人把數(shù)據(jù)比喻為蘊(yùn)藏能量的煤礦。煤炭按照性質(zhì)有焦煤、無煙煤、肥煤、貧煤等分類,而露天煤礦、深山煤礦的挖掘成本又不一樣。與此類似,大數(shù)據(jù)并不在“大”,而在于“有用”。價(jià)值含量、挖掘成本比數(shù)量更為重要。對(duì)于很多行業(yè)而言,如何利用這些大規(guī)模數(shù)據(jù)是贏得競爭的關(guān)鍵。
大數(shù)據(jù)的價(jià)值體現(xiàn)在以下幾個(gè)方面:
(1)對(duì)大量消費(fèi)者提供產(chǎn)品或服務(wù)的企業(yè)可以利用大數(shù)據(jù)進(jìn)行精準(zhǔn)營銷;
(2)做小而美模式的中小微企業(yè)可以利用大數(shù)據(jù)做服務(wù)轉(zhuǎn)型;
(3)面臨互聯(lián)網(wǎng)壓力之下必須轉(zhuǎn)型的傳統(tǒng)企業(yè)需要與時(shí)俱進(jìn)充分利用大數(shù)據(jù)的價(jià)值。
不過,“大數(shù)據(jù)”在經(jīng)濟(jì)發(fā)展中的巨大意義并不代表其能取代一切對(duì)于社會(huì)問題的理性思考,科學(xué)發(fā)展的邏輯不能被湮沒在海量數(shù)據(jù)中。著名經(jīng)濟(jì)學(xué)家路德維?!ゑT·米塞斯曾提醒過:“就今日言,有很多人忙碌于資料之無益累積,以致對(duì)問題之說明與解決,喪失了其對(duì)特殊的經(jīng)濟(jì)意義的了解?!边@確實(shí)是需要警惕的。
在這個(gè)快速發(fā)展的智能硬件時(shí)代,困擾應(yīng)用開發(fā)者的一個(gè)重要問題就是如何在功率、覆蓋范圍、傳輸速率和成本之間找到那個(gè)微妙的平衡點(diǎn)。企業(yè)組織利用相關(guān)數(shù)據(jù)和分析可以幫助它們降低成本、提高效率、開發(fā)新產(chǎn)品、做出更明智的業(yè)務(wù)決策等等。例如,通過結(jié)合大數(shù)據(jù)和高性能的分析,下面這些對(duì)企業(yè)有益的情況都可能會(huì)發(fā)生:
(1)及時(shí)解析故障、問題和缺陷的根源,每年可能為企業(yè)節(jié)省數(shù)十億美元。
(2)為成千上萬的快遞車輛規(guī)劃實(shí)時(shí)交通路線,躲避擁堵。
(3)分析所有SKU,以利潤最大化為目標(biāo)來定價(jià)和清理庫存。
(4)根據(jù)客戶的購買習(xí)慣,為其推送他可能感興趣的優(yōu)惠信息。
(5)從大量客戶中快速識(shí)別出金牌客戶。
(6)使用點(diǎn)擊流分析和數(shù)據(jù)挖掘來規(guī)避欺詐行為。
趨勢(shì)
趨勢(shì)一:數(shù)據(jù)的資源化
何為資源化,是指大數(shù)據(jù)成為企業(yè)和社會(huì)關(guān)注的重要戰(zhàn)略資源,并已成為大家爭相搶奪的新焦點(diǎn)。因而,企業(yè)必須要提前制定大數(shù)據(jù)營銷戰(zhàn)略計(jì)劃,搶占市場(chǎng)先機(jī)。
趨勢(shì)二:與云計(jì)算的深度結(jié)合
大數(shù)據(jù)離不開云處理,云處理為大數(shù)據(jù)提供了彈性可拓展的基礎(chǔ)設(shè)備,是產(chǎn)生大數(shù)據(jù)的平臺(tái)之一。自2013年開始,大數(shù)據(jù)技術(shù)已開始和云計(jì)算技術(shù)緊密結(jié)合,預(yù)計(jì)未來兩者關(guān)系將更為密切。除此之外,物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)等新興計(jì)算形態(tài),也將一齊助力大數(shù)據(jù)革命,讓大數(shù)據(jù)營銷發(fā)揮出更大的影響力。
趨勢(shì)三:科學(xué)理論的突破
隨著大數(shù)據(jù)的快速發(fā)展,就像計(jì)算機(jī)和互聯(lián)網(wǎng)一樣,大數(shù)據(jù)很有可能是新一輪的技術(shù)革命。隨之興起的數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和人工智能等相關(guān)技術(shù),可能會(huì)改變數(shù)據(jù)世界里的很多算法和基礎(chǔ)理論,實(shí)現(xiàn)科學(xué)技術(shù)上的突破。
趨勢(shì)四:數(shù)據(jù)科學(xué)和數(shù)據(jù)聯(lián)盟的成立
未來,數(shù)據(jù)科學(xué)將成為一門專門的學(xué)科,被越來越多的人所認(rèn)知。各大高校將設(shè)立專門的數(shù)據(jù)科學(xué)類專業(yè),也會(huì)催生一批與之相關(guān)的新的就業(yè)崗位。與此同時(shí),基于數(shù)據(jù)這個(gè)基礎(chǔ)平臺(tái),也將建立起跨領(lǐng)域的數(shù)據(jù)共享平臺(tái),之后,數(shù)據(jù)共享將擴(kuò)展到企業(yè)層面,并且成為未來產(chǎn)業(yè)的核心一環(huán)。
趨勢(shì)五:數(shù)據(jù)泄露泛濫
未來幾年數(shù)據(jù)泄露事件的增長率也許會(huì)達(dá)到100%,除非數(shù)據(jù)在其源頭就能夠得到安全保障。可以說,在未來,每個(gè)財(cái)富500強(qiáng)企業(yè)都會(huì)面臨數(shù)據(jù)攻擊,無論他們是否已經(jīng)做好安全防范。而所有企業(yè),無論規(guī)模大小,都需要重新審視今天的安全定義。在財(cái)富500強(qiáng)企業(yè)中,超過50%將會(huì)設(shè)置首席信息安全官這一職位。企業(yè)需要從新的角度來確保自身以及客戶數(shù)據(jù),所有數(shù)據(jù)在創(chuàng)建之初便需要獲得安全保障,而并非在數(shù)據(jù)保存的最后一個(gè)環(huán)節(jié),僅僅加強(qiáng)后者的安全措施已被證明于事無補(bǔ)。
趨勢(shì)六:數(shù)據(jù)管理成為核心競爭力
數(shù)據(jù)管理成為核心競爭力,直接影響財(cái)務(wù)表現(xiàn)。當(dāng)“數(shù)據(jù)資產(chǎn)是企業(yè)核心資產(chǎn)”的概念深入人心之后,企業(yè)對(duì)于數(shù)據(jù)管理便有了更清晰的界定,將數(shù)據(jù)管理作為企業(yè)核心競爭力,持續(xù)發(fā)展,戰(zhàn)略性規(guī)劃與運(yùn)用數(shù)據(jù)資產(chǎn),成為企業(yè)數(shù)據(jù)管理的核心。數(shù)據(jù)資產(chǎn)管理效率與主營業(yè)務(wù)收入增長率、銷售收入增長率顯著正相關(guān);此外,對(duì)于具有互聯(lián)網(wǎng)思維的企業(yè)而言,數(shù)據(jù)資產(chǎn)競爭力所占比重為36.8%,數(shù)據(jù)資產(chǎn)的管理效果將直接影響企業(yè)的財(cái)務(wù)表現(xiàn)。
趨勢(shì)七:數(shù)據(jù)質(zhì)量是BI(商業(yè)智能)成功的關(guān)鍵
采用自助式商業(yè)智能工具進(jìn)行大數(shù)據(jù)處理的企業(yè)將會(huì)脫穎而出。其中要面臨的一個(gè)挑戰(zhàn)是,很多數(shù)據(jù)源會(huì)帶來大量低質(zhì)量數(shù)據(jù)。想要成功,企業(yè)需要理解原始數(shù)據(jù)與數(shù)據(jù)分析之間的差距,從而消除低質(zhì)量數(shù)據(jù)并通過BI獲得更佳決策。
趨勢(shì)八:數(shù)據(jù)生態(tài)系統(tǒng)復(fù)合化程度加強(qiáng)
大數(shù)據(jù)的世界不只是一個(gè)單一的、巨大的計(jì)算機(jī)網(wǎng)絡(luò),而是一個(gè)由大量活動(dòng)構(gòu)件與多元參與者元素所構(gòu)成的生態(tài)系統(tǒng),終端設(shè)備提供商、基礎(chǔ)設(shè)施提供商、網(wǎng)絡(luò)服務(wù)提供商、網(wǎng)絡(luò)接入服務(wù)提供商、數(shù)據(jù)服務(wù)使能者、數(shù)據(jù)服務(wù)提供商、觸點(diǎn)服務(wù)、數(shù)據(jù)服務(wù)零售商等等一系列的參與者共同構(gòu)建的生態(tài)系統(tǒng)。而今,這樣一套數(shù)據(jù)生態(tài)系統(tǒng)的基本雛形已然形成,接下來的發(fā)展將趨向于系統(tǒng)內(nèi)部角色的細(xì)分,也就是市場(chǎng)的細(xì)分;系統(tǒng)機(jī)制的調(diào)整,也就是商業(yè)模式的創(chuàng)新;系統(tǒng)結(jié)構(gòu)的調(diào)整,也就是競爭環(huán)境的調(diào)整等等,從而使得數(shù)據(jù)生態(tài)系統(tǒng)復(fù)合化程度逐漸增強(qiáng)。
IT分析工具
大數(shù)據(jù)概念應(yīng)用到IT操作工具產(chǎn)生的數(shù)據(jù)中,大數(shù)據(jù)可以使IT管理軟件供應(yīng)商解決大廣泛的業(yè)務(wù)決策。IT系統(tǒng)、應(yīng)用和技術(shù)基礎(chǔ)設(shè)施每天每秒都在產(chǎn)生數(shù)據(jù)。大數(shù)據(jù)非結(jié)構(gòu)化或者結(jié)構(gòu)數(shù)據(jù)都代表了“所有用戶的行為、服務(wù)級(jí)別、安全、風(fēng)險(xiǎn)、欺詐行為等更多操作”的絕對(duì)記錄。
大數(shù)據(jù)分析的產(chǎn)生旨在于IT管理,企業(yè)可以將實(shí)時(shí)數(shù)據(jù)流分析和歷史相關(guān)數(shù)據(jù)相結(jié)合,然后大數(shù)據(jù)分析并發(fā)現(xiàn)它們所需的模型。反過來,幫助預(yù)測(cè)和預(yù)防未來運(yùn)行中斷和性能問題。進(jìn)一步來講,他們可以利用大數(shù)據(jù)了解使用模型以及地理趨勢(shì),進(jìn)而加深大數(shù)據(jù)對(duì)重要用戶的洞察力。他們也可以追蹤和記錄網(wǎng)絡(luò)行為,大數(shù)據(jù)輕松地識(shí)別業(yè)務(wù)影響;隨著對(duì)服務(wù)利用的深刻理解加快利潤增長;同時(shí)跨多系統(tǒng)收集數(shù)據(jù)發(fā)展IT服務(wù)目錄。
大數(shù)據(jù)分析的想法,尤其在IT操作方面,大數(shù)據(jù)對(duì)于我們發(fā)明并沒有什么作用,但是我們一直在其中。Gartner已經(jīng)關(guān)注這個(gè)話題很多年了,基本上他們已經(jīng)強(qiáng)調(diào),如果IT正在引進(jìn)新鮮靈感,他們將會(huì)扔掉大數(shù)據(jù)老式方法開發(fā)一個(gè)新的IT操作分析平臺(tái)。
促進(jìn)發(fā)展
經(jīng)李克強(qiáng)總理簽批,2015年9月,國務(wù)院印發(fā)《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》(以下簡稱《綱要》),系統(tǒng)部署大數(shù)據(jù)發(fā)展工作。
《綱要》明確,推動(dòng)大數(shù)據(jù)發(fā)展和應(yīng)用,在未來5至10年打造精準(zhǔn)治理、多方協(xié)作的社會(huì)治理新模式,建立運(yùn)行平穩(wěn)、安全高效的經(jīng)濟(jì)運(yùn)行新機(jī)制,構(gòu)建以人為本、惠及全民的民生服務(wù)新體系,開啟大眾創(chuàng)業(yè)、萬眾創(chuàng)新的創(chuàng)新驅(qū)動(dòng)新格局,培育高端智能、新興繁榮的產(chǎn)業(yè)發(fā)展新生態(tài)。
《綱要》部署三方面主要任務(wù)。一要加快政府?dāng)?shù)據(jù)開放共享,推動(dòng)資源整合,提升治理能力。大力推動(dòng)政府部門數(shù)據(jù)共享,穩(wěn)步推動(dòng)公共數(shù)據(jù)資源開放,統(tǒng)籌規(guī)劃大數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè),支持宏觀調(diào)控科學(xué)化,推動(dòng)政府治理精準(zhǔn)化,推進(jìn)商事服務(wù)便捷化,促進(jìn)安全保障高效化,加快民生服務(wù)普惠化。二要推動(dòng)產(chǎn)業(yè)創(chuàng)新發(fā)展,培育新興業(yè)態(tài),助力經(jīng)濟(jì)轉(zhuǎn)型。發(fā)展大數(shù)據(jù)在工業(yè)、新興產(chǎn)業(yè)、農(nóng)業(yè)農(nóng)村等行業(yè)領(lǐng)域應(yīng)用,推動(dòng)大數(shù)據(jù)發(fā)展與科研創(chuàng)新有機(jī)結(jié)合,推進(jìn)基礎(chǔ)研究和核心技術(shù)攻關(guān),形成大數(shù)據(jù)產(chǎn)品體系,完善大數(shù)據(jù)產(chǎn)業(yè)鏈。三要強(qiáng)化安全保障,提高管理水平,促進(jìn)健康發(fā)展。健全大數(shù)據(jù)安全保障體系,強(qiáng)化安全支撐。
2015年9月18日貴州省啟動(dòng)我國首個(gè)大數(shù)據(jù)綜合試驗(yàn)區(qū)的建設(shè)工作,力爭通過3至5年的努力,將貴州大數(shù)據(jù)綜合試驗(yàn)區(qū)建設(shè)成為全國數(shù)據(jù)匯聚應(yīng)用新高地、綜合治理示范區(qū)、產(chǎn)業(yè)發(fā)展聚集區(qū)、創(chuàng)業(yè)創(chuàng)新首選地、政策創(chuàng)新先行區(qū)。
圍繞這一目標(biāo),貴州省將重點(diǎn)構(gòu)建“三大體系”,重點(diǎn)打造“七大平臺(tái)”,實(shí)施“十大工程”。
“三大體系”是指構(gòu)建先行先試的政策法規(guī)體系、跨界融合的產(chǎn)業(yè)生態(tài)體系、防控一體的安全保障體系;“七大平臺(tái)”則是指打造大數(shù)據(jù)示范平臺(tái)、大數(shù)據(jù)集聚平臺(tái)、大數(shù)據(jù)應(yīng)用平臺(tái)、大數(shù)據(jù)交易平臺(tái)、大數(shù)據(jù)金融服務(wù)平臺(tái)、大數(shù)據(jù)交流合作平臺(tái)和大數(shù)據(jù)創(chuàng)業(yè)創(chuàng)新平臺(tái);“十大工程”即實(shí)施數(shù)據(jù)資源匯聚工程、政府?dāng)?shù)據(jù)共享開放工程、綜合治理示范提升工程、大數(shù)據(jù)便民惠民工程、大數(shù)據(jù)三大業(yè)態(tài)培育工程、傳統(tǒng)產(chǎn)業(yè)改造升級(jí)工程、信息基礎(chǔ)設(shè)施提升工程、人才培養(yǎng)引進(jìn)工程、大數(shù)據(jù)安全保障工程和大數(shù)據(jù)區(qū)域試點(diǎn)統(tǒng)籌發(fā)展工程。
此外,貴州省將計(jì)劃通過綜合試驗(yàn)區(qū)建設(shè),探索大數(shù)據(jù)應(yīng)用的創(chuàng)新模式,培育大數(shù)據(jù)交易新的做法,開展數(shù)據(jù)交易的市場(chǎng)試點(diǎn),鼓勵(lì)產(chǎn)業(yè)鏈上下游之間的數(shù)據(jù)交換,規(guī)范數(shù)據(jù)資源的交易行為,促進(jìn)形成新的業(yè)態(tài)。
國家發(fā)展改革委有關(guān)專家表示,大數(shù)據(jù)綜合試驗(yàn)區(qū)建設(shè)不是簡單的建產(chǎn)業(yè)園、建數(shù)據(jù)中心、建云平臺(tái)等,而是要充分依托已有的設(shè)施資源,把現(xiàn)有的利用好,把新建的規(guī)劃好,避免造成空間資源的浪費(fèi)和損失。探索大數(shù)據(jù)應(yīng)用新的模式,圍繞有數(shù)據(jù)、用數(shù)據(jù)、管數(shù)據(jù),開展先行先試,更好地服務(wù)國家大數(shù)據(jù)發(fā)展戰(zhàn)略。
2016年3月17日,《中華人民共和國國民經(jīng)濟(jì)和社會(huì)發(fā)展第十三個(gè)五年規(guī)劃綱要》發(fā)布,其中第二十七章“實(shí)施國家大數(shù)據(jù)戰(zhàn)略”提出:把大數(shù)據(jù)作為基礎(chǔ)性戰(zhàn)略資源,全面實(shí)施促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng),加快推動(dòng)數(shù)據(jù)資源共享開放和開發(fā)應(yīng)用,助力產(chǎn)業(yè)轉(zhuǎn)型升級(jí)和社會(huì)治理創(chuàng)新;具體包括:加快政府?dāng)?shù)據(jù)開放共享、促進(jìn)大數(shù)據(jù)產(chǎn)業(yè)健康發(fā)展。