-
- 素材大。
- 1.1 MB
- 素材授權(quán):
- 免費(fèi)下載
- 素材格式:
- .ppt
- 素材上傳:
- lipeier
- 上傳時(shí)間:
- 2019-11-13
- 素材編號(hào):
- 245844
- 素材類別:
- 課件PPT
-
素材預(yù)覽
這是大數(shù)據(jù)信息安全ppt,包括了大數(shù)據(jù)研究概述,大數(shù)據(jù)帶來的安全挑戰(zhàn),大數(shù)據(jù)安全的關(guān)鍵技術(shù),大數(shù)據(jù)服務(wù)與信息安全等內(nèi)容,歡迎點(diǎn)擊下載。
大數(shù)據(jù)信息安全ppt是由紅軟PPT免費(fèi)下載網(wǎng)推薦的一款課件PPT類型的PowerPoint.
大數(shù)據(jù)安全與隱私保護(hù) Table of Contents 1.大數(shù)據(jù)研究概述 普遍的觀點(diǎn)認(rèn)為,大數(shù)據(jù)是指規(guī)模大且復(fù)雜、以至于很難用現(xiàn)有數(shù)據(jù)庫管理工具或數(shù)據(jù)處理應(yīng)用來處理的數(shù)據(jù)集,大數(shù)據(jù)的常見特點(diǎn)包括大規(guī)模(volume)、高速性(velocity)和多樣性(variety). 根據(jù)來源的不同,大數(shù)據(jù)大致可分為如下幾類 : (1)來自于人.人們在互聯(lián)網(wǎng)活動(dòng)以及使用移動(dòng)互聯(lián)網(wǎng)過程中所產(chǎn)生的各類數(shù)據(jù),包括文字、圖片、視頻等信息; (2)來自于機(jī).各類計(jì)算機(jī)信息系統(tǒng)產(chǎn)生的數(shù)據(jù),以文件、數(shù)據(jù)庫、多媒體等形式存在,也包括審計(jì)、日志等自動(dòng)生成的信息; (3)來自于物.各類數(shù)字設(shè)備所采集的數(shù)據(jù).如攝像頭產(chǎn)生的數(shù)字信號(hào)、醫(yī)療物聯(lián)網(wǎng)中產(chǎn)生的人的各項(xiàng)特征值、天文望遠(yuǎn)鏡所產(chǎn)生的大量數(shù)據(jù)等. 2.大數(shù)據(jù)帶來的安全挑戰(zhàn) 科學(xué)技術(shù)是一把雙刃劍.大數(shù)據(jù)所引發(fā)的安全問題與其帶來的價(jià)值同樣引人注目.而最近爆發(fā)的“棱鏡門”事件更加劇了人們對大數(shù)據(jù)安全的擔(dān)憂.與傳統(tǒng)的信息安全問題相比,大數(shù)據(jù)安全面臨的挑戰(zhàn)性問題主要體現(xiàn)在以下幾個(gè)方面. 1.大數(shù)據(jù)中的用戶隱私保護(hù) 2.大數(shù)據(jù)的可信性 3.如何實(shí)現(xiàn)大數(shù)據(jù)訪問控制 2.1 大數(shù)據(jù)中用戶隱私保護(hù) 大量事實(shí)表明,大數(shù)據(jù)未被妥善處理會(huì)對用戶的隱私造成極大的侵害.根據(jù)需要保護(hù)的內(nèi)容不同,隱私保護(hù)又可以進(jìn)一步細(xì)分為位置隱私保護(hù)、標(biāo)識(shí)符匿名保護(hù)、連接關(guān)系匿名保護(hù)等. 當(dāng)前企業(yè)常常認(rèn)為經(jīng)過匿名處理后,信息不包含用戶的標(biāo)識(shí)符,就可以公開發(fā)布了.但事實(shí)上,僅通過匿名保護(hù)并不能很好地達(dá)到隱私保護(hù)目標(biāo)。 例如,AOL公司曾公布了匿名處理后的3個(gè)月內(nèi)部分搜索歷史,供人們分析使用.雖然個(gè)人相關(guān)的標(biāo)識(shí)信息被精心處理過,但其中的某些記錄項(xiàng)還是可以被準(zhǔn)確地定位到具體的個(gè)人.紐約時(shí)報(bào)隨即公布了其識(shí)別出的1位用戶.編號(hào)為4 417 749的用戶是1位62歲的寡居?jì)D人,家里養(yǎng)了3條狗,患有某種疾病,等等。 另一個(gè)相似的例子是,著名的DVD租賃商N(yùn)etflix曾公布了約5O萬用戶的租賃信息,懸賞100萬美元征集算法,以期提高電影推薦系統(tǒng)的準(zhǔn)確度.但是當(dāng)上述信息與其它數(shù)據(jù)源結(jié)合時(shí),部分用戶還是被識(shí)別出來了.研究者發(fā)現(xiàn),Netflix中的用戶有很大概率對非top100、top500、top1000的影片進(jìn)行過評分,而根據(jù)對非top影片的評分結(jié)果進(jìn)行去匿名化(de—anonymizing)攻擊的效果更好L2 . 對此,我們可以采取的措施有: (1)數(shù)據(jù)采集時(shí)的隱私保護(hù),如數(shù)據(jù)精度處理; (2)數(shù)據(jù)共享、發(fā)布時(shí)的隱私保護(hù),如數(shù)據(jù)的匿名處理、人工加擾等; (3)數(shù)據(jù)分析時(shí)的隱私保護(hù); (4)數(shù)據(jù)生命周期的隱私保護(hù); (5)隱私數(shù)據(jù)可信銷毀等. 2.2 大數(shù)據(jù)的可信性 關(guān)于大數(shù)據(jù)的一個(gè)普遍的觀點(diǎn)是,數(shù)據(jù)自己可以說明一切,數(shù)據(jù)自身就是事實(shí).但實(shí)際情況是,如果不仔細(xì)甄別,數(shù)據(jù)也會(huì)欺騙,就像人們有時(shí)會(huì)被自己的雙眼欺騙一樣. 大數(shù)據(jù)可信性的威脅之一是偽造或刻意制造的數(shù)據(jù),而錯(cuò)誤的數(shù)據(jù)往往會(huì)導(dǎo)致錯(cuò)誤的結(jié)論.若數(shù)據(jù)應(yīng)用場景明確,就可能有人刻意制造數(shù)據(jù)、營造某種“假象”,誘導(dǎo)分析者得出對其有利的結(jié)論.由于虛假信息往往隱藏于大量信息中,使得人們無法鑒別真?zhèn),從而做出錯(cuò)誤判斷. 例如,一些點(diǎn)評網(wǎng)站上的虛假評論,混雜在真實(shí)評論中使得用戶無法分辨,可能誤導(dǎo)用戶去選擇某些劣質(zhì)商品或服務(wù).由于當(dāng)前網(wǎng)絡(luò)社區(qū)中虛假信息的產(chǎn)生和傳播變得越來越容易,其所產(chǎn)生的影響不可低估.用信息安全技術(shù)手段鑒別所有來源的真實(shí)性是不可能的. 大數(shù)據(jù)可信性的威脅之二是數(shù)據(jù)在傳播中的逐步失真.原因之一是人工干預(yù)的數(shù)據(jù)采集過程可能引入誤差,由于失誤導(dǎo)致數(shù)據(jù)失真與偏差,最終影響數(shù)據(jù)分析結(jié)果的準(zhǔn)確性.此外,數(shù)據(jù)失真還有數(shù)據(jù)的版本變更的因素.在傳播過程中,現(xiàn)實(shí)情況發(fā)生了變化,早期采集的數(shù)據(jù)已經(jīng)不能反映真實(shí)情況.例如,餐館電話號(hào)碼已經(jīng)變更,但早期的信息已經(jīng)被其它搜索引擎或應(yīng)用收錄,所以用戶可能看到矛盾的信息而影響其判斷. 因此,大數(shù)據(jù)的使用者應(yīng)該有能力基于數(shù)據(jù)來源的真實(shí)性、數(shù)據(jù)傳播途徑、數(shù)據(jù)加工處理過程等,了解各項(xiàng)數(shù)據(jù)可信度,防止分析得出無意義或者錯(cuò)誤的結(jié)果. 密碼學(xué)中的數(shù)字簽名、消息鑒別碼等技術(shù)可以用于驗(yàn)證數(shù)據(jù)的完整性,但應(yīng)用于大數(shù)據(jù)的真實(shí)性時(shí)面臨很大困難,主要根源在于數(shù)據(jù)粒度的差異.例如,數(shù)據(jù)的發(fā)源方可以對整個(gè)信息簽名,但是當(dāng)信息分解成若干組成部分時(shí),該簽名無法驗(yàn)證每個(gè)部分的完整性.而數(shù)據(jù)的發(fā)源方無法事先預(yù)知哪些部分被利用、如何被利用,難以事先為其生成驗(yàn)證對象. 2.3 如何實(shí)現(xiàn)大數(shù)據(jù)訪問控制 大數(shù)據(jù)訪問控制的特點(diǎn)與難點(diǎn)在于: (1)難以預(yù)設(shè)角色,實(shí)現(xiàn)角色劃分. (2)難以預(yù)知每個(gè)角色的實(shí)際權(quán)限, 此外,不同類型的大數(shù)據(jù)中可能存在多樣化的訪問控制需求。例如,在Web2.0個(gè)人用戶數(shù)據(jù)中,存在基于歷史記錄的訪問控制;在地理地圖數(shù)據(jù)中,存在基于尺度以及數(shù)據(jù)精度的訪問控制需求;在流數(shù)據(jù)處理中,存在數(shù)據(jù)時(shí)間區(qū)間的訪問控制需求,等等.如何統(tǒng)一地描述與表達(dá)訪問控制需求也是一個(gè)挑戰(zhàn)性問題. 3.大數(shù)據(jù)安全與隱私保護(hù)關(guān)鍵技術(shù) 當(dāng)前亟需針對前述大數(shù)據(jù)面臨的用戶隱私保護(hù)、數(shù)據(jù)內(nèi)容可信驗(yàn)證、訪問控制等安全挑戰(zhàn),展開大數(shù)據(jù)安全關(guān)鍵技術(shù)研究.本節(jié)選取部分重點(diǎn)相關(guān)研究領(lǐng)域予以介紹. 3.1 數(shù)據(jù)發(fā)布匿名保護(hù)技術(shù) 3.2 社交網(wǎng)絡(luò)匿名保護(hù)技術(shù) 3.3 數(shù)據(jù)水印技術(shù) 3.4 數(shù)據(jù)溯源技術(shù) 4.5 風(fēng)險(xiǎn)自適應(yīng)的訪問控制 3.1 數(shù)據(jù)發(fā)布匿名保護(hù)技術(shù) 對于大數(shù)據(jù)中的結(jié)構(gòu)化數(shù)據(jù)(或稱關(guān)系數(shù)據(jù))而言,數(shù)據(jù)發(fā)布匿名保護(hù)是實(shí)現(xiàn)其隱私保護(hù)的核心關(guān)鍵技術(shù)與基本手段,目前仍處于不斷發(fā)展與完善階段. 以典型的k 匿名方案為例.?dāng)?shù)據(jù)表的k-匿名化( k-anonymization) 是數(shù)據(jù)發(fā)布時(shí)保護(hù)私有信息的一種重要方法。 k-匿名技術(shù)是1998 年由Samarati和Sweeney [1]提出的 ,它要求發(fā)布的數(shù)據(jù)中存在一定數(shù)量(至少為k) 的在準(zhǔn)標(biāo)識(shí)符上不可區(qū)分的記錄,使攻擊者不能判別出隱私信息所屬的具體個(gè)體,從而保護(hù)了個(gè)人隱私, k-匿名通過參數(shù)k指定用戶可承受的最大信息泄露風(fēng)險(xiǎn)。k-匿名化在一定程度上保護(hù)了個(gè)人的隱私,但同時(shí)會(huì)降低數(shù)據(jù)的可用性。 早期的方案及其優(yōu)化方案通過元組泛化、抑制等數(shù)據(jù)處理,將準(zhǔn)標(biāo)識(shí)符分組.每個(gè)分組中的準(zhǔn)標(biāo)識(shí)符相同且至少包含k個(gè)元組,因而每個(gè)元組至少與k-1個(gè)其它元組不可區(qū)分.由于k匿名模型是針對所有屬性集合而言,對于具體的某個(gè)屬性則未加定義,容易出現(xiàn)某個(gè)屬性匿名處理不足的情況.若某等價(jià)類中某個(gè)敏感屬性上取值一致,則攻擊者可以有效地確定該屬性值. 在大數(shù)據(jù)場景中,數(shù)據(jù)發(fā)布匿名保護(hù)問題較之更為復(fù)雜:攻擊者可以從多種渠道獲得數(shù)據(jù),而不僅僅是同一發(fā)布源.例如,在前所提及的Netflix應(yīng)用中,人們發(fā)現(xiàn)攻擊者可通過將數(shù)據(jù)與公開可獲得的imdb相對比,從而識(shí)別出目標(biāo)在Netflix的賬號(hào).并據(jù)此獲取用戶的政治傾向與宗教信仰等(通過用戶的觀看歷史和對某些電影的評論和打分分析獲得).此類問題有待更深入的研究. 3.2 社交網(wǎng)絡(luò)匿名保護(hù)技術(shù) 社交網(wǎng)絡(luò)產(chǎn)生的數(shù)據(jù)是大數(shù)據(jù)的重要來源之一,同時(shí)這些數(shù)據(jù)中包含大量用戶隱私數(shù)據(jù).截至2012年10月Facebook的用戶成員就已達(dá)10億.由于社交網(wǎng)絡(luò)具有圖結(jié)構(gòu)特征,其匿名保護(hù)技術(shù)與結(jié)構(gòu)化數(shù)據(jù)有很大不同. 社交網(wǎng)絡(luò)中的典型匿名保護(hù)需求為用戶標(biāo)識(shí)匿名與屬性匿名(又稱點(diǎn)匿名),在數(shù)據(jù)發(fā)布時(shí)隱藏了用戶的標(biāo)識(shí)與屬性信息;以及用戶間關(guān)系匿名(又稱邊匿名),在數(shù)據(jù)發(fā)布時(shí)隱藏用戶間的關(guān)系.而攻擊者試圖利用節(jié)點(diǎn)的各種屬性(度數(shù)、標(biāo)簽、某些具體連接信息等),重新識(shí)別出圖中節(jié)點(diǎn)的身份信息. 社交網(wǎng)絡(luò)匿名方案面臨的重要問題是,攻擊者可能通過其它公開的信息推測出匿名用戶,尤其是用戶之間是否存在連接關(guān)系.例如,可以基于弱連接對用戶可能存在的連接進(jìn)行預(yù)測,適用于用戶關(guān)系較為稀疏的網(wǎng)絡(luò);根據(jù)現(xiàn)有社交結(jié)構(gòu)對人群中的等級(jí)關(guān)系進(jìn)行恢復(fù)和推測;針對微博型的復(fù)合社交網(wǎng)絡(luò)進(jìn)行分析與關(guān)系預(yù)測;基于限制隨機(jī)游走方法,推測不同連接關(guān)系存在的概率,等等.研究表明,社交網(wǎng)絡(luò)的集聚特性對于關(guān)系預(yù)測方法的準(zhǔn)確性具有重要影響,社交網(wǎng)絡(luò)局部連接密度增長,集聚系數(shù)增大,則連接預(yù)測算法的準(zhǔn)確性進(jìn)一步增強(qiáng).因此,未來的匿名保護(hù)技術(shù)應(yīng)可以有效抵抗此類推測攻擊. 3.3 數(shù)據(jù)水印技術(shù) 數(shù)字水印是指將標(biāo)識(shí)信息以難以察覺的方式嵌入在數(shù)據(jù)載體內(nèi)部且不影響其使用的方法,多見于多媒體數(shù)據(jù)版權(quán)保護(hù).也有部分針對數(shù)據(jù)庫和文本文件的水印方案. 由數(shù)據(jù)的無序性、動(dòng)態(tài)性等特點(diǎn)所決定,在數(shù)據(jù)庫、文檔中添加水印的方法與多媒體載體上有很大不同.其基本前提是上述數(shù)據(jù)中存在冗余信息或可容忍一定精度誤差。 例如,Agrawal等人基于數(shù)據(jù)庫中數(shù)值型數(shù)據(jù)存在誤差容忍范圍,將少量水印信息嵌入到這些數(shù)據(jù)中隨機(jī)選取的最不重要位上. 而Sion等人提出一種基于數(shù)據(jù)集合統(tǒng)計(jì)特征的方案,將一比特水印信息嵌入在一組屬性數(shù)據(jù)中,防止攻擊者破壞水印。 此外,通過將數(shù)據(jù)庫指紋信息嵌入水印中[62],可以識(shí)別出信息的所有者以及被分發(fā)的對象,有利于在分布式環(huán)境下追蹤泄密者。 通過采用獨(dú)立分量分析技術(shù)(簡稱ICA),可以實(shí)現(xiàn)無需密鑰的水印公開驗(yàn)證。 上述水印方案中有些可用于部分?jǐn)?shù)據(jù)的驗(yàn)證. 例如殘余元組數(shù)量達(dá)到閾值就可以成功驗(yàn)證出水。撎匦栽诖髷(shù)據(jù)應(yīng)用場景下具有廣闊的發(fā)展前景, 例如:強(qiáng)健水印類(RobustWatermark)可用于大數(shù)據(jù)的起源證明, 而脆弱水印類(Fragile。祝幔簦澹颍恚幔颍耄┛捎糜诖髷(shù)據(jù)的真實(shí)性證明. 存在問題之一是當(dāng)前的方案多基于靜態(tài)數(shù)據(jù)集,針對大數(shù)據(jù)的高速產(chǎn)生與更新的特性考慮不足,這是未來亟待提高的方向. 3.4 數(shù)據(jù)溯源技術(shù) 如前所述,數(shù)據(jù)集成是大數(shù)據(jù)前期處理的步驟之一.由于數(shù)據(jù)的來源多樣化,所以有必要記錄數(shù)據(jù)的來源及其傳播、計(jì)算過程,為后期的挖掘與決策提供輔助支持.早在大數(shù)據(jù)概念出現(xiàn)之前,數(shù)據(jù)溯源(DataProvenance)技術(shù)就在數(shù)據(jù)庫領(lǐng)域得到廣泛研究.其基本出發(fā)點(diǎn)是幫助人們確定數(shù)據(jù)倉庫中各項(xiàng)數(shù)據(jù)的來源,例如了解它們是由哪些表中的哪些數(shù)據(jù)項(xiàng)運(yùn)算而成,據(jù)此可以方便地驗(yàn)算結(jié)果的正確性,或者以極小的代價(jià)進(jìn)行數(shù)據(jù)更新。 未來數(shù)據(jù)溯源技術(shù)將在信息安全領(lǐng)域發(fā)揮重要作用.在2009年呈報(bào)美國國土安全部的“國家網(wǎng)絡(luò)空間安全”的報(bào)告中,將其列為未來確保國家關(guān)鍵基礎(chǔ)設(shè)施安全的3項(xiàng)關(guān)鍵技術(shù)之一.然而,數(shù)據(jù)溯源技術(shù)應(yīng)用于大數(shù)據(jù)安全與隱私保護(hù)中還面臨如下挑戰(zhàn): (1)數(shù)據(jù)溯源與隱私保護(hù)之間的平衡.一方面,基于數(shù)據(jù)溯源對大數(shù)據(jù)進(jìn)行安全保護(hù)首先要通過分析技術(shù)獲得大數(shù)據(jù)的來源,然后才能更好地支持安全策略和安全機(jī)制的工作;另一方面,數(shù)據(jù)來源往往本身就是隱私敏感數(shù)據(jù).用戶不希望這方面的數(shù)據(jù)被分析者獲得.因此,如何平衡這兩者的關(guān)系是值得研究的問題之一. (2)數(shù)據(jù)溯源技術(shù)自身的安全性保護(hù).當(dāng)前數(shù)據(jù)溯源技術(shù)并沒有充分考慮安全問題,例如標(biāo)記自身是否正確、標(biāo)記信息與數(shù)據(jù)內(nèi)容之間是否安全綁定等等.而在大數(shù)據(jù)環(huán)境下,其大規(guī)模、高速性、多樣性等特點(diǎn)使該問題更加突出. 3.5 風(fēng)險(xiǎn)自適應(yīng)的訪問控制 在大數(shù)據(jù)場景中,安全管理員可能缺乏足夠的專業(yè)知識(shí),無法準(zhǔn)確地為用戶指定其可以訪問的數(shù)據(jù).風(fēng)險(xiǎn)自適應(yīng)的訪問控制是針對這種場景討論較多的一種訪問控制方法.jason的報(bào)告描述了風(fēng)險(xiǎn)量化和訪問配額的概念.隨后,cheng等人提出了一個(gè)基于多級(jí)別安全模型的風(fēng)險(xiǎn)自適應(yīng)訪問控制解決方案.Ni等人提出了另一個(gè)基于模糊推理的解決方案,將信息的數(shù)目和用戶以及信息的安全等級(jí)作為進(jìn)行風(fēng)險(xiǎn)量化的主要參考參數(shù).當(dāng)用戶訪問的資源的風(fēng)險(xiǎn)數(shù)值高于某個(gè)預(yù)定的門限時(shí),則限制用戶繼續(xù)訪問。 4.大數(shù)據(jù)服務(wù)與信息安全 大數(shù)據(jù)與“安全-即-服務(wù)(security-as-service) 前面列舉了部分當(dāng)前基于大數(shù)據(jù)的信息安全技術(shù),未來必將涌現(xiàn)出更多、更豐富的安全應(yīng)用和安全服務(wù).由于此類技術(shù)以大數(shù)據(jù)分析為基礎(chǔ),因此如何收集、存儲(chǔ)和管理大數(shù)據(jù)就是相關(guān)企業(yè)或組織所面臨的核心問題.除了極少數(shù)企業(yè)有能力做到之外,對于絕大多數(shù)信息安全企業(yè)來說,更為現(xiàn)實(shí)的方式是通過某種方式獲得大數(shù)據(jù)服務(wù),結(jié)合自己的技術(shù)特色領(lǐng)域,對外提供安全服務(wù).一種未來的發(fā)展前景是,以底層大數(shù)據(jù)服務(wù)為基礎(chǔ),各個(gè)企業(yè)之間組成相互依賴、相互支撐的信息安全服務(wù)體系,總體上形成信息安全產(chǎn)業(yè)界的良好生態(tài)環(huán)境.
大數(shù)據(jù)與精準(zhǔn)醫(yī)療ppt:這是大數(shù)據(jù)與精準(zhǔn)醫(yī)療ppt,包括了中國居民營養(yǎng)與慢性疾病狀況報(bào)告,醫(yī)療大數(shù)據(jù)提升醫(yī)療服務(wù)效率,大數(shù)據(jù)在治療中的優(yōu)點(diǎn)等內(nèi)容,歡迎點(diǎn)擊下載。
大數(shù)據(jù)數(shù)據(jù)挖掘ppt:這是大數(shù)據(jù)數(shù)據(jù)挖掘ppt,包括了大數(shù)據(jù)平臺(tái)生態(tài)系統(tǒng),應(yīng)用與研究,軟件著作權(quán),大數(shù)據(jù)是什么?數(shù)據(jù)挖掘是什么,解決方案-比賽任務(wù)等內(nèi)容,歡迎點(diǎn)擊下載。
大數(shù)據(jù)開放日ppt:這是大數(shù)據(jù)開放日ppt,包括了你會(huì)認(rèn)嗎?你會(huì)讀嗎?你會(huì)記嗎?你能有節(jié)奏地讀課文嗎?你能快樂地朗誦嗎等內(nèi)容,歡迎點(diǎn)擊下載。