Academy Central
----
Weather

Domain 2 弱點總結(從錯題反推)

本講義由錯題反推高頻弱點,供複習與考場速查。

錯題集中於兩大核心:

A) 資料角色與責任邊界(最主要弱點,P0)

常見混淆包括:

  • Data Owner vs Data Custodian(保管員):誰「定義分類與政策」vs 誰「技術上管理/落地」

  • Data Steward(資料治理員) vs Data Controller:誰「治理/品質/合規協調」vs 誰「決定處理目的與方式」

  • Controller vs Processor(GDPR):multi-cloud 下如何落實責任劃分(需 governance framework)

  • Shared Responsibility:access control 多數情境由 Cloud Customer 負責 IAM/資料存取控制

本類題目為 Domain 2 的「骨架」;角色判斷錯誤易連帶影響 lifecycle、classification、IRM、audit 等題。


1. Data Steward(資料管家 / 資料治理員)

Data Steward 通常來自業務部門(Business),他們最了解資料的意義、價值與使用場景。他們是資料的「業務守門員」。

  • 核心焦點: 資料的品質、意義、規則與合規性。

  • 主要職責:

    • 定義資料的標準與業務術語(Metadata)。

    • 制定資料存取政策(誰有權限看什麼資料)。

    • 確保資料品質(準確性、完整性、一致性)。

    • 處理資料相關的業務爭議與合規性(如 GDPR、個人資料保護法)。

  • 常見身分: 業務主管、資料分析師、特定業務流程的負責人。


2. Data Custodian(資料保管員 / 資料維護者)

Data Custodian 通常來自資訊科技部門(IT),他們不一定關心資料裡面的具體業務數字,但他們必須確保這些資料安全、可用且存放妥當。

  • 核心焦點: 資料的儲存、安全、技術基礎設施與架構。

  • 主要職責:

    • 執行 Data Steward 制定的存取政策(設定系統權限)。

    • 負責資料庫的日常維運、效能調校。

    • 執行資料備份與災難復原計畫(Disaster Recovery)。

    • 實施資安防護技術(加密、防火牆、存取監控)。

  • 常見身分: 資料庫管理員(DBA)、系統管理員、資料工程師。

比較項目Data Steward (資料管家)Data Custodian (資料保管員)
所屬領域業務端 (Business)技術端 (IT)
主要關注點資料的「內容」與「品質」資料的「儲存」與「安全」
職責性質制定規則、定義政策、業務邏輯執行規則、系統維運、技術實作
經典問題「這筆資料代表什麼?誰可以看?」「資料要存在哪個伺服器?如何加密?」
管理對象關心 Data (資料本身)關心 Database (資料庫/系統)

簡單的比喻:圖書館與銀行

  • 圖書館比喻: Data Steward 就像是圖書館長/編目員,決定要進哪些書、書要怎麼分類、借閱規則是什麼;Data Custodian 則是圖書館的 IT 人員或保全,負責維護電子借閱系統不當機、確保書架堅固,以及防止書籍被偷。

  • 銀行比喻: Data Steward 就像是銀行經理,決定誰有資格開保險箱、裡面應該放什麼;Data Custodian 則是金庫管理員/保全,負責打造堅固的金庫大門、設定密碼鎖並定期巡邏。


B) 資料去識別/遮罩/代碼化(P0)

多次混淆:

  • Data Masking(產生可用於測試/分析的替代資料;包含 substitution/shuffling/variance/nulling…)

  • Tokenization(用 token 取代敏感值,可透過 token vault 對應回原值

  • Anonymization(去除識別資訊,理想上不可回推;要考慮 indirect identifiers)


Domain 2 各小節加強點與 Priority

Priority 建議:P0=立即補強(高頻+基礎)P1=次高(常考+已暴露弱點)P2=後補尚未考到=本次錯題未覆蓋

2.1 Describe cloud data concepts

  • Data roles(Owner/Controller/Processor/Custodian/Steward/Subject)P0

    • 易錯點:Owner vs Custodian、Steward vs Controller、Controller/Processor 責任劃分、shared responsibility 下 access control 主責
  • Cloud data life cycle phases(Create/Store/Use/Share/Archive/Destroy)P1

    • 易錯點:Retention/Archive概念題、Destroy phase對應的作法(cryptographic erasure)
  • CIA triad / Authenticity / Non-repudiation:尚未考到

  • Data dispersion / Data flows / DFD:尚未考到

2.2 Design and implement cloud data storage architectures

  • 尚未考到(附件沒有 storage 架構/威脅類題目)

2.3 Design and apply data security technologies and strategies

  • Data obfuscation / masking 技術細節(含 shuffling/substitution)P0

    • 易錯點:把「可用於測試的假資料」誤認為 anonymization;把 shuffling 誤認為 substitution
  • Tokenization vs Masking 的使用情境與可逆性P0

    • 易錯點:把 tokenization 題選成 masking
  • DLP(Discovery/Monitoring/Enforcement)與監控點(in-motion/in-use/at-rest):尚未考到

  • Encryption/Hashing/Key management:本次不在截圖錯題中(尚未考到)

2.4 Implement data discovery

  • Structured / Unstructured / Semi-structured、Data location/jurisdiction:尚未考到

2.5 Plan and implement data classification

  • Classification policy 誰決定(Owner)P1

    • 易錯點:「決定分類與政策」的主責角色判斷
  • Data labeling / security label vs marking / metadata:尚未考到

  • Data mapping:尚未考到

2.6 Design and implement IRM

  • Provisioning / Access models(least privilege 如何跨 IaaS/PaaS/SaaS 一致落地)P1

    • 易錯點:multi-cloud 下選「各自做 RBAC」而不是「centralized IAM / 統一治理」
  • IRM vs DRM、IP 類型、Certificates in IRM:尚未考到

2.7 Data retention, deletion and archiving

  • Destroy phase / media sanitization / cryptographic erasure(cryptoshredding)P1

    • 易錯點:Destroy phase 的最佳作法選成 audit
  • Retention vs Archive 的定位、Legal hold:P1(retention/archiving 題已出現)

2.8 Auditability, traceability and accountability of data events

  • Logging / SIEM / chain of custody / non-repudiation:尚未考到

建議補強順序:高投報三包(依序)

P0-1:Data Roles 責任矩陣(背定 + 情境判斷)

用一句話區分(考場超常用):

  • Owner/Controller:定義目的、政策、分類、責任歸屬

  • Custodian:技術落地(備份、存取、容量、可用性)

  • Steward:治理/品質/合規協調(跨部門、全生命週期落實)

  • Processor:受託處理資料(通常是 CSP / SaaS)

  • Customer vs Provider(shared responsibility):資料存取控制/IAM 多數由 Customer 主責

P0-2:Masking vs Tokenization vs Anonymization(一定要拉開)

  • Masking:為了可用性(測試/分析),產生「看起來像真的」的替代值(含 shuffling/substitution)

  • Tokenization:用 token 代替敏感值,可映射回原值(token vault),常見於 PCI

  • Anonymization:目標是不可回推個資(要考慮 indirect identifiers)

P1-3:Lifecycle(尤其 Archive / Destroy)+ Cloud 下可行的刪除策略

  • Archive:長期保存/符合法規保留(retention)+取回成本/可用性

  • Destroy:雲上無法物理粉碎 → 常用 cryptographic erasure / cryptoshredding


錯題分佈(以每題的「主要考點 section」歸類)

總錯題:11 題

Domain 2 section命中錯題數錯題占比(在 11 題內)重要度(1-5)*風險分數(命中×重要度)Priority對應錯題
2.1 Cloud data concepts436.4%520P0Q6, Q8, Q10, Q11
2.3 Data security tech/strategy327.3%515P0Q1, Q2, Q4
2.7 Retention / deletion / archiving218.2%48P1Q3, Q9
2.5 Data classification19.1%44P1Q5
2.6 IRM19.1%44P1Q7
2.2 Storage architectures00%30尚未考到
2.4 Data discovery00%30尚未考到

錯題詳解

Q1(2.3 Data obfuscation/masking)

題目:「哪種資料混淆方法會把原始資料改值/打亂,在不暴露敏感資料的情況下做測試或分析?」

  • 正解:Data Masking

  • 常見誤選: Anonymization

正解說明:Masking

  • Masking 的核心目的=“可用”:讓資料看起來像真的、仍可測試/分析(格式、分佈、統計特性可保留),但不是真值。

誤選說明(常見陷阱)

  • Anonymization 的核心目的=“不可回推個體”:重點在移除識別性(direct/indirect identifiers),不一定保留可用的真實分佈或格式。

考場口訣

  • Masking = 用來「測試/開發/分析」

  • Anonymization = 用來「隱私/去識別」


Q2(2.3 Data masking techniques)

題目:「把資料值在 dataset 內重新排列,隱藏模式但保留整體特性(避免重新識別)」

  • 正解:Shuffling

  • 常見誤選: Static Substitution

正解說明:Shuffling

  • Shuffling = 重新排列(permutation):把同欄位的值打散交換,保留值集合/分佈,但破壞個體對應關係(降低 re-identification)。

Static Substitution 誤選說明

  • Substitution = 替換成別的值(常是“看似真實的假值”):重點是換值,不是重新排列原值。

考場辨識點

  • 看到「reorganize / reorder / rearrange values」=Shuffling

  • 看到「replace with realistic fake values」=Substitution


Q3(2.7 Retention + lifecycle / 2.1 lifecycle cross)

題目:「雲端資料生命週期中,哪個 phase 透過 retention policies 來確保合規?」

  • 正解:Archive

  • 常見誤選: Store

正解說明:Archive

  • Archive phase = 長期保存/保留(符合法規保留年限、保留可取回性、通常是低成本冷儲存)。

  • Retention policy 的典型落點就是「何時進 archive、保留多久、何時銷毀」。

Store 誤選說明

  • Store 是把資料寫入/持久化到儲存系統;retention 是資料管理政策(保留/歸檔/到期)更貼近 Archive。

考場口訣

  • Retention 合規 → Archive

  • 寫入保存 → Store


Q4(2.3 Tokenization)

題目:「用非敏感替代值取代敏感資料,仍能做某些操作且不暴露真值」

  • 正解:Tokenization

  • 常見誤選: Data Masking

正解說明:Tokenization

  • Tokenization 用 token 取代敏感值,可透過 token vault / tokenization system 對回原值(受控可逆)。

Masking 誤選說明

  • Masking 多數情境是不可逆或不設計成可回推,重點是可用性(測試/分析),不是受控映射回真值。

秒殺辨識法

  • 看到「token / substitute identifier / map back / vault」=Tokenization

  • 看到「test data / altered values / scrambled」=Masking


Q5(2.5 Classification policies / roles cross)

題目:「誰決定資料分類等級,並制定保護政策?」

  • 正解:Cloud Data Owner

  • 常見誤選: Cloud Data Custodian

正解說明:Owner

  • Owner(或 Controller)= accountable + 定義政策/分類/風險接受(“決策權”)。

Custodian 誤選說明

  • Custodian = 技術落地(備份、存取機制、容量、可用性、restore),不是決策者。

口訣

  • Owner 決定(policy/classification)

  • Custodian 執行(technical controls)


Q6(2.1 Lifecycle concepts in cloud-edge)

題目:「智慧城市 IoT + cloud-edge 生態下,傳統 data roles 哪個面向需要最大調整來因應新安全挑戰?」

  • 正解:Data lifecycle management across distributed environments

  • 常見誤選: Implementation of edge-specific access controls

正解說明:lifecycle management

  • cloud-edge 讓資料從 create → store → use → share → archive → destroy 分散在裝置、邊緣、雲端、多供應商。

  • 真正難的是:可視性、治理一致性、保留/刪除落地、資料流向/責任切割,而不只是 edge 做 RBAC。

誤選說明:為何不夠「最主要」

  • edge access control 是其中一個 control;題目問的是「data roles」在新生態需要最大調整的面向,答案更偏 governance/lifecycle。

考場提示

  • 看到「IoT / distributed / edge + cloud」且問 “roles adaptation” → 通常指 governance + lifecycle end-to-end

Q7(2.6 IRM / access governance)

題目:「多雲 + IaaS/PaaS/SaaS,如何一致且可擴展地落實 least privilege?」

  • 正解:Centralized IAM with adaptive access controls

  • 常見誤選: 每個服務模型各自做 RBAC

正解說明:centralized IAM

  • 多雲/多模型若各自 RBAC:政策分裂、審計困難、Joiner/Mover/Leaver 風險上升。

  • Centralized IAM(IdP/SSO/政策引擎)才能統一:

    • 身份生命週期

    • 權限模型與審計

    • 動態條件(device posture / location / risk)

誤選說明

  • 分散 RBAC = 可行但不可控、不可擴展、難以保證一致 least privilege。

口訣

  • Multi-cloud least privilege → Central policy + Central identity

Q8(2.1 Data roles: stewardship)

題目:「跨整個資料生命週期(create 到 delete)監督資料安全責任的是誰?」

  • 正解:Data Steward

  • 常見誤選: Data Controller

正解說明:Data Steward

  • Steward = governance/quality/compliance 的“日常監督者與協調者”,確保流程、標準、metadata、使用合規在全生命周期落地。

Controller 誤選說明

  • Controller(GDPR)偏向 決定處理目的/方式 的法律角色;不等於負責日常端到端治理與品質/合規營運。

記憶法

  • Controller = 決定“為什麼/怎麼處理”

  • Steward = 確保“整個生命週期都照規矩跑”


Q9(2.7 Destroy / sanitization)

題目:「Destroy phase 在 shared responsibility 下,最能解決雲端資料銷毀挑戰的方法?」

  • 正解:Cryptographic erasure(cryptoshredding)

  • 常見誤選: Regular third-party security audits

正解說明:cryptographic erasure

  • 雲上通常碰不到實體媒體,很難用 shred/incinerate。

  • 最可控方式是:資料先加密,到期/需銷毀時安全清除金鑰 → 即使殘留 bit 也不可讀。

Audit 誤選說明

  • Audit 是治理/驗證手段,不是「銷毀機制」。

秒殺辨識

  • 看到「Destroy phase + cloud + cannot physically destroy」→ cryptoshredding

Q10(2.1 Roles + shared responsibility implication)

題目:「shared responsibility model 下,誰主要負責實作與管理雲端資料的 access control?」

  • 正解:Cloud service customer

  • 常見誤選: Provider & customer 共同負責

正解說明:customer

  • 多數雲模型中:

    • Provider 負責平台/基礎設施安全(底層)

    • Customer 負責資料與其存取權限(IAM/ACL/資料面控制)
      題目問的是 data access controls,通常落在 customer。

誤選說明(常見陷阱)

  • shared responsibility 不是「每一件事都共同」;要看 control 類型。資料存取控制通常屬於 customer 的責任區。

口訣

  • Your data, your access = customer

Q11(2.1 Roles + governance: Controller vs Processor)

題目:「多雲下要清楚劃分 Controller/Processor 並確保 GDPR 合規,最有效策略?」

  • 正解:Centralized data governance framework with defined roles/responsibilities

  • 常見誤選: 為每個雲服務做一份責任矩陣

正解說明:governance framework

  • 責任矩陣是產物(artifact),但沒有治理框架就會:

    • 版本漂移(不同 BU / 不同供應商)

    • 沒有一致的 RACI、流程、批准機制、例外處理

    • 很難持續維運

  • Central governance framework 才是能長期運作的系統:定義角色、流程、標準、稽核節點、合約/DPAs 的落地方式。

誤選說明

  • matrix 是必要但不足;題目問「most effectively」,答案選能系統化、可維運的治理機制。

考場口訣

  • 看到「multi-cloud + GDPR + delineate responsibilities」→ governance framework(含流程+角色+契約落地)

建議複習順序(對應 P0/P1)

P0(優先)

  1. 2.1 Roles/責任邊界:Owner/Controller/Processor/Custodian/Steward + shared responsibility 在 data access 的落點
  2. 2.3 三分法:Masking vs Tokenization vs Anonymization(含 shuffling/substitution 關鍵字辨識)

P1(次之)

  1. 2.7 Archive/Destroy + cryptoshredding(雲端刪除高頻考點)
  2. 2.6 Least privilege 的 centralized IAM 模式
  3. 2.5 classification policy(Owner)