Domain 2 弱點總結(從錯題反推)
本講義由錯題反推高頻弱點,供複習與考場速查。
錯題集中於兩大核心:
A) 資料角色與責任邊界(最主要弱點,P0)
常見混淆包括:
-
Data Owner vs Data Custodian(保管員):誰「定義分類與政策」vs 誰「技術上管理/落地」
-
Data Steward(資料治理員) vs Data Controller:誰「治理/品質/合規協調」vs 誰「決定處理目的與方式」
-
Controller vs Processor(GDPR):multi-cloud 下如何落實責任劃分(需 governance framework)
-
Shared Responsibility:access control 多數情境由 Cloud Customer 負責 IAM/資料存取控制
本類題目為 Domain 2 的「骨架」;角色判斷錯誤易連帶影響 lifecycle、classification、IRM、audit 等題。
1. Data Steward(資料管家 / 資料治理員)
Data Steward 通常來自業務部門(Business),他們最了解資料的意義、價值與使用場景。他們是資料的「業務守門員」。
-
核心焦點: 資料的品質、意義、規則與合規性。
-
主要職責:
-
定義資料的標準與業務術語(Metadata)。
-
制定資料存取政策(誰有權限看什麼資料)。
-
確保資料品質(準確性、完整性、一致性)。
-
處理資料相關的業務爭議與合規性(如 GDPR、個人資料保護法)。
-
-
常見身分: 業務主管、資料分析師、特定業務流程的負責人。
2. Data Custodian(資料保管員 / 資料維護者)
Data Custodian 通常來自資訊科技部門(IT),他們不一定關心資料裡面的具體業務數字,但他們必須確保這些資料安全、可用且存放妥當。
-
核心焦點: 資料的儲存、安全、技術基礎設施與架構。
-
主要職責:
-
執行 Data Steward 制定的存取政策(設定系統權限)。
-
負責資料庫的日常維運、效能調校。
-
執行資料備份與災難復原計畫(Disaster Recovery)。
-
實施資安防護技術(加密、防火牆、存取監控)。
-
-
常見身分: 資料庫管理員(DBA)、系統管理員、資料工程師。
| 比較項目 | Data Steward (資料管家) | Data Custodian (資料保管員) |
|---|---|---|
| 所屬領域 | 業務端 (Business) | 技術端 (IT) |
| 主要關注點 | 資料的「內容」與「品質」 | 資料的「儲存」與「安全」 |
| 職責性質 | 制定規則、定義政策、業務邏輯 | 執行規則、系統維運、技術實作 |
| 經典問題 | 「這筆資料代表什麼?誰可以看?」 | 「資料要存在哪個伺服器?如何加密?」 |
| 管理對象 | 關心 Data (資料本身) | 關心 Database (資料庫/系統) |
簡單的比喻:圖書館與銀行
-
圖書館比喻: Data Steward 就像是圖書館長/編目員,決定要進哪些書、書要怎麼分類、借閱規則是什麼;Data Custodian 則是圖書館的 IT 人員或保全,負責維護電子借閱系統不當機、確保書架堅固,以及防止書籍被偷。
-
銀行比喻: Data Steward 就像是銀行經理,決定誰有資格開保險箱、裡面應該放什麼;Data Custodian 則是金庫管理員/保全,負責打造堅固的金庫大門、設定密碼鎖並定期巡邏。
B) 資料去識別/遮罩/代碼化(P0)
多次混淆:
-
Data Masking(產生可用於測試/分析的替代資料;包含 substitution/shuffling/variance/nulling…)
-
Tokenization(用 token 取代敏感值,可透過 token vault 對應回原值)
-
Anonymization(去除識別資訊,理想上不可回推;要考慮 indirect identifiers)
Domain 2 各小節加強點與 Priority
Priority 建議:P0=立即補強(高頻+基礎)、P1=次高(常考+已暴露弱點)、P2=後補、尚未考到=本次錯題未覆蓋
2.1 Describe cloud data concepts
-
Data roles(Owner/Controller/Processor/Custodian/Steward/Subject):P0
- 易錯點:Owner vs Custodian、Steward vs Controller、Controller/Processor 責任劃分、shared responsibility 下 access control 主責
-
Cloud data life cycle phases(Create/Store/Use/Share/Archive/Destroy):P1
- 易錯點:Retention/Archive概念題、Destroy phase對應的作法(cryptographic erasure)
-
CIA triad / Authenticity / Non-repudiation:尚未考到
-
Data dispersion / Data flows / DFD:尚未考到
2.2 Design and implement cloud data storage architectures
- 尚未考到(附件沒有 storage 架構/威脅類題目)
2.3 Design and apply data security technologies and strategies
-
Data obfuscation / masking 技術細節(含 shuffling/substitution):P0
- 易錯點:把「可用於測試的假資料」誤認為 anonymization;把 shuffling 誤認為 substitution
-
Tokenization vs Masking 的使用情境與可逆性:P0
- 易錯點:把 tokenization 題選成 masking
-
DLP(Discovery/Monitoring/Enforcement)與監控點(in-motion/in-use/at-rest):尚未考到
-
Encryption/Hashing/Key management:本次不在截圖錯題中(尚未考到)
2.4 Implement data discovery
- Structured / Unstructured / Semi-structured、Data location/jurisdiction:尚未考到
2.5 Plan and implement data classification
-
Classification policy 誰決定(Owner):P1
- 易錯點:「決定分類與政策」的主責角色判斷
-
Data labeling / security label vs marking / metadata:尚未考到
-
Data mapping:尚未考到
2.6 Design and implement IRM
-
Provisioning / Access models(least privilege 如何跨 IaaS/PaaS/SaaS 一致落地):P1
- 易錯點:multi-cloud 下選「各自做 RBAC」而不是「centralized IAM / 統一治理」
-
IRM vs DRM、IP 類型、Certificates in IRM:尚未考到
2.7 Data retention, deletion and archiving
-
Destroy phase / media sanitization / cryptographic erasure(cryptoshredding):P1
- 易錯點:Destroy phase 的最佳作法選成 audit
-
Retention vs Archive 的定位、Legal hold:P1(retention/archiving 題已出現)
2.8 Auditability, traceability and accountability of data events
- Logging / SIEM / chain of custody / non-repudiation:尚未考到
建議補強順序:高投報三包(依序)
P0-1:Data Roles 責任矩陣(背定 + 情境判斷)
用一句話區分(考場超常用):
-
Owner/Controller:定義目的、政策、分類、責任歸屬
-
Custodian:技術落地(備份、存取、容量、可用性)
-
Steward:治理/品質/合規協調(跨部門、全生命週期落實)
-
Processor:受託處理資料(通常是 CSP / SaaS)
-
Customer vs Provider(shared responsibility):資料存取控制/IAM 多數由 Customer 主責
P0-2:Masking vs Tokenization vs Anonymization(一定要拉開)
-
Masking:為了可用性(測試/分析),產生「看起來像真的」的替代值(含 shuffling/substitution)
-
Tokenization:用 token 代替敏感值,可映射回原值(token vault),常見於 PCI
-
Anonymization:目標是不可回推個資(要考慮 indirect identifiers)
P1-3:Lifecycle(尤其 Archive / Destroy)+ Cloud 下可行的刪除策略
-
Archive:長期保存/符合法規保留(retention)+取回成本/可用性
-
Destroy:雲上無法物理粉碎 → 常用 cryptographic erasure / cryptoshredding
錯題分佈(以每題的「主要考點 section」歸類)
總錯題:11 題
| Domain 2 section | 命中錯題數 | 錯題占比(在 11 題內) | 重要度(1-5)* | 風險分數(命中×重要度) | Priority | 對應錯題 |
|---|---|---|---|---|---|---|
| 2.1 Cloud data concepts | 4 | 36.4% | 5 | 20 | P0 | Q6, Q8, Q10, Q11 |
| 2.3 Data security tech/strategy | 3 | 27.3% | 5 | 15 | P0 | Q1, Q2, Q4 |
| 2.7 Retention / deletion / archiving | 2 | 18.2% | 4 | 8 | P1 | Q3, Q9 |
| 2.5 Data classification | 1 | 9.1% | 4 | 4 | P1 | Q5 |
| 2.6 IRM | 1 | 9.1% | 4 | 4 | P1 | Q7 |
| 2.2 Storage architectures | 0 | 0% | 3 | 0 | 尚未考到 | — |
| 2.4 Data discovery | 0 | 0% | 3 | 0 | 尚未考到 | — |
錯題詳解
Q1(2.3 Data obfuscation/masking)
題目:「哪種資料混淆方法會把原始資料改值/打亂,在不暴露敏感資料的情況下做測試或分析?」
-
正解:Data Masking
-
常見誤選: Anonymization
正解說明:Masking
- Masking 的核心目的=“可用”:讓資料看起來像真的、仍可測試/分析(格式、分佈、統計特性可保留),但不是真值。
誤選說明(常見陷阱)
- Anonymization 的核心目的=“不可回推個體”:重點在移除識別性(direct/indirect identifiers),不一定保留可用的真實分佈或格式。
考場口訣
-
Masking = 用來「測試/開發/分析」
-
Anonymization = 用來「隱私/去識別」
Q2(2.3 Data masking techniques)
題目:「把資料值在 dataset 內重新排列,隱藏模式但保留整體特性(避免重新識別)」
-
正解:Shuffling
-
常見誤選: Static Substitution
正解說明:Shuffling
- Shuffling = 重新排列(permutation):把同欄位的值打散交換,保留值集合/分佈,但破壞個體對應關係(降低 re-identification)。
Static Substitution 誤選說明
- Substitution = 替換成別的值(常是“看似真實的假值”):重點是換值,不是重新排列原值。
考場辨識點
-
看到「reorganize / reorder / rearrange values」=Shuffling
-
看到「replace with realistic fake values」=Substitution
Q3(2.7 Retention + lifecycle / 2.1 lifecycle cross)
題目:「雲端資料生命週期中,哪個 phase 透過 retention policies 來確保合規?」
-
正解:Archive
-
常見誤選: Store
正解說明:Archive
-
Archive phase = 長期保存/保留(符合法規保留年限、保留可取回性、通常是低成本冷儲存)。
-
Retention policy 的典型落點就是「何時進 archive、保留多久、何時銷毀」。
Store 誤選說明
- Store 是把資料寫入/持久化到儲存系統;retention 是資料管理政策(保留/歸檔/到期)更貼近 Archive。
考場口訣
-
Retention 合規 → Archive
-
寫入保存 → Store
Q4(2.3 Tokenization)
題目:「用非敏感替代值取代敏感資料,仍能做某些操作且不暴露真值」
-
正解:Tokenization
-
常見誤選: Data Masking
正解說明:Tokenization
- Tokenization 用 token 取代敏感值,可透過 token vault / tokenization system 對回原值(受控可逆)。
Masking 誤選說明
- Masking 多數情境是不可逆或不設計成可回推,重點是可用性(測試/分析),不是受控映射回真值。
秒殺辨識法
-
看到「token / substitute identifier / map back / vault」=Tokenization
-
看到「test data / altered values / scrambled」=Masking
Q5(2.5 Classification policies / roles cross)
題目:「誰決定資料分類等級,並制定保護政策?」
-
正解:Cloud Data Owner
-
常見誤選: Cloud Data Custodian
正解說明:Owner
- Owner(或 Controller)= accountable + 定義政策/分類/風險接受(“決策權”)。
Custodian 誤選說明
- Custodian = 技術落地(備份、存取機制、容量、可用性、restore),不是決策者。
口訣
-
Owner 決定(policy/classification)
-
Custodian 執行(technical controls)
Q6(2.1 Lifecycle concepts in cloud-edge)
題目:「智慧城市 IoT + cloud-edge 生態下,傳統 data roles 哪個面向需要最大調整來因應新安全挑戰?」
-
正解:Data lifecycle management across distributed environments
-
常見誤選: Implementation of edge-specific access controls
正解說明:lifecycle management
-
cloud-edge 讓資料從 create → store → use → share → archive → destroy 分散在裝置、邊緣、雲端、多供應商。
-
真正難的是:可視性、治理一致性、保留/刪除落地、資料流向/責任切割,而不只是 edge 做 RBAC。
誤選說明:為何不夠「最主要」
- edge access control 是其中一個 control;題目問的是「data roles」在新生態需要最大調整的面向,答案更偏 governance/lifecycle。
考場提示
- 看到「IoT / distributed / edge + cloud」且問 “roles adaptation” → 通常指 governance + lifecycle end-to-end
Q7(2.6 IRM / access governance)
題目:「多雲 + IaaS/PaaS/SaaS,如何一致且可擴展地落實 least privilege?」
-
正解:Centralized IAM with adaptive access controls
-
常見誤選: 每個服務模型各自做 RBAC
正解說明:centralized IAM
-
多雲/多模型若各自 RBAC:政策分裂、審計困難、Joiner/Mover/Leaver 風險上升。
-
Centralized IAM(IdP/SSO/政策引擎)才能統一:
-
身份生命週期
-
權限模型與審計
-
動態條件(device posture / location / risk)
-
誤選說明
- 分散 RBAC = 可行但不可控、不可擴展、難以保證一致 least privilege。
口訣
- Multi-cloud least privilege → Central policy + Central identity
Q8(2.1 Data roles: stewardship)
題目:「跨整個資料生命週期(create 到 delete)監督資料安全責任的是誰?」
-
正解:Data Steward
-
常見誤選: Data Controller
正解說明:Data Steward
- Steward = governance/quality/compliance 的“日常監督者與協調者”,確保流程、標準、metadata、使用合規在全生命周期落地。
Controller 誤選說明
- Controller(GDPR)偏向 決定處理目的/方式 的法律角色;不等於負責日常端到端治理與品質/合規營運。
記憶法
-
Controller = 決定“為什麼/怎麼處理”
-
Steward = 確保“整個生命週期都照規矩跑”
Q9(2.7 Destroy / sanitization)
題目:「Destroy phase 在 shared responsibility 下,最能解決雲端資料銷毀挑戰的方法?」
-
正解:Cryptographic erasure(cryptoshredding)
-
常見誤選: Regular third-party security audits
正解說明:cryptographic erasure
-
雲上通常碰不到實體媒體,很難用 shred/incinerate。
-
最可控方式是:資料先加密,到期/需銷毀時安全清除金鑰 → 即使殘留 bit 也不可讀。
Audit 誤選說明
- Audit 是治理/驗證手段,不是「銷毀機制」。
秒殺辨識
- 看到「Destroy phase + cloud + cannot physically destroy」→ cryptoshredding
Q10(2.1 Roles + shared responsibility implication)
題目:「shared responsibility model 下,誰主要負責實作與管理雲端資料的 access control?」
-
正解:Cloud service customer
-
常見誤選: Provider & customer 共同負責
正解說明:customer
-
多數雲模型中:
-
Provider 負責平台/基礎設施安全(底層)
-
Customer 負責資料與其存取權限(IAM/ACL/資料面控制)
題目問的是 data access controls,通常落在 customer。
-
誤選說明(常見陷阱)
- shared responsibility 不是「每一件事都共同」;要看 control 類型。資料存取控制通常屬於 customer 的責任區。
口訣
- Your data, your access = customer
Q11(2.1 Roles + governance: Controller vs Processor)
題目:「多雲下要清楚劃分 Controller/Processor 並確保 GDPR 合規,最有效策略?」
-
正解:Centralized data governance framework with defined roles/responsibilities
-
常見誤選: 為每個雲服務做一份責任矩陣
正解說明:governance framework
-
責任矩陣是產物(artifact),但沒有治理框架就會:
-
版本漂移(不同 BU / 不同供應商)
-
沒有一致的 RACI、流程、批准機制、例外處理
-
很難持續維運
-
-
Central governance framework 才是能長期運作的系統:定義角色、流程、標準、稽核節點、合約/DPAs 的落地方式。
誤選說明
- matrix 是必要但不足;題目問「most effectively」,答案選能系統化、可維運的治理機制。
考場口訣
- 看到「multi-cloud + GDPR + delineate responsibilities」→ governance framework(含流程+角色+契約落地)
建議複習順序(對應 P0/P1)
P0(優先)
- 2.1 Roles/責任邊界:Owner/Controller/Processor/Custodian/Steward + shared responsibility 在 data access 的落點
- 2.3 三分法:Masking vs Tokenization vs Anonymization(含 shuffling/substitution 關鍵字辨識)
P1(次之)
- 2.7 Archive/Destroy + cryptoshredding(雲端刪除高頻考點)
- 2.6 Least privilege 的 centralized IAM 模式
- 2.5 classification policy(Owner)