数据安全与分级

适用对象：通用｜ ⚠️ 建议性规范，待学校政策对齐｜ 更新于：2026-06-01

先懂一件事：发给 AI 看 = 上云

你的 Claude Code / Codex 背后连的是 DeepSeek 云端。

整个数据安全的核心，就是分清这两件事。

把手头的材料对号入座，再决定怎么处理。

级别	典型例子	能否给云端 AI 看	怎么用
公开	已发表论文、公开教材、官网公告、公开统计年鉴	✅ 可以	直接贴给 AI 读、总结、提炼。仍需核实 AI 转述是否准确。
内部	课程大纲、教学 PPT、未公开但不敏感的工作材料、已脱敏的汇总数据	⚠️ 谨慎	不含个人隐私、不涉密的可以给；拿不准的先去标识、只给必要片段。
敏感	学生信息 / 成绩 / 名单、问卷原始作答、未发表的论文与数据、访谈原始记录	❌ 不直接上云	走「AI 写代码、本地跑」，或彻底脱敏（去掉姓名学号等）后再考虑。
涉密	基金申请书（本子）、评审意见、保密协议下的数据、涉及国家 / 商业秘密的材料	🚫 绝不上云	不放进任何联网 AI。以学校保密规定为准，必要时完全离线处理。

这是经管师生最该掌握的一招：让 AI 只看”数据长什么样”（列名、结构、规则），不看”数据是什么”（真实的每一行）。 AI 产出代码，你在自己电脑上对真实数据运行。

假设你有一份问卷的原始作答（每一行是一个学生的真实回答），想算各维度的 Cronbach’s α。

❌ 错误做法（数据上云）：

“这是我的问卷数据（附上整张表），帮我算信度。”

这样整张真实作答都传到了云端。

✅ 正确做法（AI 只看列名）：

“我有一份问卷数据，列名是 A1–A20、性别、年龄、年级。量表有 4 个维度，每维 5 题（A1–A5、A6–A10、A11–A15、A16–A20），反向题是 A5、A12。帮我写一段 Python 代码算各维度的 Cronbach’s α，读取本地的 survey.csv。”

AI 给你一段代码，你在自己电脑上运行它——跑的是真实数据，但 AI 全程只看到了列名和规则，没看到任何一行真实作答。

如果确实需要 AI 直接处理数据（而不只是写代码），先把能识别到个人的信息去掉：

脱敏后仍属敏感的，回到「AI 写代码、本地跑」。