数据安全与分级
适用对象:通用 | 状态:✅ 已完成(建议性规范,待学校政策对齐)| 更新于:2026-06-01
先懂一件事:发给 AI 看 = 上云
Section titled “先懂一件事:发给 AI 看 = 上云”你的 Claude Code / Codex 背后连的是 DeepSeek 云端。
- 你直接发给 AI 看的内容(贴进去的文字、让它”读”的文件、附上的表格)——会上传到云端服务器。
- 你只让 AI 写代码、自己在本机运行——这段代码处理的真实数据不出本机,AI 全程没看到。
整个数据安全的核心,就是分清这两件事。
把手头的材料对号入座,再决定怎么处理。
| 级别 | 典型例子 | 能否给云端 AI 看 | 怎么用 |
|---|---|---|---|
| 公开 | 已发表论文、公开教材、官网公告、公开统计年鉴 | ✅ 可以 | 直接贴给 AI 读、总结、提炼。仍需核实 AI 转述是否准确。 |
| 内部 | 课程大纲、教学 PPT、未公开但不敏感的工作材料、已脱敏的汇总数据 | ⚠️ 谨慎 | 不含个人隐私、不涉密的可以给;拿不准的先去标识、只给必要片段。 |
| 敏感 | 学生信息 / 成绩 / 名单、问卷原始作答、未发表的论文与数据、访谈原始记录 | ❌ 不直接上云 | 走「AI 写代码、本地跑」,或彻底脱敏(去掉姓名学号等)后再考虑。 |
| 涉密 | 基金申请书(本子)、评审意见、保密协议下的数据、涉及国家 / 商业秘密的材料 | 🚫 绝不上云 | 不放进任何联网 AI。以学校保密规定为准,必要时完全离线处理。 |
核心模式:🔒 AI 写代码、数据本地跑
Section titled “核心模式:🔒 AI 写代码、数据本地跑”这是经管师生最该掌握的一招:让 AI 只看”数据长什么样”(列名、结构、规则),不看”数据是什么”(真实的每一行)。 AI 产出代码,你在自己电脑上对真实数据运行。
一个经管例子:问卷数据算信度
Section titled “一个经管例子:问卷数据算信度”假设你有一份问卷的原始作答(每一行是一个学生的真实回答),想算各维度的 Cronbach’s α。
❌ 错误做法(数据上云):
“这是我的问卷数据(附上整张表),帮我算信度。”
这样整张真实作答都传到了云端。
✅ 正确做法(AI 只看列名):
“我有一份问卷数据,列名是 A1–A20、性别、年龄、年级。量表有 4 个维度,每维 5 题(A1–A5、A6–A10、A11–A15、A16–A20),反向题是 A5、A12。帮我写一段 Python 代码算各维度的 Cronbach’s α,读取本地的
survey.csv。”
AI 给你一段代码,你在自己电脑上运行它——跑的是真实数据,但 AI 全程只看到了列名和规则,没看到任何一行真实作答。
给 AI 看之前,先脱敏
Section titled “给 AI 看之前,先脱敏”如果确实需要 AI 直接处理数据(而不只是写代码),先把能识别到个人的信息去掉:
- 去掉姓名、学号、身份证号、手机号、邮箱、具体住址。
- 把能间接定位到个人的字段做处理(如把出生日期改成年龄段、把具体班级改成编号)。
- 自由文本(如开放题回答、访谈片段)里夹带的人名、单位名一并清理。
脱敏后仍属敏感的,回到「AI 写代码、本地跑」。
- 材料是公开的 → 可以直接给 AI。
- 材料内部但不敏感 → 谨慎给,只给必要部分。
- 材料含个人隐私 / 未发表 / 涉密 → 不直接上云,走「AI 写代码、本地跑」或彻底脱敏。
- 分不清 → 按更严一级处理,或问院系 / 科研管理部门。