跳转到内容

数据安全与分级

适用对象:通用 | 状态:✅ 已完成(建议性规范,待学校政策对齐)| 更新于:2026-06-01

你的 Claude Code / Codex 背后连的是 DeepSeek 云端

  • 直接发给 AI 看的内容(贴进去的文字、让它”读”的文件、附上的表格)——会上传到云端服务器
  • 只让 AI 写代码、自己在本机运行——这段代码处理的真实数据不出本机,AI 全程没看到。

整个数据安全的核心,就是分清这两件事。

把手头的材料对号入座,再决定怎么处理。

级别典型例子能否给云端 AI 看怎么用
公开已发表论文、公开教材、官网公告、公开统计年鉴✅ 可以直接贴给 AI 读、总结、提炼。仍需核实 AI 转述是否准确。
内部课程大纲、教学 PPT、未公开但不敏感的工作材料、已脱敏的汇总数据⚠️ 谨慎不含个人隐私、不涉密的可以给;拿不准的先去标识、只给必要片段。
敏感学生信息 / 成绩 / 名单、问卷原始作答、未发表的论文与数据、访谈原始记录❌ 不直接上云走「AI 写代码、本地跑」,或彻底脱敏(去掉姓名学号等)后再考虑。
涉密基金申请书(本子)、评审意见、保密协议下的数据、涉及国家 / 商业秘密的材料🚫 绝不上云不放进任何联网 AI。以学校保密规定为准,必要时完全离线处理。

核心模式:🔒 AI 写代码、数据本地跑

Section titled “核心模式:🔒 AI 写代码、数据本地跑”

这是经管师生最该掌握的一招:让 AI 只看”数据长什么样”(列名、结构、规则),不看”数据是什么”(真实的每一行)。 AI 产出代码,你在自己电脑上对真实数据运行。

一个经管例子:问卷数据算信度

Section titled “一个经管例子:问卷数据算信度”

假设你有一份问卷的原始作答(每一行是一个学生的真实回答),想算各维度的 Cronbach’s α。

错误做法(数据上云):

“这是我的问卷数据(附上整张表),帮我算信度。”

这样整张真实作答都传到了云端。

正确做法(AI 只看列名):

“我有一份问卷数据,列名是 A1–A20、性别、年龄、年级。量表有 4 个维度,每维 5 题(A1–A5、A6–A10、A11–A15、A16–A20),反向题是 A5、A12。帮我写一段 Python 代码算各维度的 Cronbach’s α,读取本地的 survey.csv。”

AI 给你一段代码,你在自己电脑上运行它——跑的是真实数据,但 AI 全程只看到了列名和规则,没看到任何一行真实作答。

如果确实需要 AI 直接处理数据(而不只是写代码),先把能识别到个人的信息去掉:

  • 去掉姓名、学号、身份证号、手机号、邮箱、具体住址。
  • 把能间接定位到个人的字段做处理(如把出生日期改成年龄段、把具体班级改成编号)。
  • 自由文本(如开放题回答、访谈片段)里夹带的人名、单位名一并清理。

脱敏后仍属敏感的,回到「AI 写代码、本地跑」。

  • 材料是公开的 → 可以直接给 AI。
  • 材料内部但不敏感 → 谨慎给,只给必要部分。
  • 材料含个人隐私 / 未发表 / 涉密 → 不直接上云,走「AI 写代码、本地跑」或彻底脱敏。
  • 分不清 → 按更严一级处理,或问院系 / 科研管理部门。

相关:隐私与合规对外共享前检查清单