当前位置: 首页 > >

数据挖掘在教学管理中的运用_论文

第 1 卷 第6   l 期  V 11 NO6 O. l .     J i . 01   t1 2   l 2 数 据 挖 掘 在 教 学 管 理 中 的 运 用  梁 小 鸥  ( 东工程职 业技 术 学院 教 务 处 , 州 天河 50 2) 广 广 1 5 0  摘  要 : 着科 技 的 日新 月异 , 今 多数 高 校 采 用 了教 学 管 理 系统 协 助 完 成 日常 教 学 管 理 工 作 , 得 大量 教 学过 程 中 随 如 使   的 数 据 得 以有 效 累积 。但 是教 学 管 理 系统 通 常 只会 对数 据 作 简 单 的 统 计 分 析 , 法 获取 数 据 背 后 隐 藏 的 内容 。 自上  无 世纪 8 O年 代 中期 以 来 , 据挖 掘 成 为 一 个相 对发 展 较 快 的 产业 。该 技 术 从 大量 的 、 完 全 的 、 糊 的 、 机 的 数 据 中 数 不 模 随   提 取 出 隐含 在 其 中 , 不 为人 知 、 又是 潜在 有 用 的信 息和 知识 。将 数 据 挖 掘 技 术运 用 于 教 学 管 理 工 作 中 , 为教 学  且 但 可 管理者提供更为全面的分析。   关 键 词 : 学管理 ; 据挖掘 ; 据仓库 ; 联规则 教 数 数 关   中图 分 类 号 : P 9   T 31 文献标识码 :  A 文 章 编 号 : 6 2 7 0 ( 0 2 0 60 1— 2 1 7 —8 0 2 1 ) 0 — 1 30   集 计 数 中不 小 于 预 先 设 定 的 最 小 支 持 度 的 项 , 到 频 繁 l 得   1 数 据 挖 掘 的定 义  数 据 挖 掘 技 术 是 将 传 统 的 数 据 分 析 和 处 理 大 量 数 据  的复 杂 算 法 相 结 合 , 大 量 的 、 完 全 的 、 糊 的 、 噪 声  从 不 模   项 集 的 集 合 , 为 L 。然 后 重 新 扫 描 I 记     。中保 留 的 项 集 .   在 L _的基 础 上 找 频 繁 2项 集 的 集合 I 再 用 I     出I  。找  , 以此 类 推 , 到 在 频 繁 K 项 集 中 无 法 获 得 大 于 最 小 支 持  直 度 的项 集 , 不 能 再 找 到 频 繁 K+ 1项 集 , 最 后 生 成 的  即 则 的数 据 中 , 自动 地 发 现 有 用 信 息 的 过 程 。简 单 地 说 , 据  数 挖 掘 是 指 从 大 量 数 据 中提 取 或“ 掘 ” 挖 出有 用 的 知 识 。   频 繁 项 集 集 合 I 是 所 有 满 足 最 小 支 持 度 的 项 集 组 成    由此 得 知 , r r 算 法 的第 一 次 遍 历 要 计 算 每 个 项 目的  Ap i i o 数 据 挖 掘 和 传 统 的数 据 分 析 存 在 着 明 显 区 别 。传 统  的数 据 分 析 只是 将 数 据 统 计 、 括 、 总形 成 结 论 的过 程 。 概 汇   数 据 挖 掘 是 在 没 有 任 何 假 设 的前 提下 去 发 现 知 识 , 大 量  从 数 据 中获 得 信 息 , 所 得 到 的 是 更 深 层 次 、 知 而 有 效 的  它 未 具体数量值 , 以确 定 频 繁 I 集 L 。 随 后 , 次 遍 历 都 包  项   每 括两个步骤 : 一步 , 用前 一次 ( 第 使 k一1 次 遍 历 得 到 的 频  ) 繁 项 集 L   生 成 候 选 项 集 C 第 二 步 , 描 事 务 数 据 库 即  K  ; 扫 候选项集 , 算 C 计  中 候 选 项 集 的 支 持 度 , 比最 小 支 持  对 度 后 产 生 频 繁 项 集 I 。循 环 以 上 两 步 操 作 , 到 无 法 产    直 信 息 , 些 信 息 都 隐 藏 在 数 据 中 , 法 通 过 表 面 数 据 反 映  这 无 而察 觉 出来 。   生 更 高 维 度 的频 繁 项 集 则 结 束 遍 历 。   数 据 挖 掘 的第 二 个 阶 段 , 生 强 关 联 规 则 。 一旦 从 事  产 2 选 择 数 据 挖 掘 方 向—— 关 联 规 则  数 据 挖 掘 研 究 领 域众 多 , 中关 联 规 则 是 研 究 较 早 的  其 一 务 数 据 库 中找 出 了频 繁 项 集 , 直 接 根 据 频 繁 项集 产 生 强  可 关 联 规 则 , 强 关 联 规 则 满 足 最 小 支 持 度 和 最 小 置 信 度 )  ( 。 最 小 支 持 度 是 由我 们 自己给 定 的 一 个 阈 值 , 于 强关 联 规  由 则 是 由频 繁 项 集 产 生 , 以必 定 满 足 最 小 支 持 度 , 置 信  所 而 度 则 是 由 以下 公 式 计 算 得 出 :   C nie c ( 》 ) P(     s p o tc u t AU B) o f n e A= B 一 d BI A) u p r— o n (      S po t c u ( ) up r o nt A   — 个 方 向 , 要 用 来 分 析 数 据库 中不 同数 据 属 性 间  主 卣价 值  的关 联 关 系 , 主 要 挖 掘 过 程包 括 两个 阶段 : 一 阶段 , 其 第 必  须 先 从 数 据 资 料 集 合 中找 出所 有 的 高 频 项 目组 ( r q e t F e u n  Ie es , tmst) 即在 数 据 中频 繁 出 现 的 项 目。第 二 阶 段 , 从  再 已找 出 的 这 些 高 频 项 目组 中 产 生 关 联 规 则 ( scain As o it   o Rue ) ls 。关 联 规 则



友情链接: 历史学 教育学 农学资料 艺术学习 学习资料网