数据挖掘概念与技术
班级:计算机 16 姓名:李佳 学号:2110505129
1.给出一个例子,其中数据挖掘对于商务的成功是至关重要的。该商务需要
什么数据挖掘功能?它们能够由数据查询处理或简单的统计分析来实现吗?
解:对于商务而言,较好地理解它的诸如顾客、市场、供应和资源以及竞
争对手等商务背景是至关重要的。商务智能技术提供商务运作的历史、现状和
预测视图。没有数据挖掘,许多工商企业都不能进行有效的市场分析,比较类
似产品的顾客反馈,发现其竞争对手的优势和缺点,留住具有高价值的顾客,
做出聪明的商务决策。
数据挖掘是商务智能的核心。商务智能的联机分析处理工具依赖于数据仓
库和多位数据挖掘。分类和预测技术黑丝商务智能预测分析的核心,在分析市
场、供应和销售方面存在很多应用。此外,在客户关系管理方面,聚类起主要
作用,它根据顾客的相似性把顾客分组。使用特征挖掘技术,可以更好地理解
每组顾客的特征,并开发性质的顾客奖励计划。
这些功能不能由简单的数据查询处理或简单的统计分析来实现。
2.使用你熟悉的生活中的数据库,给出关联规则挖掘、序列模式分析、分类、
聚类、孤立点分析等数据挖掘功能的例子。
解:
关联规则挖掘:作为市场部经理, 想知道哪些商品经常一块被购买,则
从数据库中挖掘出来的规则例子为 :
buy(X,“ computer”)buy(X,“ software”)[support=1%,confidence=50%],X
代表顾客。则可知如果一位顾客购买计算机则购买软件的可能性是 50%,所有
事务中的 1%显示计算机与软件一起被购买。
序列模式分析:顾客购物时,倾向于先购买手机,再购买内存卡这样的模
式就是一个序列模式。
分类:找出描述和区分数据类或概念的模型,以便使用模型预测类标号未
知对象的类标号。例如决策树的使用,根据人群的收入,年龄从而划分出等级。
聚类:聚类分析的数据对象不考虑已知的类标号。例如超市里的顾客,识
别顾客的同类子群,可以明显看出特定的购物目标群。
孤立点:通过检测一个账号的正常付费与数额巨大的付款相比,可以发现
信用卡的欺骗使用。
3.与挖掘少量数据相比,挖掘海量数据的挑战有哪些?
解:(1)可伸缩:由于数据产生和收集技术的进步,数吉字节、数太字节
甚至数拍字节的数据集越来越普遍。如果数据挖掘算法要处理这些海量数据集,
则算法必须是可伸缩的。