关于数据挖掘的两道题,希望能详细解释,可以让一个新手听懂,答案并不...

发布网友 发布时间:2022-04-24 12:23

我来回答

1个回答

热心网友 时间:2022-04-14 16:42

恩,怎么说呢?最小支持度就是一个元素在若干个集合中出现的次数的最少次数的阀值。
比如你有5个集合,就拿你的第二道题来说:那么A的支持度就是60%,B是80%,C是80%,D是60%。
因为一共取了五次,每次可能有ABCD中的一个或者几个,那么有几个中包含A,这就是支持度。
拿元素A来说,在1,2,3中包含A,但是在4,5中没有。那么3/5=0.6就是他的支持度。
同样再看下B,B在1,2,4,5中存在,3中没有,那么他的支持度就是4/5=0.8=80%。
再说置信度:置信度是说在存在一个元素的集合中另外一个元素存在的概率。
我们还用第二题举例:比如在存在A的集合中存在B的概率是多少?
我们找找:存在A的集合有1,2,3三个。在这三个中1,2,两个包含B。也就是说B的置信度为2/3≈66.7%。
我们再找B到C。存在B的集合有1,2,4,5四个。那么在这里面存在C的有几个?2,4,5三个,所以B到C的置信度就是3/4=75%
其他的也是这么计算。具体的答案我就不算了,你自己再看看。追问谢谢你的详细解答,看了你的回答瞬间明朗了很多,再去看参*很容易理解了,再去看参*就容易多了。但是参*上的和你的解释有点分歧,你看下:
第二题的解析
:由关联规则Q→D计算过程可知:支持度=事务中同时包含X、Y的百分比,置信度=在事务已经包含X的情况下包含Y的百分比。

追答什么地方不一样?
支持度=事务中同时包含X、Y的百分比
在1,2,3中包含A,但是在4,5中没有。那么A的支持度=3/5=0.6就是他的支持度。

置信度=在事务已经包含X的情况下包含Y的百分比。
存在B的集合有1,2,4,5四个。那么在这里面存在C的有几个?2,4,5三个,所以B到C的置信度就是3/4=75%
可是直接包括C的有四个,还有个3呢。可是这里只说了2,4,5这不是一样的么。

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com