手抄报 安全手抄报 手抄报内容 手抄报图片 英语手抄报 清明节手抄报 节约用水手抄报

创建一个数据挖掘工作流

时间:2024-10-12 03:44:45

1、启动软件,可以选择默认空间。 点击文件>新建>工作流输入工作流名字“文本分析”点击完成。

创建一个数据挖掘工作流

2、百度网盘下载数据文件。链接:http://pan.baidu.com/s/1slpi0Xn 密码:5t1q

3、从节点库找到数据源>EXCEL节点。也可以搜索<excel>,单击拖拽到工作流界面(或者双击直接加载到工作流界面)。

创建一个数据挖掘工作流
创建一个数据挖掘工作流

4、双击<excel>,打开配置页面,点击浏览,找到文件存放位置双击,点击确定右键撮劝丛食单击<excel>节点,点击执行,指示灯由黄变为绿色说明数据导入成功。

创建一个数据挖掘工作流

5、右键单击<excel>节点,点击<输出表>可以查看读入的数据。为了简要介绍,部分数据探索和数据准备工作这里略过。不了解业务的前提下,我们需要先了解数据,通过数据学习业务。本数据中:包含94个样本,7个字段,都是对热门博主的描述,还有很多信息包含早数据表内。

创建一个数据挖掘工作流

6、使用<自定义词云>节点,展现博主的粉丝量信息。双击配置<自定义词云>。右召堡厥熠键单击<自定义词云>,点击<词云视图>酴兑镗笄查看结果。从词云中可以看出,粉丝量最大的博主分别为:苏芩,热门搞笑排行榜,微博搞笑排行榜。

创建一个数据挖掘工作流
创建一个数据挖掘工作流

7、通过前期了解数据,想了解发布建议各类别内的微博博主的粉丝量的统计信息。使用<汇总>节点实现,双击进行配置。

创建一个数据挖掘工作流
创建一个数据挖掘工作流

8、右键单击汇总节点查看<汇总表>。

创建一个数据挖掘工作流

9、使用<过滤>节点,对字段进行重命名。

创建一个数据挖掘工作流

10、了解各类别博主的粉丝数量:使用<饼图>节点,双击配置,右键单击<饼图>点击<执行>。右键单价<饼掬研疔缎图>节点,单击<视图:饼图>查看结果。通过饼图可以看出来,新闻类和文案创作类的微博博主数量明显多于其他类别。

创建一个数据挖掘工作流
创建一个数据挖掘工作流

11、了解各博主的直发平均价:新闻类博主直发一条广告的平均价为18650元。

创建一个数据挖掘工作流
创建一个数据挖掘工作流
© 手抄报圈