相关试卷
-
1、下列关于聚类分析的说法,错误的是( )。A、可以从数据点集合中随机选择K个点作为初始的聚集中心 B、对其他的每个数据点,以此判断其与K个中心点的距离,距离最近的表明它属于这项聚类 C、聚类分析,必须先设定分类的标准,否则无法准确分类 D、重新计算新的聚簇集合的平均值既中心点
-
2、某超市曾经研究销售数据,发现买商品A的人购买商品B的概率很大,这种属于数据的( )。A、聚类分析 B、关联分析 C、分类分析 D、回归分析
-
3、数据特征探索的主要任务是对数据进行预处理,以下不属于该过程的是( )。A、数据清洗 B、异常数据处理 C、数据缺失处理 D、数据分类处理
-
4、数据分析的方法不包括( )。A、线性分析 B、关联分析 C、聚类分析 D、数据分类
-
5、下列可以用于分析数据趋势的是( )。A、饼图 B、折线图 C、动态热力图 D、词云图
-
6、数据的存储的方式:采用分布式文件存储或NoSQL数据库存储。
-
7、我们可以把数据放在第三方公共或公有的“云端”存储。
-
8、只要删除掉上网的浏览记录就可以避免信息泄露。
-
9、网络数据采集法:在目标主机上安装一个小程序,将目标主机的文本、应用程序、数据库等日志信息有选择地定向推送来进行管理。
-
10、要完成数据的采集工作,首先需要明确数据需求选定项目主题。
-
11、我们一般说的cookies是( )。A、数据收集程序 B、数据应用程序 C、数据存储程序 D、数据处理程序
-
12、下列( )不属于隐私保护的手段。A、数据收集时进行数据精度处理 B、数据共享时进行访问控制 C、不使用任何智能化设备 D、数据发布时进行人工加扰
-
13、下列( )数据安全保护技术可以进行远距离使用。A、拷贝 B、备份 C、复制 D、镜像
-
14、下列( )不是数据保护的有效方法。A、剪切 B、复制 C、拷贝 D、镜像
-
15、在Python模块库中有大量模块可供使用,要想使用这些文件,就需要用( )语句把指定模块导入当前程序中。A、move B、in C、import D、print
-
16、下列( )不属于Python网络数据采集程序使用的扩展库。A、System B、SciPy C、Pandas D、Matplotlib
-
17、网络数据采集法,主要通过网络爬虫或网站公开API的方式获取,网络爬虫从网页的( )开始获取。A、HTML B、WWW C、URL D、XML
-
18、数据采集的基本方法包括( )、网络数据采集法和其他数据采集法。A、数据库采集法 B、访问记录采集法 C、数据目录采集法 D、系统日志采集法
-
19、智能健康手环的应用开发,体现了( )的数据采集技术的应用。A、统计报表 B、网络爬虫 C、API接口 D、传感器
-
20、大数据的本质是洞察。