相关试卷
-
1、(12A)16 =()10
-
2、计算机中存储数据的最小单位是 , 存储容量的基本单位是。
-
3、(666)10 =()8
-
4、一张未经压缩的1024×512像素的BMP图像,压缩为JPG后图像大小是64KB,压缩比为 8:1,该图像的颜色至多有色。
-
5、(243)8 =()16
-
6、八进制的加法与减法运算完全与十进制相同。
-
7、大数据给生活带来便利的同时,也带来如信息泄露、数据安全、个人隐私甚至伦理道德等方面的社会问题。
-
8、ASCII值大小:小写字母>大写字母>数字。
-
9、信息资源的评价是指从信息来源的多样性中确认权威、可信的信息源,从而鉴别信息的真实性。
-
10、下图为某患者血液化验单,针对该化验单的分析不正确的是( )
A、红色框内的信息表明患者血红蛋白测定数据低于参考值 B、该医院近年来的患者血液化验结果就可以构成医疗大数据 C、蓝色框内是一组孤立的数据,不结合检查项目无法确定其含义 D、医生根据化验结果做出诊断,依靠的是专业基础知识和临床实践经验 -
11、某音频格式“8kHz,8bit,单声道,7kbps”,该音频的采样频率为( )A、8kHz B、8bit C、单声道 D、7kbps
-
12、下列描述错误的是( )A、利用OCR软件将图片转换成文字应用了人工智能技术 B、安装网站广告推荐的手机清理大师APP有可能泄露个人隐私 C、HTTP是超文本传输协议的英文缩写 D、收藏夹的作用就是把网页内容保存下来以备后面查看
-
13、关于ASCII码的编码中,最大的是( )。A、数字9 B、大写字母Z C、大写字母A D、小写字母a
-
14、如图所示,是一个汉字“口”的8×8信息编码图,只有黑白两种颜色。用“1”表示对应位置是黑方块,“0”表示对应位置是白方块,则图中第七行从左向右排列的信息编码是( )
A、01000010 B、10111101 C、01010010 D、10111110 -
15、下列关于大数据的说法,正确的是( )A、大数据分析的是全体数据 B、用大数据进行数据处理时,必须保证每个数据都准确无误 C、大数据的数据来源主要还是人力 D、数据量大的就是大数据
-
16、某种字符的加密方式如下:
①将字符的ASCII码用8位二进制表示;
②将转换出来的8位二进制数整体向右移动一位,将最右边移出的一位放到最左边(高位)进行补充;
③每四位进行分组,分别转换成十六进制数;
④转换后的这两个十六进制字符即为加密字符
现有字符“e”(ASCII码为101D),加密后的字符是( )。
A、B2 B、A3 C、B1 D、E2 -
17、在抗击疫情的战斗中,大数据技术充分发挥了其数据量大、速度快、类型多等优势,特别是在对密切接触者的判断和查找中发挥了巨大的作用,下列发现密切接触者的场景中没有体现大数据技术应用的是( )A、利用手机基站获取的定位信息 B、利用购票、乘车信息获取的出行信息 C、利用药店纸质登记的个人联系信息 D、利用人脸识别获取的商店进出信息
-
18、某搜索引擎网站一天的访问日志数据如图a所示,现要从中提取出访问网站次数最多的IP。由于IP日志文件数据量非常大,我们可以把IP日志数据分别存储到多个小文件中,分别统计出每个小文件中出现次数最多的IP地址及次数,再对各个小文件中的数据进行汇总。统计的结果如图b所示。
图 a
图 b
(1)、上述处理大数据的方法,采用的是 思想。(2)、统计小文件中出现次数最多的IP地址的Python代码如下,在划线出补充合适的代码,实现统计功能。def showmax(ips): #统计出现次数最多的 IP 地址和出现次数
dic={}
maxn=0
for i in range(len(ips)):
if ips[i] in dic:
dic[ips[i]]+=1
if :
maxn=dic[ips[i]]
maxIp=ips[i]
else:
return maxIp,maxn
with open("temp.log"," r ") as ips=[] f: #读取小文件temp.log中的IP地址
for line in f:
ip=line.split()[0]
ips.append(ip) #将IP地址逐行追加到列表ips中
#调用showmax函数
Prin t("出现次数最多的 IP 是: ",a[0]," 出现次数为: ",a[1])
-
19、答题卡一般采用2B铅笔填涂,填涂好的答题卡经过扫描后得到如图所示的数字化图像,从一个像素点的灰度值>132判断是否被填涂开始,进而判断一个信息点是否被填涂。利用如下的Python程序可以识别并统计填涂好的答题卡中的答案:(1)、答题卡通常使用红色,如使用黑色印刷,对答案识别(有/无)影响。
(2)、请在划线处填入合适代码。from PIL import Image
x_start = 11 # 起始点坐标
y_start = 92
fill_width= 24 信息点宽度
fill_height= 10 # 信息点高度
space_width = 15 间隔宽度
space_height = 12 # 间隔高度
ans_cnt = 5 # 题目个数
def bw_judge(R, G, B): # bw_judge用于判断一个像素的填涂情况
Gray_scale = 0.299 * R + 0.587 * G + 0.114 * B
return Gray_scale < 132
def fill_judge(x, y): # fill_judge 用于判断信息点的填涂情况
count = 0
for i in range(x, x + fill_width):
for j in range( ):
R, G, B = pixels[i, j]
if bw_judge(R, G, B) == True:
count = count + 1
if count >= fill_width * fill_height * 0.64:
return True
total_width = fill_width + space_width
total_height = fill_height + space_height
image = Image.open ("card.bmp")
pixels = image.load()
ans = ""
item=[‘A’,’B’,’C’,’D’]
list=[]
for col in range(ans_cnt):
x =
for row in range(4):
y = y_start + total_height * row
if fill_judge(x, y) == True:
list.append(ans)
ans=""
print(list)
-
20、小张用Python爬虫程序从百度招聘网站中爬取了IT行业的招聘信息存储在“行业分析.xlsx”文件中,并对数据进行了预处理,现用Excel软件进行数据分析,部分界面如图a所示。
图 a
(1)、为统计各学历在招聘信息中的岗位数,选中H2单元格输入公式,然后利用自动填充完成I2:L2的数据计算,发现结果计算有误,请修改H2单元格中的计算公式 。(提示:COUNTIF函数用于对指定区域中符合指定条件的单元格计数。如:=COUNTIF(E2:E393,H1)表示计算E2:E393区域中学历为“博士”的人数)(2)、将C列、D列数据复制并粘贴到新的Excel表格cs.xlsx中,根据其中的数据利用Python 程序计算出如图b所示结果,并建立如图c所示的图表,请在划线处填入合适的代码。
图 b
图 c
pandas as pd
import matplotlib.pyplot as plt
df=pd.read_excel("cs.xlsx")
g=df.groupby(‘type’,as_index=False)
datas=
print(round(datas,2))
name= datas[‘type’]
colleges=datas[‘salary’]
plt. (name, colleges)
plt.show( )