相关试卷

  • 1、(12A)16 =(10
  • 2、计算机中存储数据的最小单位是 , 存储容量的基本单位是
  • 3、(666)10 =(8
  • 4、一张未经压缩的1024×512像素的BMP图像,压缩为JPG后图像大小是64KB,压缩比为 8:1,该图像的颜色至多有色。
  • 5、(243)8 =(16
  • 6、八进制的加法与减法运算完全与十进制相同。
  • 7、大数据给生活带来便利的同时,也带来如信息泄露、数据安全、个人隐私甚至伦理道德等方面的社会问题。
  • 8、ASCII值大小:小写字母>大写字母>数字。
  • 9、信息资源的评价是指从信息来源的多样性中确认权威、可信的信息源,从而鉴别信息的真实性。
  • 10、下图为某患者血液化验单,针对该化验单的分析不正确的是(    )

    A、红色框内的信息表明患者血红蛋白测定数据低于参考值 B、该医院近年来的患者血液化验结果就可以构成医疗大数据 C、蓝色框内是一组孤立的数据,不结合检查项目无法确定其含义 D、医生根据化验结果做出诊断,依靠的是专业基础知识和临床实践经验
  • 11、某音频格式“8kHz,8bit,单声道,7kbps”,该音频的采样频率为(    )
    A、8kHz B、8bit C、单声道 D、7kbps
  • 12、下列描述错误的是(   )
    A、利用OCR软件将图片转换成文字应用了人工智能技术 B、安装网站广告推荐的手机清理大师APP有可能泄露个人隐私 C、HTTP是超文本传输协议的英文缩写 D、收藏夹的作用就是把网页内容保存下来以备后面查看
  • 13、关于ASCII码的编码中,最大的是(     )。
    A、数字9 B、大写字母Z C、大写字母A D、小写字母a
  • 14、如图所示,是一个汉字“口”的8×8信息编码图,只有黑白两种颜色。用“1”表示对应位置是黑方块,“0”表示对应位置是白方块,则图中第七行从左向右排列的信息编码是(    )

    A、01000010 B、10111101 C、01010010 D、10111110
  • 15、下列关于大数据的说法,正确的是(    )
    A、大数据分析的是全体数据 B、用大数据进行数据处理时,必须保证每个数据都准确无误 C、大数据的数据来源主要还是人力 D、数据量大的就是大数据
  • 16、某种字符的加密方式如下:

    ①将字符的ASCII码用8位二进制表示;

    ②将转换出来的8位二进制数整体向右移动一位,将最右边移出的一位放到最左边(高位)进行补充;

    ③每四位进行分组,分别转换成十六进制数;

    ④转换后的这两个十六进制字符即为加密字符

    现有字符“e”(ASCII码为101D),加密后的字符是(  )。

    A、B2 B、A3 C、B1 D、E2
  • 17、在抗击疫情的战斗中,大数据技术充分发挥了其数据量大、速度快、类型多等优势,特别是在对密切接触者的判断和查找中发挥了巨大的作用,下列发现密切接触者的场景中没有体现大数据技术应用的是(    )
    A、利用手机基站获取的定位信息 B、利用购票、乘车信息获取的出行信息 C、利用药店纸质登记的个人联系信息 D、利用人脸识别获取的商店进出信息
  • 18、某搜索引擎网站一天的访问日志数据如图a所示,现要从中提取出访问网站次数最多的IP。由于IP日志文件数据量非常大,我们可以把IP日志数据分别存储到多个小文件中,分别统计出每个小文件中出现次数最多的IP地址及次数,再对各个小文件中的数据进行汇总。统计的结果如图b所示。

    图 a

    图 b

    (1)、上述处理大数据的方法,采用的是 思想。
    (2)、统计小文件中出现次数最多的IP地址的Python代码如下,在划线出补充合适的代码,实现统计功能。

    def showmax(ips):                #统计出现次数最多的 IP 地址和出现次数

    dic={}

    maxn=0

    for i in range(len(ips)):

      if ips[i] in dic:

        dic[ips[i]]+=1

        if :

          maxn=dic[ips[i]]

          maxIp=ips[i]

        else:

            

        return maxIp,maxn

        with open("temp.log"," r ") as ips=[] f:     #读取小文件temp.log中的IP地址

        for line in f:

          ip=line.split()[0]

          ips.append(ip)     #将IP地址逐行追加到列表ips中

                #调用showmax函数

    Prin t("出现次数最多的 IP 是: ",a[0],"  出现次数为: ",a[1])

  • 19、答题卡一般采用2B铅笔填涂,填涂好的答题卡经过扫描后得到如图所示的数字化图像,从一个像素点的灰度值>132判断是否被填涂开始,进而判断一个信息点是否被填涂。利用如下的Python程序可以识别并统计填涂好的答题卡中的答案:
    (1)、答题卡通常使用红色,如使用黑色印刷,对答案识别(有/无)影响。

    (2)、请在划线处填入合适代码。

    from PIL import Image

    x_start = 11       # 起始点坐标

    y_start = 92    

    fill_width= 24       信息点宽度

    fill_height= 10         # 信息点高度

    space_width = 15       间隔宽度

    space_height = 12         # 间隔高度

    ans_cnt = 5            # 题目个数

    def bw_judge(R, G, B):         # bw_judge用于判断一个像素的填涂情况

    Gray_scale = 0.299 * R + 0.587 * G + 0.114 * B

    return Gray_scale < 132

    def fill_judge(x, y):            # fill_judge 用于判断信息点的填涂情况

    count = 0

    for i in range(x, x + fill_width):

      for j in range( ):

      R, G, B = pixels[i, j]

      if bw_judge(R, G, B) == True:

        count = count + 1

        if count >= fill_width * fill_height * 0.64:

          return True

          total_width  = fill_width + space_width

          total_height = fill_height + space_height

          image = Image.open ("card.bmp")

          pixels = image.load()

          ans = ""

          item=[‘A’,’B’,’C’,’D’]

          list=[]

          for col in range(ans_cnt):

            x =

            for row in range(4):

              y = y_start + total_height * row

              if fill_judge(x, y) == True:

                    

                list.append(ans)

                ans=""

    print(list)

  • 20、小张用Python爬虫程序从百度招聘网站中爬取了IT行业的招聘信息存储在“行业分析.xlsx”文件中,并对数据进行了预处理,现用Excel软件进行数据分析,部分界面如图a所示。

    图 a

    (1)、为统计各学历在招聘信息中的岗位数,选中H2单元格输入公式,然后利用自动填充完成I2:L2的数据计算,发现结果计算有误,请修改H2单元格中的计算公式 。(提示:COUNTIF函数用于对指定区域中符合指定条件的单元格计数。如:=COUNTIF(E2:E393,H1)表示计算E2:E393区域中学历为“博士”的人数)
    (2)、将C列、D列数据复制并粘贴到新的Excel表格cs.xlsx中,根据其中的数据利用Python 程序计算出如图b所示结果,并建立如图c所示的图表,请在划线处填入合适的代码。

    图 b

    图 c

    pandas as pd

    import matplotlib.pyplot as plt

    df=pd.read_excel("cs.xlsx")

    g=df.groupby(‘type’,as_index=False)

    datas=

    print(round(datas,2))

    name= datas[‘type’]

    colleges=datas[‘salary’]

    plt. (name, colleges)

    plt.show( )

上一页 467 468 469 470 471 下一页 跳转