搜 
机考套题 - 大数据技术概论
判断题
对于一组数值型数据的中位数、四分位数等分布情况,常用箱线图来展示.()
大数据中的"大"主要指的是数据种类的多样性,而不是指数据量的大小.( )
对于预测样本的分类,决策树从根节点开始,根据预测样本的属性结果选择适当的分支,直到到达某个叶节点的类标号.( )
Hadoop和Spark都是大数据处理的工具,其中Hadoop适用于处理大量静态数据,而Spark适合处理需要实时处理的数据流.()
NoSQL和NewSQL数据库是为满足非结构化数据和大数据处理应用的特殊要求,作为对关系型数据库的补充而出现的.( )
对于数据缺失的现象,数据预处理通过如删除、插补等方式进行处理.( )
特征选择是指选择对预测结果影响力较大的特征,以改善学习算法的性能和解释性.( )
遵守GDPR等数据保护法规,不仅能够保护个人和企业数据的安全,也有助于提升企业的声誉和客户信任.()
DIKW模型描述了数据如何逐步转化为信息、知识及智慧的过程.( )
根据数据在收集过程中是否控制有关因素,可以将数据分为观测数据和实验数据.( )
散点图是最常用于展示两个数值型变量之间关系的可视化方法.( )
电子商务通过大数据技术优化推荐算法,改善用户购物体验.( )
决策树是一种简单高效的分类模型.( )
大数据分析就是对大量复杂的数据进行分析,以揭示隐藏的模式、未知的关联、市场趋势、客户偏好等有用信息.()
NoSQL数据库是专门为大数据和实时网页应用设计的,因此通常不支持ACID事务.( )
数据清洗就是将无用的、重复的、不完整的数据进行修改或删除,以保证数据质量的过程.( )
数据预处理的过程中不需要进行数据转换.( )
在大数据环境下,数据使用的合规性并不需要考虑,因为大数据的收集和分析主要是为了提供更好的服务和产品.( )
数据科学的发展不仅可以推动学科的发展,而且能够助推相关产业的发展与进步.()
在大数据的应用中,只需要依赖大数据分析技术,与各行业的业务关联性并不大.()
气泡图中气泡的面积大小没有实际意义.( )
通过收集特定疾病患者群体的数据信息来分析该疾病的具体诱因,是大数据在医学领域中的一种重要应用.( )
k近邻算法实际上是一种分类算法,其通过找出样本最近的k个邻居并根据多数投票进行分类.()
MapReduce基于分而治之的算法范式,利用多台计算机完成数据处理()
在分布式文件系统HDFS中,数据丢失的问题可以通过在多个数据节点上复制相同的数据块来解决.( )
缺失值的处理方法只有直接删除,没有其他的处理方法.( )
数据的收集过程中,数据采集的工具和方法对数据质量、全面性和后续处理没有影响.( )
数据安全性与隐私保护并不需要遵守相关法律和政策规定.()
相对于结构化数据,非结构化数据的主要特点是没有固定的格式,它可能来自各种源,并且无法直接存入传统的关系型数据库.( )
大数据的五个V特性是:体量(Volume)、速度(Velocity)、价值(Value)、多样性(Variety)和真实性(Veracity).()
对于一个分类变量的各类别的频数占比,常用柱形图、条形图和饼图来展示.()
疾病预防和治疗属于大数据在生物医学领域的应用.( )
样本相关系数(correlation coefficient)可以用于衡量两个变量之间的线性关系强度.( )
批处理系统支持作业执行状态的监控.()
NoSQL数据库,如Cassandra和MongoDB,是设计用来处理大量数据的数据库系统.()
数据缺失的现象大量存在而又无法避免.( )
大数据的采集技术已经逐渐成为数据高速增长的主要推动因素之一,成为大数据技术的重要活动.( )
适当地使用数据脱敏技术,可以有效地减少敏感数据在采集、传输、使用等环节中的暴露,降低敏感数据泄露的风险.()
根据数据在收集过程中是否有控制因素,可以将数据分为截面数据和时间序列数据.( )
大数据技术主要处理的数据类型是结构化数据,而对于非结构化数据处理能力较弱.()
在数据分析中,数据可视化只是一种辅助工具,不具有实际的分析功能.( )
大数据在诸如消费者行为监测、市场趋势分析等一系列商业领域都有广泛的应用.( )
聚类分析是一种常用的无监督学习方法,用于发现数据集中的模式或结构.( )
MapReduce可以通过在存储数据的节点上进行有效地任务调度来减少对网络资源的浪费,并且因为所有节点都在并行处理数据,可以大幅度缩短处理时间.()
关系数据库是用来存储和访问具有彼此相关性数据的数据库.( )
大数据预处理阶段不包括数据插补步骤.( )
数据预处理的一种方法是数据归一化,它将所有数据缩放到一个固定的范围中,以消除数据之间的尺度差异.( )
黑客技术的非法入侵是大数据隐私保护所面临的主要威胁之一.()
数据可视化的作用仅限于将抽象的数据进行可视表达,无法帮助我们发现数据中的规律和特征.( )
大数据科学不仅包括数据采集和数据分析,还涵括数据预处理、数据存储和数据管理等环节.()

本页 50 道,共 218 道题目

版权信息-国开题库网-www.guokaitikuwang.com    备案号 粤备65168151