人工智能自然语言技术练习(习题卷31).docx

发布时间:2024-12-05 22:35

使用Duolingo练习语言技能 #生活技巧# #学习技巧# #自我学习平台#

文档简介

试卷科目:人工智能自然语言技术练习人工智能自然语言技术练习(习题卷31)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages人工智能自然语言技术练习第1部分:单项选择题,共43题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.在使用tensorflow提供了很多函数,例如multiply,这个函数实现的功能是什么?A)相除B)相乘C)相与D)相加答案:B解析:[单选题]2.L2正则化项的加入,可以使模型达到什么样的效果A)防止过拟合B)防止欠拟合C)防止完美拟合D)不确定答案:A解析:[单选题]3.基于()的n-gram模型参数空间最小,可以构造高元模型,用于描述长距离的语言约束关系A)词性B)词C)词自动聚类D)其余三项都可以答案:A解析:[单选题]4.做特征工程的目的是为了什么A)设计更高效的特征以刻画求解的问题与预测模型之间的关系。B)为了对数据进行分类C)为了对数据进行回归D)为了对数据进行聚类和降维的操作答案:A解析:[单选题]5.计算图模型是哪个框架中存在的A)pytorchB)tensorflowC)caffeD)paddle答案:B解析:[单选题]6.下面哪个对batch归一化的解释不正确?A)使参数搜索问题变得容易B)使神经网络对超参数的选择更加稳定C)超参数的范围更加庞大D)仅作用于输入层答案:D解析:[单选题]7.以下___不是预训练模型?A)ELMOB)Word2VecC)BERTD)GPT-2答案:B解析:[单选题]8.tf.abs的作用是什么A)相加B)相减C)相除D)求绝对值答案:D解析:[单选题]9.下面哪个是SVM在实际生活中的应用?A)文本分类B)图片分类C)新闻聚类D)以上都对答案:D解析:[单选题]10.在NLP的中多模型当中,N-Gram模型可以用来做什么A)预计或者评估一个句子是否合理B)可以做到文本翻译C)提取文本当中的主题D)可以做问答系统答案:A解析:[单选题]11.正常的将数据集进行切分为三个集合,其中不包括下列哪个集合?A)测试集B)确认集C)验证集D)训练集答案:B解析:[单选题]12.关于CBOW与Skip-Gram算法,以下说法不正确是?A)CBOW和Skip-Gram都是可以训练向量的方法,但是skip-Gram要比CBOW更快一些B)CBOW是根据某个词前面的n个或者前后n个连续的词,来计算某个词出现概率C)无论是CBOW模型还是skip-gram模型,都是可以Huffman树作为基础的D)Skip-Gram就是根据某个词然后分别计算它前后几个词的各个概率答案:A解析:[单选题]13.sigmoid求导之后的取值范围是多少?A)(0,0.1]B)(0,0.2]C)(0,0.25]D)(0,0.5]答案:C解析:[单选题]14.在动量梯度下降(Momentum)中,其中的参数β一般的默认值是多少?A)0.7B)0.8C)0.9D)1答案:C解析:[单选题]15.概率图中的无向边表示的是什么A)表示单向的依赖B)表述互相依赖关系C)表示无依赖关系D)不确定答案:B解析:[单选题]16.下列属于西文字符编码的是()A)ASCII码B)国标码C)GB13000D)GBK答案:A解析:[单选题]17.不符合属性和数量类概念的规定的是A)味道:DEF=attribute|属性,taste|味道,&edible|食物B)气量:DEF=attribute|属性,tolerance|气量,&human|人C)班次:DEF=quantity|数量,amount|多少,&transport|运送D)比价:DEF=quantity|数量,rate|比率,price|价格答案:D解析:[单选题]18.美国Brown大学于20世纪60~70年代开发的通用语料库是A)LOB语料库B)PropBankC)Brown语料库D)PennTreeBank答案:C解析:[单选题]19.以下四个函数当中,哪个不是python内建函数A)iterB)hashC)binD)number答案:D解析:[单选题]20.文本文件中存储的其实并不是我们在编辑器里看到的一个个的字符,而是字符的()。A)内码B)外码C)反码D)补码答案:A解析:[单选题]21.以下几种技术当中可以做主语检测和宾语检测的是哪个A)词性标注(PartofSpeechTagging)B)SkipGram和N-Gram提取C)连续性词袋(BagofWords)D)依存句法分析(DependencyParsing)和成分句法分析(ConstituencyParsing)答案:D解析:[单选题]22.下面对于正则表达式说法错误的是()。A)?^?匹配字符串的开始B)?[A-z]?匹配所有英文字母C)?/d?表示任意数字D)?*?和其它表达式一起,表示任意次数重复答案:B解析:[单选题]23.下边哪些方式不能做特征提取A)CNNB)RNNC)TransformerD)SVM答案:D解析:[单选题]24.下面数据粒度的表述中有误的是:A)粒度是指数据仓库小数据单元的详细程度和级别;B)数据越详细,粒度就越小,级别也就越高;C)数据综合度越高,粒度也就越大,级别也就越高;D)粒度的具体划分将直接影响数据仓库中的数据量以及查询质量.答案:C解析:[单选题]25.DecisionTreeClassifier中的max_leaf_nodes参数的作用是什么A)最大叶子节点数B)类别权重C)随机种子D)决策树深度答案:A解析:[单选题]26.马尔可夫模型的三个基本问题不包括A)估值问题B)寻找状态序列C)学习模型参数D)学习模型参数答案:D解析:[单选题]27.如果使用了Tanh作为激活函数你,那么经过此非线性变换后值的范围为__?A)[-1,1]B)[0,2]C)[0,1]D)0或1答案:A解析:[单选题]28.在NLP虚拟环境中安装需要的程序包,并自动安装这个包的依赖项需要用()。A)pipB)condaC)condaD)pip答案:B解析:[单选题]29.下列哪一项在神经网络中引入了非线性?A)随机梯度下降B)修正线性单元(ReLU)C)卷积函数D)以上都不正确答案:B解析:[单选题]30.利用gensim实现Doc2vce时,哪个参数代表选择的具体模型?A)dm_meanB)dm_tag_countC)dm_concatD)dm答案:D解析:[单选题]31.对原始的语料文件进行预处理时要进行()。A)抽取数据中的问答对话集合B)构建词典C)模型训练D)模型测试答案:B解析:[单选题]32.不属于关键词提取算法的是()A)TF-IDF算法B)TextRank算法C)主题模型算法D)关联算法答案:D解析:[单选题]33.下列关于Word2Vec模型说法正确的是()。A)得到的训练结果不能度量词与词之间的相似性B)当这个模型训练好以后,需要用这个训练好的模型处理新的任务C)真正需要的是这个模型通过训练数据所得的参数D)Word2Vec模型其实就是简化的遗传算法模型答案:C解析:[单选题]34.预训练模型的思路说法正确的是__?A)特征提取的地层差异性比较大B)所有的任务都是一样的C)在做特征提取的时候,底层的特征的提取往往是极其相似的D)以上都正确答案:A解析:[单选题]35.下面选项中有四个函数,其中哪个函数可以表示一个超平面?A)Wt*x+b=0B)w*log(x)=0C)w*ln(x)=0D)wx²=0答案:A解析:[单选题]36.汉语自动分词的准确率具体定义是()A)P=(系统输出正确词个数/系统输出词个数)*100%B)R=(系统输出正确词个数/标准答案中词的个数)*100%C)F=((β2+1)*P*R)/(β2*P+R)=(B=1)(2*P*R)/(P+R)D)P(A|B)=P(B|A)*P(A)/P(B)答案:A解析:[单选题]37.什么是拟合,如何去理解拟合A)指曲线能不能去很好的描述现有的数据B)一条曲线过分的去描述了现有的数据C)指的是在训练集上表现良好,测试集上表现很差D)指的是在训练测试集上表现都不好答案:A解析:[单选题]38.关于Relu激活函数说法正确的是A)经过Relu变换之后的取值在[0,1]之间B)正半区是本身,负半区全为0C)经过Relu变换之后的取值在[-1,1]之间D)经过Relu变换之后的取值在[-∞,+∞]之间答案:B解析:[单选题]39.tensorflow中的cast方法,返回值的数据类型是什么样的A)整数型B)布尔型C)浮点型D)字符串答案:C解析:[单选题]40.使用jieba库提供的(A)方法,可以对文本进行分词操作。A)cutB)splitC)BreakD)apart答案:B解析:[单选题]41.通常使用到的交叉熵函数是作为什么作用?A)损失函数B)激活函数C)sigmoid函数D)relu函数答案:A解析:[单选题]42.智能问答系统主要依靠的关键基础和技术不包括以下那个方面()A)大量高质量的数据和知识,主要是知识图谱技术B)强大的自然语言处理技术C)需要大量的标准训练语料,这主要是深度学习方法所需要D)专业的智能算法答案:D解析:[单选题]43.双向的Transformer在以下哪个模型中有使用A)GPTB)BERTC)ELMOD)GPT-2答案:C解析:第2部分:多项选择题,共21题,每题至少两个正确答案,多选或少选均不得分。[多选题]44.NLP方向的常见成品有哪些A)知识图谱B)机器人C)人脸检测D)推荐系统答案:ABD解析:[多选题]45.下面哪些是以Boosting为代表的算法:A)A:RandomForestClassifierB)B:AdaboostC)C:XgboostD)D:RandomForestRegressor答案:BC解析:[多选题]46.下面哪几函数可以实现张量的加和或求均值?A)tf.reduce_sumB)tf.multiplyC)tf.reduce_meanD)tf.norm答案:AC解析:[多选题]47.下边关于beamSearch正确的是A)是一种启发式图搜索算法B)为了减少搜索的时间和空间C)保留质量较高的节点,减掉质量较差的节点D)常用在机器翻译和语音识别等NLP任务当中答案:ABCD解析:[多选题]48.以下几种网络中,哪些属于神经网络A)NN(标准神经网络)B)CNN(卷积神经网络)C)RNN(循环神经网络)D)以上都是答案:ABCD解析:[多选题]49.下列属于词袋模型优点的是:A)简单方便快速B)在语料充足的前提下,对于简单自然语言处理任务效果不错C)准确率较低D)无法关注词语间的顺序答案:AB解析:[多选题]50.在k-NN中,由于维数的存在,很可能过度拟合。你将考虑使用以下哪个选项来解决此问题?A)降维B)特征选择C)不确定D)以上都正确答案:AB解析:[多选题]51.相比机器学习,深度学习在处理数据的时,在以下哪些方面更加简便A)数据清洗B)特征提取C)特征选择D)模型训练答案:ABC解析:[多选题]52.在训练模型的阶段,如果说发生了过拟合现象,以下四个选项中,可以通过哪些方式解决A)增加数据量B)减少数据量C)增加迭代次数D)减少迭代次数答案:AD解析:[多选题]53.K-NN虽然常用,但是它的缺点很明显,比如:A)对内存要求较高,因为该算法存储了所有训练数据B)预测阶段可能很慢C)对不相关的功能和数据规模敏感D)对异常值不敏感答案:ABC解析:[多选题]54.ML模型有哪些A)SVMB)LRC)LSTMD)RNN答案:ABCD解析:[多选题]55.马尔科夫三元组当中分别表示什么A)S是状态集合B)π是初始状态的概率C)X是输入的向量D)A是状态间的转移概率答案:ABD解析:[多选题]56.人工智能关于词袋子模型,其优点有哪些?A)简单方便快速B)在语料充足的前提下,对于简单自然语言处理任务效果不错C)准确率较低D)无法关注词语间的顺序答案:AB解析:[多选题]57.文本的离散表示是一种基于规则和统计的向量化方式,常用的方法有()A)Word2VecB)Doc2VecC)词集模型D)词袋(BOW)模型答案:CD解析:[多选题]58.关于数据归一化的作用描述正确的有哪些?A)更容易收敛得到最优解B)权重值较小C)权重值大D)无特点答案:AB解析:[多选题]59.LDA中的两个模型指的是哪两个A)pLSAB)GBDTC)LDAD)XGBoost答案:AC解析:[多选题]60.神经网络中超参数调试方法A)随机选择点来试验超参数效果B)当你给超参数取值时,另一个惯例是采用由粗糙到精细的策略。C)只调试容易的D)给定默认值即可答案:AB解析:[多选题]61.以下几个tensorflow中的方法,可以做总体加和或平均的函数,分别是哪个?A)tf.reduce_sumB)tf.multiplyC)tf.reduce_meanD)tf.norm答案:AC解析:[多选题]62.激活函数也在不断地发展,Relu激活函数相比sigmoid会有哪些优点,以下描述正确的是A)防止梯度弥散B)Relu是一些单元失活,造成稀疏性,从而防止过拟合C)加快计算D)以上都正确答案:ABCD解析:[多选题]63.BERT的token中mask是怎么做的A)80%的tokens会被替换成[MASK]tokenB)10%的tokens会被替换成随机的tokenC)10%的tokens会保持不变但需要被预测D)15%的tokens会被替换成[MASK]答案:ABC解析:[多选题]64.传统分类方法有哪些A)FastTextB)特征工程C)分类器D)TextRNN答案:BC解析:第3部分:判断题,共26题,请判断题目是否正确。[判断题]65.中文对于词没有一个形式上的分界符。A)正确B)错误答案:对解析:[判断题]66.正则表达式的search函数返回的是正则表达式在字符串中所有匹配结果的列表。错A)正确B)错误答案:错解析:[判断题]67.命名实体识别是信息提取、机器翻译和问答系统等应用领域里的基础工具。对A)正确B)错误答案:对解析:[判断题]68.(biLSTM+CRF)是关系抽取的框架A)正确B)错误答案:错解析:[判断题]69.对于一个实用的NLP系统,必须具有较好的未知语言现象的处理能力。()A)正确B)错误答案:对解析:[判断题]70.SVM,逻辑回归,LDA,PCA这几个算法都可以做分类问题A)正确B)错误答案:错解析:[判断题]71.准确率,召回率,精确率的计算相同A)正确B)错误答案:错解析:[判断题]72.谓词可分为两部分谓词名和命题A)正确B)错误答案:错解析:[判断题]73.神经网络的训练需要大量数据A)正确B)错误答案:对解析:[判断题]74.n元谓词都不是命题A)正确B)错误答案:错解析:[判断题]75.Freund等人于1998年提出的基于投票的感知器算法(VotedPerceptron)(Freundetal.,1998)是对原始感知器方法的一种改进,其中融入了支持向最机中最大边缘(LargeMargin)的思想。()A)正确B)错误答案:对解析:[判断题]76.seq2seq是一种经典的端到端的编解码模型A)正确B)错误答案:对解析:[判断题]77.BP算法对神经网络发展起到了很大的作用A)正确B)错误答案:对解析:[判断题]78.逆文档频率是统计一个词出现在文档集中文档频次的统计量。对A)正确B)错误答案:对解析:[判断题]79.Jieba框架是一个用于英文字符处理的工具包A)正确B)错误答案:错解析:[判断题]80.隐马尔科夫模型的数学思想是由Baker极其同事在20世纪60年代到70年代初提出来的A)正确B)错误答案:错解析:[判断题]81.随机森林是由很多弱分类器构成的一个强分类器A)正确B)错误答案:对解析:[判断题]82.LSTM不能解决RNN中的梯度消失问题A)正确B)错误答案:错解析:[判断题]83.语料库按照语料选取的时间可分为历时语料库和共时语料库A)正确B)错误答案:对解析:[判断题]84.NLTK中的(FreqDist)函数可查询文本中的词汇频数分布.A)正确B)错误答案:对解析:[判断题]85.准确率就是所有的预测正确(正类负类)的占总的比重。A)正确B)错误答案:对解析:[判断题]86.如果发生了过拟合可以增加迭代的次数去解决A)正确B)错误答案:错解析:[判断题]87.word2vec可以使用词向量求平均来计算句子的相似度A)正确B)错误答案:对解析:[判断题]88.XGBo

网址:人工智能自然语言技术练习(习题卷31).docx https://www.yuejiaxmz.com/news/view/388756

相关内容

自然语言处理:语音助手与智能聊天机器人
人工智能自然语言处理技术在财务管理专业的应用
智能语音功能人工智能语音识别技术
标题:智能语音助手技术文档
语音识别技术与自然语言处理(NLP)的关键推手
人工智能与语音识别:技术进步与应用前景
语音识别的未来:人工智能与生活的融合1.背景介绍 语音识别技术是人工智能领域的一个重要分支,它涉及到自然语言处理、机器学
Python虚拟助手与自然语言理解
自然灾害求生技能培训.docx
盘点语音识别技术在人工智能中的应用

随便看看