正在查看 0 条回复
-
作者帖子
-
-
挨踢小茶管理员
今天终于把机器学习专项也拿下来了,分数871分,也算给近一段时间的学习画了一个短暂的句号。机器学习领域还是很庞大的,后面还会有更多的内容需要补充。
大概我在2月份的时候开始准备大数据和机器学习,其实两门考试有蛮多内容是重合的(主要是数据收集这一块),以及两门考试都会考察一些基础的算法。关于大数据专项考试战报,大家可以参考文章20200417-通过AWS Certified Big Data – Specialty认证。两门考试准备下来也花了4个月左右时间了。
总体来说,这门考试不那么简单,特别是对机器学习之前接触比较少的朋友,以及对理论数学知识不那么好的朋友。题主是数学专业的,所以在这里占了一点点小优势。
废话不多说了,我们先来看看机器学习专项包含了什么知识点吧。
知识点
- 了解一些机器学习基础知识,比如什么是监督学习,什么是非监督学习;什么是回归问题,什么是分类问题;什么是传统机器学习,什么是强化学习,什么是深度学习。
- 对线性回归和分类方法有一个大致的数学上的认识(即回归问题是不断求导,梯度下降直到找到最优解)
- 熟悉数据收集方法(Kinesis家族的3大产品的区别和应用场景)
- 熟悉ETL工具Glue和无服务SQL查询Athena的使用场景
- 熟悉数据清洗,包括了如何补齐数据,重复数据处理,无效数据处理,数据归一化等
- 文本转换为数字的技巧,比如什么时候把文本转成0/1,什么时候转成不同的数值大小,什么时候用One-hot encoding(这个相关内容出现了2-3次)
- 文本特征工程,如何去除无用词,OSB和TF-IDF,N-Gram了解一下
- 数值特征工程:Normalization和Standardization特别重要
- 图片特征工程了解一下
- 主成分分析(PCA)算法特别熟悉下,这个是如果你有很多特征,要从中提取重要特征信息的算法。考试有涉及好几道这个题。
- k-means算法,重要,考了4-5道题,应用场景,以及和其他算法放一起的时候什么时候适合用k-means
- KNN算法,熟悉K值对算法的影响和算法基本原理
- 了解下卷积神经网络(CNN)
- 了解下随机森林算法(RCF)和应用场景
- 了解下强化学习
- 熟悉XGBoost,XGBoost是一种很流行和高效的算法,可应用场景非常多,考试也涉及了很多这个知识点。而且针对XGBoost最好看看相关的超参数。
- 混淆矩阵(Confusion Matrix)这个要很熟悉,这个内容我看很多在线培训都没有涉及。一定要知道什么是TP,FP,FN,TN,Recall,Precision,准确率,F1值,ROC和AUC
- 知道在underfitting和overfitting的情况下如何做纠正,是否需要调整特征数量,做正则化处理,还是其他
- 了解TensorFlow,以及high level知道一下如何用容器做训练
- 了解下DeepAR算法
- 如何在Sagemaker中用Pipe Mode加速训练数据的加载速度
- 知道数据转换成Apache Parquet比CSV更快
- 了解下BI工具QuickSight
- SageMaker 如何用私有网络访问S3的数据
- SageMaker Notebook Instance为什么在我的VPC里面看不到?
- 了解下Amazon AI服务,主要是Comprehend,Recognition,Polly等
参考材料
- AI For Everyone | Andrew Ng(重要) – 吴恩达博士的机器学习入门,这个课程录制比较新,讲了很多机器学习的应用场景,入门很好用
- Machine Learning | Andrew Ng – 也是吴博士的机器学习课程,这个比较深入,主要讲解机器学习的数学表达,和发展。(目前我也还没看完,看到week 4之后就比较吃力,坚持继续看)
- Google AI Venture – 谷歌的机器学习课程,主要是针对Tensorflow的,中文老师,但是英文来讲,哈。对入门不错。
- 书籍《白话机器学习算法》 – 这个介绍了一些常用的机器学习算法和使用场景,没有烦闷的数学公式
- A Cloud Guru 的课程(重要)
- 练习题材料(重要)- https://iteablue.com/course/aws-certified-machine-learning-online-quiz
- SageMaker Workshop – https://github.com/awslabs/amazon-sagemaker-workshop/tree/master/Introduction
- 其他数据如果大家还有精力的话可以看看李航的《统计学方法》和西瓜书
最后祝愿大家顺利通过考试吧!
-
-
作者帖子
正在查看 0 条回复
哎呀,回复话题必需登录。 Login here