自从去年10月份通过的 AWS Certified Solutions Architect – Professional的考试, Big Data 的认证就开始提上了日程,终于在今年的11月6号通过了考试,74%. 说说这一年来准备考试的一些心得吧。 首先还是要和大家推荐Guru 的 AWS Certified Big Data – Specialty 的video , 这个课程是一直在更新的,所以还是非常好的,内容也比较新,我前后一共看了大概3遍的样子,每次看都会有不同程度的收获。
因为 Big Data 的内容非常多,也非常杂,其中还包括了一些Machine learning 的内容,每一块的内容如果要弄明白了,都需要大量的时间来学习。我个人认为比较重要的部分包括如下的几块,也是考试当中考的比较多的部分
EMR
Redshift
Dynamdb
Data encryption in Kinesis Streams/FH
Dynamdb/Elastisearch and caching …DAX, ElastiCache (Redis and memcache)
Comparison of streams , like streams for only once delivery , for replay capabilities, for ordered data delivery etc
Security with federated access (Assume Identity, SAML, non-SAML , Cognito, AD/Corporate Domain)…and cross account/third party access to data/resource in your account
Machine learning
另外白皮书也是需要看的,很多知识点都在白皮书可以找到。
Big Data Analytics Options on AWS (READ, very good for Case Studies)
Building Big Data Storage Solutions (Data Lakes) for Maximum Flexibility
Comparing the Use of Amazon DynamoDB and Apache HBase for NoSQL (November 2018)
Migrating to Apache HBase on Amazon S3 on Amazon EMR (October 2018)
Best Practices for Amazon EMR (August 2013) (VERY USEFUL)