การศึกษา7 คอร์สเรียนออนไลน์ชั้นยอดสำหรับใครที่อยากเป็น Data Engineer

7 คอร์สเรียนออนไลน์ชั้นยอดสำหรับใครที่อยากเป็น Data Engineer

คงไม่มีใครปฏิเสธได้ว่าในปัจจุบันสาขา Data Science กำลังเป็นสาขาที่เป็นที่ต้องการของธุรกิจทั่วไป และจะทวีความสำคัญขึ้นอย่างมากในอนาคต

อย่างก็ดีสายงาน Data Science นั้นจะดำเนินไปไม่ได้เลย ถ้าขาดอาชีพที่เป็นฟันเฟืองสำคัญอย่าง Data Engineer

Data Engineer คืออาชีพที่มีหน้าที่ดูแลโครงสร้าง ปรับเปลี่ยนระบบต่างๆ ให้เหมาะสมกับธุรกิจ รวมไปถึงพัฒนาคุณภาพและประสิทธิภาพของข้อมูลดิบ (Raw Data) เพื่อให้อาชีพอื่นๆ ในสายงานเดียวกัน อย่าง Data Analyst หรือ Data Scientist นำไปใช้วิเคราะห์ข้อมูลต่อไป

ในปัจจุบันด้วยความที่เป็นที่ต้องการอย่างมาก แต่มีจำนวนผู้เชี่ยวชาญทางด้านนี้น้อยมาก ทำให้เหล่า Data Engineer ได้รับค่าตอบแทนที่ดีมากทั้งในและต่างประเทศ

อย่างในประเทศไทยนั้น Data Engineer ที่เพิ่งจะจบใหม่มีโอกาสที่จะได้เงินเดือนสูงถึง 30,000-50,000 บาท นอกจากนี้ยังมีโอกาสเติบโตในสายงานและต่อยอดได้อย่างมากอีกด้วย

ดังนั้นในบทความนี้ ผมจึงจะมาแนะนำคอร์สเรียนที่น่าสนใจสำหรับใครที่อยากจะเป็น Data Enginner ครับ เรามาดูกันดีกว่าจะมีคอร์สไหนที่น่าสนใจบ้าง

ข้อควรทราบ: ความรู้ก่อนเรียนในแต่ละคอร์สที่เราต้องทราบจะแตกต่างกันออกไป ในบางคอร์สคุณจะไม่ต้องเรียนรู้อะไรมาก่อนเลย ขณะที่บางคอร์สควรจะเรียนพื้นฐาน Data Science รวมไปถึง Python หรือว่า SQL มาก่อนครับ

คอร์สระดับพื้นฐาน

ในส่วนนี้จะรวบรวมคอร์สต่างๆ ที่สอนทักษะระดับพื้นฐานของ Data Engineer ดังนั้นจะเหมาะสำหรับผู้เรียนที่ไม่มีความรู้ใดๆ มาก่อนเลย และอยากเรียนรู้การใช้งานเครื่องมือต่างๆครับ

สำหรับแพลตฟอร์มในการเรียนจะอยู่ใน Coursera และ Udemy เป็นส่วนใหญ่ ใครที่ไม่เคยเรียนในแพลตฟอร์มเหล่านี้มาก่อนเลย ผมแนะนำให้อ่านบทความแพลตฟอร์มเรียนออนไลน์ของผมก่อนครับ

เราไปดูกันดีกว่ามีคอร์สไหนบ้าง

1. Data Engineering Foundations Specialization

คอร์สนี้เป็นหลักสูตรที่พัฒนาโดย IBM และคุณจะได้เรียนได้ผ่านทาง Coursera ครับ โดยวิศวกรชั้นนำของบริษัทจะมาสอนพื้นฐานของ Data Engineering ให้คุณเข้าใจกระบวนการต่างๆ ตั้งแต่ระดับเริ่มต้น เลยครับ

คอร์สเรียน Data Engineer ของ IBM

ภายในหลักสูตรประกอบด้วยคอร์สย่อยทั้งหมด 5 คอร์สได้แก่

1. Introduction to Data Engineering – แนะนำว่า Data Engineer คืออะไร และพื้นฐานของ Data Engineering Ecosystem ไม่ว่าจะเป็นรูปแบบ ที่มาของข้อมูล รวมไปถึง Data Pipeline ที่ดึงข้อมูลจากหลากหลายแหล่ง, Data Warehouse, Data Lake และปิดท้ายด้วยการออกแบบ Data Platforms

2. Python for Data Science, AI & Development – คอร์สนี้จะสอนพื้นฐานของภาษา Python เพื่อใช้สำหรับสายงาน Data Science, Machine Learning และการพัฒนา AI หรือ Artificial Intelligence

3. Python Project for Data Engineering – คอร์สนี้จะเจาะลึกในส่วนของเทคนิคต่างๆ ที่จะประยุกต์ใช้เข้ากับ Data Engineering เช่นการดึงข้อมูลโดยใช้ Webscraping และ API รวมไปถึงการแก้ไข Data Types

4.Introduction to Relational Databases (RDBMS) – คอร์สที่ 4 จะแนะนำระบบฐานข้อมูลต่างๆ ที่จะทำให้คุณเข้าใจว่าการเก็บข้อมูลทำอย่างไร และเราสามารถเข้าถึงตัวข้อมูลได้อย่างไร และเจาะลึกในคอนเซปต์ต่างๆ ที่เกี่ยวกับ Relational Databases

5. Databases and SQL for Data Science with Python – คอร์สสุดท้ายที่จะอธิบายวิธีการใช้งาน SQL สำหรับ Data Science อย่างละเอียด

ผมมองว่าจุดแข็งของหลักสูตรนี้คือ การที่คุณจะได้ลองทำทุกอย่างด้วยตนเองตั้งแต่เบื้องต้น ไม่ใช่ว่าคุณจะเรียนทฤษฎีอย่างเดียว แต่คุณจะได้ความรู้ด้านการใช้งานด้วย ซึ่งจะช่วยให้คุณเข้าใจเนื้อหาได้มากขึ้นอย่างมากเลยครับ

ในส่วนของ workload แต่ละสัปดาห์จัดว่าสบายๆ เพราะทาง IBM แนะนำว่าควรจะใช้เวลาเรียน 3 ชั่วโมงต่อสัปดาห์เป็นเวลา 5 เดือนครับ

ตัวหลักสูตรสามารถเรียนได้ฟรีทั้งหมด อย่างไรก็ดีถ้าคุณต้องการ feedback งานของคุณ (ซึ่งจำเป็นมากสำหรับมือใหม่) ผมแนะนำให้สมัครแบบ Full Course ซึ่งราคาจะอยู่ที่ $49 หรือประมาณ 1,470 บาทต่อเดือนครับ

2. Become A Data Engineer

หากความต้องการของคุณคือ การเป็น Data Engineer ระดับชั้นนำ และทำงานได้จริง การได้รับคำแนะนำจากผู้เชี่ยวชาญโดยตรงเป็นสิ่งที่สำคัญมาก และมีคอร์สออนไลน์ไม่กี่คอร์สเท่านั้นที่มีระบบดังกล่าว

หนึ่งในนั้นก็คือ Udacity ครับ คอร์สเรียนของแพลตฟอร์มนี้จะมีความเข้มข้นกว่าคอร์สอื่นอย่างชัดเจน อย่างไรก็ดีตัวคอร์สจะเหมาะกับคนที่มีพื้นฐาน Python และ SQL มาบ้างแล้วครับ

คอร์สเรียนของ Udacity
คอร์สเรียนของ Udacity

สิ่งที่คุณจะได้เรียนในคอร์สมีดังต่อไปนี้

  • Data Modeling – สร้าง Relational และ NoSQL Model สำหรับผู้ใช้บริการต่างๆ ที่มีความต้องการที่ต่างกัน นอกจากนี้คุณจะได้ใช้ ETL ในการสร้างฐานข้อมูลใน PostgreSQL และ Apache Cassandra
  • Cloud Data Warehouses – ในส่วนนี้คุณจะได้พัฒนาความรู้ความเข้าใจของคุณใน Data Infrastructure โดยคุณจะได้สร้าง Cloud Data Warehouse บน AWS
  • Spark and Data Lakes – ต่อมาคุณจะได้เรียนรู้เกี่ยวกับ Big Data Ecosystem และวิธีการใช้ Apache Spark ในการจัดการฐานข้อมูลขนาดยักษ์ รวมไปถึงวิธีการเก็บข้อมูลไว้ใน Data Lake และ query โดยใช้ Spark
  • Data Pipeline with Airflow – คุณจะได้วางกำหนดการและควบคุม Data Pipeline โดยใช้ Apache Airflow รวมไปถึงตรวจสอบคุณภาพของข้อมูลอย่างละเอียด
  • Capstone Project – โปรเจคขนาดใหญ่ที่คุณจะได้ประยุกต์ใช้ความรู้ทั้งหมดที่เรียนไป และลองจัดการโปรเจคทุกอย่างด้วยตัวของคุณเองในฐานะ Data Engineer มือใหม่

ภายในคอร์สนี้คุณจะได้เรียนทฤษฎีควบคู่ไปกับการทำ Project ตลอดคอร์ส นอกเหนือจาก Capstone Project แล้ว คุณจะได้ลองจัดการข้อมูลของแอพฟังเพลงชื่อว่า Sparkify ครับ ซึ่งโดยทั่วไปแล้วผมมองว่าดีมาก เพราะคุณสามารถนำทักษะตรงนี้มาใช้ประโยชน์ได้นั่นเอง

สำหรับการเรียนกับ Udacity นั้นจะไม่เหมือนกับการเรียนออนไลน์ทั่วไป เพราะทุกๆ งานที่คุณทำ คุณจะได้รับ feedback จากผู้เชี่ยวชาญว่าทำถูกต้องหรือไม่ และควรแก้ไขอะไรบ้าง

นอกจากนี้คุณยังจะมี mentor ที่ขอคำปรึกษาได้ทุกๆ ช่วงเวลา ดังนั้นถ้าติดขัดตรงไหน คุณสามารถขอความช่วยเหลือได้ทันทีครับ

ไม่เพียงเท่านั้น Udacity ยังช่วยเหลือคุณในเรื่องการสมัครงานอีกด้วย ไม่ว่าจะเป็นการแก้ไข Resume ปรับแต่ง Github Portfolio รวมไปถึง LinkedIn Profile ซึ่งจะช่วยให้คุณดูดียิ่งขึ้นในการสมัครงานครับ

ในเรื่องของ Wordload นั้น คอร์สของ Udacity จัดว่าหนักพอสมควร โดยคุณควรจะใช้เวลา 5-10 ชั่วโมงต่อสัปดาห์ขึ้นไปในการเรียน โดยจะเรียนให้จบภายในเวลา 5 เดือน ดังนั้นคุณควรมั่นใจว่ามีเวลาเรียนคอร์สนี้ ก่อนที่จะตัดสินใจสมัครครับ

ค่าเรียนของ Udacity มีด้วยกันสองแบบนั่นก็คือ

  • Monthly – ค่าเรียนคิดเป็นรายเดือน เดือนละ $399 หรือประมาณ 11,970 บาท
  • Pay Upfront – จ่ายค่าเรียนทั้งหมดทันทีจะได้ส่วนลด 15% เหลือ $279 หรือประมาณ 8,370 บาทต่อเดือน

อย่างไรก็ดี Udacity นั้นแจกส่วนลดและ Financial Support บ่อยมาก บางครั้งจะให้ส่วนลดตรงๆ อย่างเช่นลดอีก 50%-75% หรือว่าให้ Financial Support (ลด 75% แต่ใช้ได้สำหรับนักเรียนใหม่เท่านั้น) ทำให้คุณมีโอกาสได้คอร์สเรียน Data Engineer คุณภาพในราคาแค่ 2,500-3,000 บาทต่อเดือน ซึ่งถ้าคุณเรียนจบแล้ว ราคาจะลดไปอีกครับ

จริงอยู่ว่าค่าเรียนที่เราต้องจ่ายให้ Udacity นั้นสูงกว่าตัวเลือกอื่น แต่ถ้าคุณปรารถนาจะเป็น Data Engineer ที่เชี่ยวชาญ และอยากจะทำงานที่มีรายได้สูงในต่างประเทศ ผมมองว่าคอร์สนี้เป็นไม่กี่คอร์สที่สามารถทำให้ฝันของคุณเป็นจริงได้ครับ

3. Data Engineer with Python

หลายคนอาจจะไม่ชอบเรียนออนไลน์แบบวิดีโอสักเท่าไรนัก จึงอยากรู้ว่ามีคอร์ส Data Engineer ที่เรียนโดยไม่เน้นวิดีโอหรือไม่

คำตอบก็คือมีครับ คอร์สที่ว่าก็เป็นคอร์สของสถาบันออนไลน์อย่าง Datacamp นั่นเอง ตัวสถาบันนี้จะเน้นสอนทักษะทางด้าน Data Science ต่างๆ แบบ Interactive ซึ่งจะใช้วิธีให้ผู้เรียนลองอ่าน และลงมือทำทันที ทำให้ได้รับประสบการณ์การเรียนที่ต่างออกไปครับ

โดยส่วนตัวแล้วผมชอบการเรียนแบบนี้มาก เพราะรู้สึกว่าไม่เวิ่นเว้อ การอธิบายเข้าใจได้ง่าย และลดความเบื่อหน่ายที่ต้องนั่งฟังนานๆ ด้วยครับ

สำหรับการเรียนทักษะ Data Engineer ของ Datacamp นั้นคุณจะต้องเรียนลำดับตาม Career Track ที่จัดสรรเอาไว้ให้แล้ว ซึ่งจะประกอบด้วยคอร์สย่อยทั้งหมด 25 คอร์สด้วยกัน โดยจะใช้ Python เป็นภาษาหลักในการเรียนครับ

ด้านล่างคือบางส่วนที่คุณจะได้เรียนใน Career Track

  • พื้นฐานของ Data Engineering
  • พื้นฐาน Python
  • พื้นฐาน Shell
  • Unit Testing สำหรับ Data Science
  • Airflow และ Spark
  • การสร้าง Data Pipeline
  • AWS Boto และการใช้ Cloud Technology ในการ optimize ในส่วนของ Data Workflow
  • Relational Databases และการออกแบบฐานข้อมูลใน SQL
  • Scala
  • PySpark และ MongoDB
  • การจัดการและยกระดับประสิทธิภาพของ Query บน SQL Server
  • และอื่นๆ อีกมากมาย

ทั้งนี้คอร์สเรียนของ Datacamp จะเป็นคอร์สสั้นๆ ที่ใช้เวลา 2-4 ชั่วโมง นอกจากนี้ยังเรียนในมือถือและ Tablet ได้ด้วย เพราะเรียนทุกอย่างบนแพลตฟอร์ม ทำให้เป็นการเรียนที่สะดวกสบายอย่างมากสำหรับมือใหม่ครับ

ราคาคอร์สเรียน Data Science ของ Datacamp

ค่าเรียนของ Datacamp นั้นจะคิดเป็นรายแพลตฟอร์มนั่นหมายความว่า นอกจาก Data Engineering แล้ว คุณยังสามารถเรียนเนื้อหา Data Science อื่นๆ ได้ด้วย อย่างเช่นการวิเคราะห์ข้อมูล (Data Analysis) รวมไปถึงเครื่องมือชั้นยอดในการทำ Data Visualization อย่าง Tableau และ PowerBI

ทั้งนี้ระบบที่ใช้จะเป็นระบบสมาชิก โดยประกอบด้วย 2 แพลนนั่นคือ

  • Standard – $12.42 หรือประมาณ 380 บาทต่อเดือน
  • Premium – $33.25 หรือประมาณ 1,000 บาทต่อเดือน

สำหรับแพลน Standard จะเรียนได้ทุกคอร์สหลักบนแพลตฟอร์ม ซึ่งรวมแล้วมีมากกว่า 335 คอร์สด้วยกัน แต่ถ้าคุณอยากได้การทำโปรเจคอีก 80 ชิ้น และเรียนคอร์สพิเศษอย่าง Tableau, PowerBI และ Oracle คุณจะต้องสมัครแพลนระดับพรีเมียมครับ

อย่างไรก็ดีผมมองว่าแพลนระดับพรีเมียมนั้นเป็นทางเลือกที่สนใจสำหรับใครที่อยากจะทำโปรเจคทางด้าน Data Science อย่างไรก็ดีคุณสามารถประหยัดได้ด้วยการสมัครแค่ Standard แล้วไปหาโปรเจคทำที่อื่น (อย่างเช่นคอร์สของ Udemy ที่มีราคาถูก) เป็นต้น

ทั้งนี้ Datacamp ให้คุณเรียนบทแรกฟรี หลังจากลงทะเบียนครับ ถ้าสนใจก็สามารถไปลองกันได้

คอร์สปลีกย่อยอื่นๆ

ลำดับถัดมาคือคอร์สปลีกย่อยอื่นๆ ที่ช่วยเสริมทักษะย่อยที่จำเป็นสำหรับ Data Engineer เนื่องจากคอร์สเหล่านี้เป็นคอร์สระดับสูงขึ้น คุณต้องมีพื้นฐาน Python และ SQL ที่ดีในระดับหนึ่งก่อนที่จะเริ่มเรียนครับ

4. Data Engineering with Google Cloud Professional Certificate

หลักสูตรของ Coursera นี้จะสอนทักษะ Data Engineering บนแพลตฟอร์มอย่าง Google Cloud โดยผู้สอนก็คือ Google เองโดยตรง ดังนั้นคุณมั่นใจได้เลยว่าความรู้ที่เราเรียนไปจะถูกต้อง และนำไปต่อยอดได้จริงครับ

ภายในหลักสูตรประกอบด้วย 6 คอร์สย่อยดังต่อไปนี้

1. Google Cloud Platform Big Data and Machine Learning Fundamentals – คอร์สแรกที่จะแนะนำ Big Data Solutions ต่างๆ บน Google Cloud ซึ่งรวมไปถึง data processing และ machine learning ครับ

2. Modernizing Data Lakes and Data Warehouses with GCP – คอร์สที่ 2 จะอธิบายถึงส่วนสำคัญทั้งสองของ Data Pipeline อย่าง Data Lake และ Data Warehouse บน Google Cloud รวมไปถึงประโยชน์และวิธีการนำไปใช้ในเชิงธุรกิจ

นอกจากนี้คุณจะได้เข้าใจถึงความสำคัญของ Cloud Environment ที่มีต่อประสิทธิภาพของ Data Engineering ซึ่งจะอธิบายว่าทำไมการสร้างโครงสร้างต่างๆ ถึงควรอยู่บน Cloud Platform ครับ

3. Building Batch Pipelines on GCP – คอร์สที่สามจะอธิบายถึง paradigms ต่างๆ ของ Data Pipeline โดยจะอธิบายว่า Paradigm ใดที่ควรจะใช้สำหรับ batch data นอกจากนี้คุณจะได้ลองสร้าง component ต่างๆ ของ Data Pipeline และเรียนรู้เครื่องมือตัวต่างๆ ที่เกี่ยวข้อง

4. Building Resilent Streaming Analytics System on GCP – คอร์สนี้จะเจาะลึกการสร้าง streaming data pipeline บน GCP ซึ่งเป็นแกนสำคัญสำหรับธุรกิจมากมายที่ต้องใช้ข้อมูลแบบ real-time รวมไปถึงเทคนิคอื่นๆ ที่เกี่ยวข้องอย่างเช่นการเก็บข้อมูลไปยัง Big Query หรือ Cloud BigTable เพื่อนำไปใช้วิเคราะห์ต่อไป

5. Smart Analytics, Machine Learning, and AI on GCP – คอร์สที่ 5 จะสอนถึงการใส่ machine learning เข้าไปใน Data Pipeline และจะสอนให้คุณใช้งาน AutoML, Kubeflow เช่นเดียวกับการสร้าง machine learning models บน GCP ครับ

6. Preparing for the Google Cloud Professional Data Engineer Exam – คอร์สสุดท้ายจะเตรียมคุณให้พร้อมสำหรับการสอบ Certification ในส่วนของ Data Engineer ของ Google ซึ่งจะมีประโยชน์มากสำหรับใครที่วางแผนว่าจะสอบครับ

คอร์สนี้ใช้เวลาเรียน 4 เดือน (ถ้าคุณเรียนตามคำแนะนำ นั่นคือสัปดาห์ละ 4 ชั่วโมง) โดยจะเรียนได้ฟรีเช่นเคย แต่ถ้าอยากได้ feedback และ certificate คุณจะต้องจ่ายค่าเรียนในราคา $49 หรือประมาณ 1,470 บาทต่อเดือนครับ

5. Data Warehousing for Business Intelligence Specialization

อีกหลักสูตรหนึ่งที่น่าสนใจใน Coursera โดยจะเจาะลึกในส่วนของ Data Warehouse สำหรับ Business Intelligence โดยตรง ดังนั้นใครที่คิดว่าทักษะการสร้าง Data Warehouse เพื่อการนี้ยังไม่คล่อง ผมแนะนำให้ลองเรียนหลักสูตรนี้ดูครับ

หลักสูตรนี้ประกอบด้วยคอร์สย่อยทั้งหมด 5 คอร์สด้วยกันได้แก่

1. Database Management Essentials – คอร์สเริ่มต้นที่จะสอนให้คุณเข้าใจถึงพื้นฐานการบริหารฐานข้อมูล คุณจะได้ลองสร้าง Relational Databases, เขียน SQL Statements อย่างง่ายเพื่อดึงข้อมูลที่ต้องใช้สำหรับการวิเคราะห์ทางธุรกิจ, ออกแบบฐานข้อมูล และใช้งานเครื่องมือ Database Diagram Tool ฯลฯ

2. Data Warehouse Concepts, Design and Data Integration – คอร์สที่ 2 จะแนะนำหลักการที่สำคัญของ Data Warehouse ตั้งแต่การสร้างและออกแบบไปจนถึงการสร้าง data integration workflows

คุณจะได้เรียนโครงสร้างต่างๆ ที่เกี่ยวข้องและจำเป็นต้องการพัฒนา Data Warehouse แบบองค์รวมครับ ซึ่งความรู้ในส่วนนี้จะเป็นประโยชน์มากต่อการต่อยอดในระดับสูง

3. Relational Database Support for Data Warehouses – สำหรับคอร์สนี้คุณจะได้ลองใช้ SQL ในการแก้ไขปัญหาต่างๆ ของ Business Intelligence รวมไปถึงเรียนรู้ฟีเจอร์ของ RDBMS ที่ช่วยสรุปข้อมูล และวิธีบริหารการใช้งาน Data Warehouse รูปแบบต่างๆ และคอนเซปต์ปลีกย่อยที่เกี่ยวข้องอย่างเช่น Data Governance

4. Business Intelligence Concepts, Tools, and Applications – คอร์สที่ 4 จะสอนให้คุณใช้ Data Warehouse ในเชิงธุรกิจ คุณจะได้ลองจัดการกับ Big Data และใช้เครื่องมือต่างๆ อย่างเช่น OLAP ในการสร้าง visualizations และ dashboard

ผมมองว่าตัวคอร์สนี้มีประโยชน์มากสำหรับใครที่อยากจะเป็น Business Intelligence Developer เพราะสิ่งที่คุณจะได้เรียนคือการประยุกต์ใช้งานจริงในการทำงานนั่นเองครับ

5. Design and Build a Data Warehouse for Business Intelligence Implementation – คอร์สนี้จะเป็นการทดสอบทักษะที่คุณได้เรียนมาจากทั้งหมด 4 คอร์ส คุณจะได้ลองสร้าง Data Warehouse ขึ้นมาด้วยตนเอง เช่นเดียวกับ data integration workflows

นอกจากนี้เขียน SQL Statements เพื่อจัดการกับ Queries ต่างๆ และปิดท้ายด้วยการใช้ OLAP และเครื่องมืออื่นๆ ในการสร้าง Visualizations และวิเคราะห์ข้อมูลเพื่อให้ได้ข้อมูลเชิงลึกออกมาครับ

ทางมหาวิทยาลัยแนะนำว่าควรจะใช้เวลาเรียน 4 ชั่วโมงต่อสัปดาห์เป็นเวลา 7 เดือนด้วยกัน ซึ่งถือว่านานพอสมควรทีเดียว แต่คุณจะได้ความรู้ดีๆ อย่างครบถ้วนอย่างแน่นอน

เช่นเดียวกับคอร์สบน Coursera คุณสามารถเรียนคอร์สนี้ได้ฟรี แต่ถ้าอยากเรียนแบบครบถ้วนก็ต้องเสียเงิน $49 หรือ 1,470 บาทต่อเดือนครับ

6. Big Data Engineer

คอร์สที่ 6 ในบทความนี้เป็นของ Simpliearn (ร่วมกับ IBM) โดยจะเน้นไปที่ Data Engineering สำหรับ Big Data โดยตรง ดังนั้นทักษะและเครื่องมือต่างๆ ที่คุณจะได้เรียนในคอร์สจะต่างกับคอร์สอื่นอย่างชัดเจน

แม้ว่าจะซับซ้อนกว่า แต่ผมก็มองว่าน่าเรียน เพราะรายได้ของ Big Data Engineer ในต่างประเทศนั้นสูงกว่า Data Engineer ทั่วไปอย่างชัดเจนเลยครับ

Simplilearn

ด้วยความที่เป็นคอร์สระดับสูง ก่อนที่จะเรียนคอร์สนี้ คุณควรมีทักษะและความเข้าใจในสิ่งเหล่านี้เป็นอย่างดี ได้แก่

  • Data Structures และ Algorithms
  • SQL
  • Python และ Java
  • Cloud Platforms และ Distributed Systems
  • Data Pipeline

สิ่งที่คุณจะได้เรียนในคอร์สมีดังต่อไปนี้

  • Big Data for Data Engineering – อธิบายหลักการเบื้องต้นของ Big Data และการประยุกต์ใช้ในอุตสาหกรรมต่างๆ
  • Big Data Hadoop and Spark Developer – อธิบายการใช้งาน Hadoop ตั้งแต่โครงสร้างของ Ecosystem ไปจนถึงเครื่องมือต่างๆ ที่เกี่ยวข้อง
  • PySpark Training Course – ในส่วนนี้คุณจะได้เข้าใจการใช้งาน Spark ร่วมกับ Python
  • Apache Kafka – อธิบายการใช้งาน Apache Kafka และเครื่องมือตัวอื่นๆ ที่เกี่ยวข้องในการจัดการกับข้อมูลจำนวนมหาศาล
  • MongoDB Developer and Administrator – แนะนำวิธีใช้ NoSQL Database ที่ได้รับความนิยมสูงสุดอย่าง MongoDB เพื่อจัดการเรื่อง data storage ฯลฯ
  • AWS Big Data Certification Training – ในพาร์ตนี้ คุณจะได้เรียนรู้วิธีการ Hosting ข้อมูลของคุณและการทำ Distributed Processing บน AWS ซึ่งเป็น Cloud Platform อันดับ 1 ในปัจจุบัน
  • Capstone – โปรเจคขนาดใหญ่ที่จะใช้คุณใช้ความรู้ทั้งหมดที่เรียนมา

สิ่งที่โดดเด่นสำหรับ Simplilearn ก็คือการเรียนแบบสอนสดทางออนไลน์ ซึ่งคุณจะได้ความรู้ที่สดใหม่ทันสมัยรับกับเทคโนโลยีที่มีการเปลี่ยนแปลงอยู่ตลอดเวลา นอกจากนี้ยังมีโปรเจคเสมือนจริงให้ลองทำมากกว่า 15 ชิ้นด้วยกัน

หลายคนอาจจะสงสัยว่าขาดเรียนจะเป็นอะไรหรือเปล่า จริงๆ แล้วคุณขาดเรียนก็ไม่ต้องกังวล เพราะสามารถเรียนย้อนได้อยู่แล้วครับ

ถึงกระนั้นตัวคอร์สของ Simplilearn จัดว่าราคาสูงทีเดียวเพราะอยู่ที่ $899 หรือประมาณ 26,970 บาทครับ

7. Azure Data Engineer Technologies for Beginners [Bundle]

คอร์สสุดท้ายที่ผมอยากจะแนะนำก็คือคอร์สบน Udemy คอร์สนี้ครับ โดยจะสอนการใช้งานเทคโนโลยีต่างๆ บน Azure Platform ที่เหล่า Data Engineer ต้องใช้งาน

ถ้าคุณสนใจจะเป็นผู้เชี่ยวชาญด้านนี้ของผู้ให้บริการ Cloud ขนาดยักษ์ที่เติบโตเร็วไม่แพ้ AWS ผมมองว่าคอร์สนี้น่าสนใจมากๆ ครับ

ตัวคอร์สสอนโดย Eshant Gorg ผู้เชี่ยวชาญที่ครอบครอง Certificate ของ Microsoft ถึง 3 ใบด้วยกัน (DP-200, DP-201, MCTS) และยังมีประสบการณ์ทางด้านนี้โดยตรงอีกถึงสิบกว่าปี ดังนั้นคุณมั่นใจได้เลยว่าคุณจะได้เรียนกับครูที่เก่งจริงๆ ครับ

ภายในคอร์สประกอบด้วยเนื้อหาดังต่อไปนี้

  • แนะนำ Azure Cloud Computing
  • Azure SQL Database และ Data Warehouse
  • Azure Data Lake
  • NoSQL Database บน Microsoft Azure
  • Cosmos DB
  • Streaming Analytics
  • Databricks/Data Factory
  • Azure Monitor Service
  • HDInsight
  • ทบทวน Hadoop และ Data Warehouse

สำหรับคอร์สนี้มีเนื้อหาแบบวิดีโอกว่า 34 ชั่วโมงด้วยกัน และยังมีแบบฝึกหัดให้คุณได้ลองทำไปตลอดทาง คุณจะได้รับการอธิบายหลักการต่างๆ รวมไปถึงการใช้งานเครื่องมือที่เหล่า Data Engineer บน Azure อย่างละเอียดครับ

เนื่องจากคอร์สนี้อยู่ใน Udemy ผมแนะนำให้รอซื้อในช่วงลดราคาครับ เพราะจะได้ราคา 300-400 บาทเท่านั้นเอง การลดราคาเองก็มีอยู่บ่อยๆ อีกด้วย

อย่างไรก็ดีข้อเสียของคอร์สนี้ก็คือ ไม่ค่อยมี Project ขนาดใหญ่ให้ลองทำเท่าไร คุณอาจจะต้องไปลองผิดลองถูกด้วยตนเองครับ

คอร์สนี้ได้รับคะแนนรีวิวไป 4.6/5.0 จากผู้เรียนกว่า 19,800 คนครับ

ทักษะอื่นๆ ที่น่าสนใจ

ด้านล่างคือทักษะปลีกย่อยที่หลายคนอาจจะพิจารณาเรียนเพื่อต่อยอดความรู้ของคุณจาก 7 คอร์สด้านบนครับ

Apache Airflow – management platform ที่สำคัญสำหรับการบริหาร Workflow ที่มีความซับซ้อน

Big Data – การจัดการ ประมวลผล และวิเคราะห์ข้อมูลขนาดยักษ์ที่ซับซ้อนและใหญ่เกินกำลังของ Data Processing Software ทั่วไป

Scala + Spark – ภาษาและเครื่องมือที่สำคัญสำหรับการทำ Data Processing ของ Big Data

Hadoop – อีกหนึ่งเครื่องมือที่สำคัญสำหรับการจัดการ Big Data

Azure -เรียนรู้การใช้งาน Cloud Platform ของ Microsoft ที่ได้รับความนิยมขึ้นมาอย่างมากในระยะหลัง

AWS Certifications – เรียนรู้การใช้งาน AWS Platform อย่างละเอียด เพื่อเตรียมตัวให้พร้อมสำหรับการสอบ Certifications

บทความล่าสุด

Victory Tale ไม่อนุญาตให้คัดลอกบทความไปโพสที่ใดทุกกรณี การฝ่าฝืนมีโทษทางกฎหมาย

error: Content is protected !!