การศึกษาเรียนการใช้งาน Hadoop สำหรับ Big Data ทางออนไลน์ที่ไหนดี?

เรียนการใช้งาน Hadoop สำหรับ Big Data ทางออนไลน์ที่ไหนดี?

Apache Hadoop คือเรียกสั้นๆ ว่า Hadoop คือ open-source framework ที่ช่วยให้เราสามารถเก็บรักษาและจัดการฐานข้อมูลขนาดใหญ่ได้ในคอมพิวเตอร์หลายเครื่อง ทำให้การประมวลผลข้อมูลมีประสิทธิภาพและรวดเร็วมากขึ้น และเกิดปัญหาน้อยลงอีกด้วย

ความเข้าใจ Hadoop จึงเป็นทักษะที่สำคัญยิ่งสำหรับใครที่อยากทำงานในสาขา Data Science หรือ Big data โดยเฉพาะใครที่อยากเป็น Big Data Architect ครับ ปัจจุบัน Hadoop เป็นหนึ่งในทักษะทาง IT ที่เป็นต้องการที่สุดในสหรัฐอเมริกา โดยค่าเฉลี่ยผลตอบแทนของผู้มีทักษะทางด้านนี้มากถึง $160,000 ต่อปีใน Silicon Valley

ในโพสนี้เราจะมาดูว่าคอร์สสอน Hadoop ทางออนไลน์ดีๆ มีที่ไหนบ้าง?

Big Data Image by Tumisu from Pixabay

ข้อควรทราบ: ราคาและเงื่อนไขต่างๆ ของแต่ละคอร์สจะเปลี่ยนแปลงได้ตามความต้องการของผู้ให้บริการ ดังนั้นถ้าคุณต้องการจะได้ราคาและเงื่อนไขที่ถูกต้องที่สุด คุณควรตรวจสอบกับผู้บริการ (กดผ่านลิงค์ได้ทันทีครับ)

Udemy

Udemy เป็นแพลตฟอร์มเรียนออนไลน์ที่หลายคนเคยผ่านตามาบ้างแล้ว สำหรับคอร์สทั้งหมดบน Udemy จะเป็นแบบซื้อขาด ไม่มีการจ่ายค่าสมาชิก หลังจากซื้อไปแล้ว คุณจะไปเรียนที่ไหนก็ได้ ที่บ้าน ที่ห้าง ที่ชายทะเล ฯลฯ และเมื่อไรก็ได้ ซื้อวันนี้ อีกสามเดือนค่อยเรียนก็ได้ครับ นอกจากนี้ถ้าเรียนไปแล้วไม่ถูกใจ สามารถรับเงินคืนได้ภายใน 30 วันครับ

สิ่งที่ผมชอบอีกอย่างหนึ่งคือความเสถียรของ app ทำให้ผมใช้เรียนบน Smartphone และ Smart TV ได้อย่างสะดวกสบายมาก และไม่เคยมีปัญหาอะไรเลยครับ

อย่างไรก็ดีราคาคอร์สบน Udemy จะเปลี่ยนแปลงไปมา แต่ส่วนใหญ่จะอยู่ที่หลักร้อย เพราะมีลดราคาบ่อยมากแทบทุกสัปดาห์ ถ้าคุณถูกใจคอร์สไหน แต่ราคาอยู่ที่หลักพัน ผมแนะนำให้รอไปก่อนประมาณ 2-5 วัน หรือว่าสมัครแจ้งเตือนของ Victory Tale ไว้ก็ได้ครับ ถ้ามีลดราคา ผมจะได้รีบแจ้งเตือนคุณทันที

คอร์สสอน Hadoop ที่น่าสนใจบน Udemy มีมากมาย อาทิเช่น

1. The Ultimate Hands-On Hadoop – Tame your Big Data!

คอร์สที่น่าสนใจที่จัดทำโดย Frank Kane อดีตวิศวกรของ Amazon และ IMDb และมีสิทธิบัตรอยู่ในกำมือถึง 17 ใบในสาขา Distributed Computing, Data mining และ Machine Learning ในปัจจุบันเขายังเป็นผู้ก่อตั้ง Sundog Software บริษัทพัฒนาเทคโนโลยี VR และสอนความรู้เกี่ยวกับ Big Data ให้กับบุคคลทั่วไป

Hadoop

ภายในคอร์สจะมีเนื้อหาความยาว 14.5 ชั่วโมง โดยจะสอนคุณมากมาย อาทิเช่น

  • ออกแบบระบบที่ช่วยจัดการ Big Data โดยใช้ Hadoop
  • สร้างความเข้าใจว่า YARN, Tex, Mesos, Zookeeper, Zeppelin, Hue และ Oozie ช่วยจัดการ Hadoop Clusters อย่างไร
  • เลือกเทคโนโลยี Data Storage ที่เหมาะสม
  • ใช้ HDFS และ MapReduce ในการเก็บรักษาและวิเคราะห์ข้อมูล
  • วิเคราะห์ข้อมูลที่เกี่ยวข้องโดยใช้ Hive และ MuSQL
  • ใช้ Pig และ Spark ในการสร้าง script เพื่อประมวลผลข้อมูลบน Hadoop Cluster
  • และอื่นๆ อีกมากมาย

อย่างไรก็ดีทางผู้สอนแนะนำว่าผู้เรียนควรจะมีทักษะทางด้าน programming มาบ้างแล้ว โดยเฉพาะ Python และ Scala นอกจากนี้คุณต้องมี PC ที่มี RAM ที่ไม่ได้งาน 8 GB ขึ้นไปในกรณีที่คุณต้องการทำแบบฝึกหัดตามที่ผู้สอนให้มาครับ

คอร์สนี้ได้คะแนนรีวิวสูงมาก นั่นคือได้มากถึง 4.6/5.0 โดยมีผู้เรียนมากกว่า 111,000 คนครับ

2. Learn Big Data: The Hadoop Ecosystem Masterclass

คอร์สนี้เป็นคอร์สของ Edward Viaene ผู้เป็น DevOps Engineer มานานกว่า 10 ปีด้วยกัน และมีความเชี่ยวชาญพิเศษในการดูแลระบบ และยังเป็น Full Stack Developer ด้วยครับ

สิ่งที่ต่างจากคอร์สแรกคือ คอร์สนี้ไม่ได้ถูกสร้างขึ้นมาสำหรับมือใหม่ ผู้เรียนควรจะมี Background ในสาย IT อย่างเช่นเป็น Software Engineer มาก่อน และต้องมีคอมพิวเตอร์ที่มี RAM ที่ไม่ได้ใช้งาน 8 GB ขึ้นไปเหมือนกับคอร์สแรกครับ

การที่คอร์สไม่ใช่สำหรับมือใหม่ ทำให้คุณคาดหวังได้เลยว่าคอร์สจะสั้น ไม่เวิ่นเว้อ ตัวคอร์สมีความยาว 6 ชั่วโมงเท่านั้น โดยจะครอบคลุมเนื้อหาต่อไปนี้

  • แนะนำ Big Data และ Hadoop
  • Pig
  • Apache Spark
  • Hive
  • Real Time Processing
  • Kafka
  • Storm
  • Spark Streaming
  • HBase
  • Phoenix
  • Hadoop Security
  • Ranger
  • HDFS Encryption

คอร์สนี้ได้คะแนนรีวิว 4.3/5.0 จากผู้เรียนเกือบ 17,000 คน

3. Hadoop Developer in Real World

คอร์สนี้จัดทำโดย Hadoop in Real World กลุ่มของทีม Senior Consultant ที่เชี่ยวชาญในการใช้งาน Hadoop โดยตรง และมีประสบการณ์การทำงานในส่วนของการจัดการ Hadoop Cluster ขนาด 50-800 node มานานหลายปี ครับ

อย่างในรูปคือตัวอย่างของคอร์สที่อยู่ที่ราคาเต็ม ถ้าคุณเปิดลิงค์เข้าไปเจอแบบนี้ ผมแนะนำให้รอครับ

ในการเรียนคุณควรมีความรู้การเขียน Java มาบ้าง แต่ไม่จำเป็นต้องเป็นผู้เชี่ยวชาญแต่อย่างใด ทั้งนี้คอร์สนี้น่าจะเป็นคอร์ส Hadoop ที่มีเนื้อหามากที่สุดแล้วใน Udemy เพราะมีเนื้อหาถึง 20.5 ชั่วโมงด้วยกัน

สิ่งที่คอร์สนี้เน้นเป็นพิเศษคือเนื้อหาที่นำไปใช้ได้จริง โดยจะเน้นหนักที่

  • ความเข้าใจว่า Big Data คืออะไร และ Hadoop ช่วยแก้ปัญหาที่เกี่ยวข้องกับ Big Data อย่างไร
  • การสร้าง Hadoop Cluster โดยใช้ Amazon Web Services (AWS)
  • การใช้งานและจัดการ Hadoop Cluster และเข้าใจโครงสร้างของมัน เช่น Single Point of Failure (SPOF), Nodes ต่างๆ รวมไปถึง YARN
  • ใช้งาน Pig เพื่อการวิเคราะห์ data อย่างสูง
  • MapReduce และ Hive
  • และอื่นๆ อีกมากมาย

คอร์สนี้ได้คะแนนรีวิวสูงที่สุดในบรรดาคอร์ส Hadoop ทั้งหมดใน Udemy โดยได้ไป 4.6/5.0 จากนักเรียนทั้งหมด 5,800 คน

อย่างไรก็ดีถ้าคอร์สทั้ง 3 ที่ผมแนะนำไปยังไม่ถูกใจ คุณสามารถหาคอร์สที่ถูกใจได้จากคลังคอร์ส Hadoop ของ Udemy ครับ

Edureka

Edureka เป็นแพลตฟอร์มสอนทักษะทางด้านเทคโนโลยีที่มาแรงในระยะหลัง เพราะเนื้อหาที่แน่นในหลักสูตรต่างๆ ทำให้ได้รับความสนใจมาก สำหรับคอร์ส Hadoop ที่ Edureka มีสอนคือคอร์ส Big Data Hadoop Certification Training ครับ

4. Big Data Hadoop Certification Training

คุณสามารถดู Intro ตัวหลักของคอร์สได้จากคลิปด้านล่าง (กด Play ได้เลยครับ)

ตัวคอร์สมีความยาวทั้งหมด 30 ชั่วโมง ลักษณะการเรียนจะเป็นแบบ Live Class หรือแบบ On-demand ซึ่งแบบแรกก็คือการเรียนสดไปพร้อมกับครูผู้สอนทางออนไลน์ ถ้ามีปัญหาอะไร คุณสามารถถามได้เลยทันที ส่วนแบบ On-demand ก็จะเป็นแบบ Video แบบ Udemy ครับ

เนื้อหาที่ครอบคลุมคือ

  • แนะนำ Big Data และความท้าทายต่างๆ
  • ข้อจำกัดและการแก้ไขปัญหาเกี่ยวกับ Big Data
  • แนะนำ Hadoop และฟีเจอร์ต่างๆ ที่เกี่ยวข้อง
  • แนะนำ Hadoop Ecosystem
  • Hadoop Storage
  • Hadoop Processing: MapReduce Framework
  • Pig, Hive, HBase
  • Oozie and Hadoop Project
  • และอื่นๆ อีกมากมาย อ่านเพิ่มเติมได้ที่หน้าเว็บ

อย่างไรก็ดีปัญหาที่พบบ่อยของ Edureka คือ สำเนียงภาษาอังกฤษสำเนียงอินเดียของผู้สอนฟังยาก (แต่โดยส่วนตัวผมไม่มีปัญหาใดๆ) ซึ่ง Edureka ก็มีให้คุณเรียนฟรีครับ (คลิกลิงค์นี้แล้วไล่ลงไปที่คำว่า Watch Lesson 1 ครับ หลังจากใส่อีเมล์แล้ว คุณสามารถเริ่มเรียนได้ทันที)

จุดแข็งของคอร์สของ Edureka คือคุณจะได้รับการประเมินผล และต้องผ่านการทำ Project ที่ประยุกต์ใช้ Hadoop กับอุตสาหกรรมต่างๆ อย่างเช่น IT, การบิน, การเงิน และการท่องเที่ยวทำให้คุณมีประสบการณ์ในการใช้งาน Hadoop ที่สามารถนำไปต่อยอดได้อย่างง่ายดายครับ

นอกจากนั้นนักเรียนทุกคนจะได้เข้าถึง CloudLab หรือเป็น Hadoop Environment ที่ Edureka สร้างขึ้นเพื่อที่นักเรียนจะได้สัมผัสประสบการณ์จริง โดยไม่ต้องยุ่งยากกับการ Install ตัว Hadoop เหมือนกับคอร์สของ Udemy ครับ

ราคาคอร์ส Hadoop ของ Edureka อยู่ที่ $449 หรือ 13,500 บาท แต่คุณจะเข้าถึงเนื้อหาต่างๆ ได้อย่างตลอดชีพ ทั้งคอร์สสดหรือ Video ครับ ถ้าซื้อไปแล้วไม่พอใจ สามารถขอคืนเงินได้ภายใน 3 วัน เพราะฉะนั้นถ้าเรียนไปแล้วไม่ชอบใจ ต้องรีบคืนทันทีครับ

จริงๆ แล้วถ้าคุณสนใจสายงาน Big Data Architect และโอเคกับการเรียนสไตล์ของ Edureka การสมัครหลักสูตร Big Data Architect Masters Program จะคุ้มค่ากว่า เพราะว่าจะได้ทั้งคอร์สนี้ และคอร์สอื่นอีก 8 คอร์สในราคา $1,500 หรือ 45,000 บาท ถ้ารวมกันแล้วจะถูกกว่าซื้อเดี่ยวมากครับ

Simplilearn

Simplilearn เป็นอีกสถาบันสอนทักษะออนไลน์ชั้นนำ แต่ละคอร์สของ Simplilearn มักจะพัฒนาร่วมกับสถาบันหรือบริษัทเทคโนโลยีชั้นนำ ทำให้ตัวคอร์สมีคุณภาพสูงมาก (แต่ราคาก็สูงเช่นกัน)

5. Big Data Certification Training Course

โดยคอร์สสอน Hadoop ของ Simplilearn คือคอร์ส Big Data Certification Training Course ครับ คอร์สนี้สอนโดย Cloudera CCA Spark และ Hadoop Developer Team ทำให้รับประกันคุณภาพได้เลยครับ

อนึ่งผู้ที่จะเรียนคอร์สนี้ควรมีทักษะ Core Java และ SQL ดีระดับหนึ่งครับ แต่ถ้ายังไม่มีพื้นฐานมาเลยก็สามารถเรียนคอร์สสรุป Java ได้ฟรีครับ (มีแถมมาให้แล้ว)

ทั้งนี้เนื้อหาที่คอร์ส Hadoop ของ Simplilearn จะครอบคลุมได้แก่ Yarn, MapReduce, Pig, Give, HBase และ Apache Spark ครับ

สำหรับวิธีการเรียนของ Simplilearn จะแบ่งออกเป็น 2 แบบบ นั่นคือ Self-paced และ Blended Learning โดยราคาก็จะต่างกันด้วย

  • Self-paced – เรียนเนื้อหาและทำ Project ทุกอย่างด้วยตัวของคุณเอง ราคาอยู่ที่ $699 (21,000 บาท)
  • Blended Learning – เรียนสดกับครูผู้สอน และมีคนช่วยดูแล Project ราคาอยู่ที่ $799 (24,000 บาท)

สำหรับแบบ Self-paced จะมีเนื้อหา 10 ชั่วโมงและเรียนได้ตลอดชีพครับ ส่วนแบบ Blended Learning คือแบบ Self-paced ที่มีการเทรนโดยครูผู้สอนเพิ่มเติมเข้ามาจำนวน 48 ชั่วโมงทั้งการเรียนทั่วไปและการทำ Project แต่การเทรนนั้นไม่ได้เป็นแบบตลอดชีพ โดยจะหมดอายุในเวลา 3 เดือนครับ (แปลว่าต้องเรียนให้จบใน 3 เดือน)

โดยส่วนตัวแล้วผมมองว่าแบบ Self-paced เนื้อหาน้อยมาก และมีราคาที่สูงมากถ้าเทียบกับ Udemy และ Edureka ดังนั้นถ้าคุณสนใจจะเรียนกับ Simplilearn จริงๆ ผมแนะนำว่าควรเรียนแบบ Blended Learning ครับ

อยางไรก็ดีถ้าเรียนไปแล้วไม่พอใจ ทาง Simplilearn จะคืนเงินให้ 100% แต่ต้องภายใน 7 วันหลังจากซื้อคอร์สเท่านั้นครับ

คอร์สเรียน Hadoop แบบฟรี

หลายแพลตฟอร์มมีให้เรียน Hadoop แบบฟรีโดยไม่เสียค่าใช้จ่ายใดๆ แต่คุณภาพย่อมเทียบไม่ได้กับคอร์สที่เสียเงินเรียนครับ

ทั้งนี้รายชื่อนี้ยังไม่สมบูรณ์ ถ้ามีคอร์สฟรีที่มีคุณภาพเข้ามา ผมจะมาอัพเดตให้ในภายหลังครับ

บทความล่าสุด

Victory Tale ไม่อนุญาตให้คัดลอกบทความไปโพสที่ใดทุกกรณี การฝ่าฝืนมีโทษทางกฎหมาย

error: Content is protected !!