3 คอร์สสอน Big Data ออนไลน์สำหรับใครที่อยากจัดการข้อมูลขนาดยักษ์

Big Data คือศาสตร์ที่ศึกษาและค้นคว้าวิธีการจัดการฐานข้อมูลขนาดยักษ์ที่เกินกำลัง data-processing software ทั่วไป ทั้งนี้ฐานข้อมูลเหล่านี้มักจะใหญ่เกินไป ใช้เวลามากเกินไป ทำให้ไม่เกิดคุณค่าในการศึกษาด้วยการใช้ software แบบเดิมๆ

อย่างไรก็ดีในปัจจุบันเทคโนโลยีในส่วนของ data analytics ได้ก้าวหน้าไปมาก ทำให้เราสามารถวิเคราะห์ข้อมูลเหล่านี้ (data analysis) ได้อย่างมีประสิทธิภาพมากขึ้นอย่างมีนัยสำคัญ การวิเคราะห์ฐานข้อมูลอันมหาศาลเพื่อสรรหาความเชื่อมโยงระหว่างกันและนำมาใช้ประโยชน์จึงไม่ใช่เรื่องที่เป็นไปไม่ได้อีกต่อไป

ความต้องการการวิเคราะห์ข้อมูลเหล่านี้มีอยู่ในทุกอุตสาหกรรม หรือเรียกได้ว่าทุกบริษัทเลยก็ว่าได้ เพราะทุกแห่งล้วนแต่ต้องการวิเคราะห์ข้อมูลที่มีอยู่ในเชิงสถิติเพื่อที่จะตัดสินใจทางด้านธุรกิจให้ดียิ่งขึ้น

ดังนั้นไม่ต้องสงสัยเลยว่าอาชีพที่เกี่ยวข้องกับ Big Data อย่างเช่น Big Data Engineer จึงเป็นที่ต้องการอย่างมากของบริษัท พวกเขาจึงได้รับค่าตอบแทนที่สูงไปด้วย และมีแนวโน้มว่าจะไปได้อีกไกลในอนาคต

ในโพสนี้ผมจะมาแนะนำคอร์สสอน Big Data ที่น่าสนใจ จะมีคอร์สไหนบ้าง เราไปดูกันเลยครับ

ข้อควรทราบ:

  • ราคาและเงื่อนไขของแต่ละคอร์สเรียนมีโอกาสที่จะเปลี่ยนไปได้ โปรดตรวจสอบอีกครั้งหนึ่งกับทางผู้ให้บริการเพื่อความชัดเจน
  • ในการเรียนบางคอร์ส คุณอาจจะต้องมีพื้นฐาน Data Science, Python รวมไปถึง Machine Learning มาก่อน อย่างไรก็ดีบางคอร์สก็จะไม่จำเป็นแต่อย่างใด ในส่วนนี้ผมจะระบุไว้ในแต่ละคอร์สที่ผมแนะนำครับ
  • สำหรับการเรียน Big Data ออนไลน์ สิ่งที่คุณจำเป็นต้องมีพร้อมก็คือ Hardware ที่พร้อมสำหรับการเรียนครับ ในส่วนนี้ผมจะระบุไว้อย่างละเอียดในแต่ละคอร์สเช่นกัน

Coursera

คอร์สที่ 1-2 อยู่ในแพลตฟอร์มของ Coursera

แพลตฟอร์มแรกที่ผมจะกล่าวถึงก็คือ Coursera ซึ่งเป็นแหล่งรวมคอร์สคุณภาพเยี่ยมที่สอนโดยมหาวิทยาลัยจากนานาประเทศ (แต่เน้นสหรัฐอเมริกา) การเรียนกับ Coursera จะมีความเป็นทางการ และมีความเป็นระเบียบแบบแผนอย่างมาก  

ผู้สอนใน Coursera จะเป็นคณาจารย์ที่มีชื่อเสียง (บางคนอยู่ในระดับโลก) ภายในคอร์สคุณจะได้ทรัพยากรมากมายไม่ว่าจะเป็น lecture ให้เรียน, เอกสารให้อ่าน รวมไปถึงการประเมินผลและการทำโปรเจคอันครบถ้วน นอกจากนี้เมื่อเรียนจบยังจะได้ประกาศนียบัตรอีกด้วย 

ทั้งนี้รูปแบบการเรียนใน Coursera จะเป็นแบบคอร์สเดี่ยวหรือแบบหลักสูตร ซึ่งในส่วนของคอร์สสอน Big Data ที่ผมจะแนะนำนั้นเป็นแบบหลักสูตรทั้งหมดครับ ภายในหลักสูตรจะมีคอร์สย่อยหลายคอร์สที่จะช่วยพัฒนาทักษะในแต่ละด้านที่ต่างกัน หรือบางทีจะช่วยเสริมกันและกันครับ  

ค่าเรียนในหลักสูตรของ Coursera จะใช้ระบบสมาชิกรายเดือนทั้งหมดจนกว่าจะเรียนจบ นั่นหมายความว่าคุณไม่ควรจะดองคอร์สครับ คุณควรจะเรียนให้จบในเวลาที่ผู้สอนแนะนำจะดีที่สุด  

1. Big Data Specialization

หลักสูตรนี้จะสอนให้คุณสรรหาประโยชน์จาก Datasets ขนาดยักษ์ ผ่านการสอนวิธีการทาง Big Data ต่างๆ ตัวหลักสูตรจะมีคอร์สย่อยทั้งหมด 6 คอร์ส ให้คุณได้เรียนครับ ตัวคอร์สจัดทำโดย UC San Diego มหาวิทยาลัยชื่อดังแห่งรัฐแคลิฟอร์เนีย

สำหรับการเรียนคอร์สนี้ คุณไม่จำเป็นต้องมีพื้นฐานใดๆ ทั้งสิ้น ถ้าสนใจอยากจะเรียนก็เรียนได้ทันที โดยเนื้อหาที่จะสอนใน 6 คอร์สย่อยประกอบด้วย  

  1. Introduction to Big Data – แนะนำพื้นฐานของ Big Data ตั้งแต่โครงสร้าง ลักษณะ ประโยชน์ ปัญหา รวมไปถึงแนะนำระบบที่เกี่ยวข้องอย่างเช่น Apache Hadoop
  2. Big Data Modeling and Management Systems – แนะนำเครื่องมือและสอนวิธีการจัดการ Big Data ที่เหมาะสมกับแต่ละ genre ที่ต่างกัน รวมไปถึง data elements ที่ปรากฏอยู่ในชีวิตประจำวันของคุณ
  3. Big Data Integration and Processing – คอร์สนี้จะสอนวิธีการดึงข้อมูลจาก database, การจัดการปัญหาทาง Big Data โดยใช้ Data Integration นอกจากนี้คุณยังจะลองใช้ Hadoop และ Spark ในการทำ Big Data Integration ด้วย
  4. Machine Learning with Big Data – สอนวิธีใช้เทคนิคทาง machine learning ในการค้นคว้าและเตรียมข้อมูลสำหรับการทำ modeling นอกจากนี้คุณยังจะได้วิเคราะห์และจัดการกับปัญหาต่างๆ โดยใช้ Spark
  5. Graph Analytics for Big Data – เจาะลึกการทำ Graph Analytics เพื่อจัดการข้อมูลแบบ graph-structured คุณจะได้เรียนรู้วิธีการสร้างโมเดลเพื่อจำลองปัญหาใน graph database
  6. Capstone Project – นำความรู้จาก 5 คอร์สย่อยด้านบนมาทำเป็นโปรเจค โดยคุณจะได้ลองใช้เทคนิคต่างๆ ที่เรียนไปในการวิเคราะห์และจำลองฐานข้อมูลขนาดใหญ่จากผู้เล่นเกมชื่อ “Catch the Pink Flamingo”

สำหรับคอร์สนี้เป็นคอร์สเริ่มต้นที่ดีเยี่ยมสำหรับมือใหม่ที่สนใจจะเรียนรู้เกี่ยวกับ Big Data ทั้งนี้ทางมหาวิทยาลัยแนะนำว่าคุณควรจะใช้เวลาเรียน 3 ชั่วโมงต่อสัปดาห์ ซึ่งจะใช้เวลาเรียนทั้งหมดประมาณ 8 เดือนครับ  

ก่อนที่จะเรียนคุณจะต้องมี Hardware ต่อไปนี้เป็นอย่างต่ำ 

  1. Quad Core Processor, 64-bit 
  2. 8 GB RAM 
  3. 20 GB Free Disk Space  

นอกจากนี้ความเร็วของอินเตอร์เน็ตก็สำคัญมาก เพราะคุณจะต้องดาวน์โหลดไฟล์ข้อมูลที่ใหญ่ถึง 4 GB ครับ ดังนั้นเรียนโดยใช้ Wi-Fi เป็นทางเลือกที่ดีที่สุด  

ในส่วนของค่าเรียนจะอยู่ที่ $49 หรือประมาณ 1,470 บาทต่อเดือน ถ้าคุณใช้เวลาเรียน 8 เดือนตามคำแนะนำ ค่าเรียนแบบเบ็ดเสร็จจะอยู่ที่ 11,760 บาทครับ  

เนื่องจากหลักสูตรนี้ยาวและมีค่าเรียนสูง ผมแนะนำให้พิจารณา Coursera Plus (รายละเอียดอยู่ด้านล่าง) ประกอบไปด้วยครับ  

2. Modern Big Data Analysis with SQL Specialization

หลักสูตรชั้นยอดที่จัดทำโดยบริษัทซอฟต์แวร์สาย data platform อย่าง Cloudera ดังนั้นแทบจะการันตีเรื่องคุณภาพได้เลยครับว่ายอดเยี่ยมอย่างแน่นอน  

ในหลักสูตรจะสอนการทำ Data Analysis สำหรับ Big Data โดยใช้ SQL ทั้งนี้คุณไม่จำเป็นต้องเรียน SQL มาก่อน หรือว่ามีพื้นฐานใดๆ ทั้งสิ้นครับ 

คอร์สย่อยในหลักสูตรจะมีทั้งหมด 3 คอร์สด้วยกัน แต่ละคอร์สจะสอนความรู้ดังต่อไปนี้  

  1. Foundations for Big Data Analysis with SQL – คอร์สนี้จะอธิบายภาพใหญ่ของการใช้งาน SQL ในการจัดการ Big Data คุณจะได้เข้าใจโครงสร้างการทำงานของ SQL รวมไปถึงได้ลองสำรวจตัวฐานข้อมูลที่คุณจะได้ใช้งานในลำดับต่อไป
  2. Analyzing Big Data with SQL – คอร์สย่อยนี้เป็นแกนหลักของหลักสูตร เพราะคุณจะได้ลองใช้งาน Big Data Engines อย่าง Apache Hive และ Apache Impala นอกจากนี้คุณจะยังได้เข้าใจความแตกต่างระหว่าง MySQL และ PostgreSQL อีกด้วย
  3. Managing Big Data in Clusters and Cloud Storage – คอร์สสุดท้ายในหลักสูตรที่จะอธิบายวิธีการจัดการฐานข้อมูลขนาดยักษ์ ไม่ว่าจะเป็นการโหลดข้อมูลเข้าไปใน clusters หรือ cloud storage รวมไปถึงการเลือก data types, storage systems และ file formats ที่เหมาะสม

โดยรวมแล้วคอร์สนี้จะสอนอีก approach ที่น่าสนใจในการวิเคราะห์ big data นั่นก็คือการใช้ SQL ซึ่งเนื้อหาจะไม่ซ้ำกับคอร์สแรกเลยครับ การเรียนควบคู่กันจึงสามารถทำได้อย่างแน่นอน  

นอกจากนี้ทาง Cloudera ยังแจ้งว่าคุณสามารถเรียนคอร์สนี้เพื่อเตรียมสอบวุฒิบัตรอย่าง Cloudera Certified Associate (CCA) Data Analyst ได้ด้วยครับ  

อย่างไรก็ดีในการเรียนคุณจะต้อง install Virtual Machine ด้วยเช่นกัน ซึ่งคุณจะต้องเตรียม Hardware ดังต่อไปนี้ 

  1. 64-bit Operating System 
  2. 8 GB Ram  
  3. 25 GB Free Disk Space  
  4. เปิดใช้งาน Intel VT-x หรือ AMD-V Virtualization Support  

สำหรับค่าเรียนจะอยู่ที่ $49 หรือประมาณ 1,470 บาทต่อเดือน โดยทาง Cloudera แนะนำว่าคุณควรจะเรียน 3 ชั่วโมงต่อสัปดาห์เป็นเวลา 4 เดือน ดังนั้นค่าเรียนทั้งหมดโดยประมาณจะอยู่ที่ 5,880 บาทครับ

Coursera Plus

ทางเลือกหนึ่งในการประหยัดค่าใช้จ่ายในการเรียนกับ Coursera ก็คือการสมัคร Coursera Plus ครับ เพราะในราคา $399 ต่อปี หรือเฉลี่ยแล้ว $33.25 ต่อเดือน (ประมาณ 1,000 บาท) คุณจะเข้าถึงหลักสูตรและคอร์สทั้งหมดกว่า 3,000 คอร์สใน Coursera ซึ่งรวมหลักสูตรทั้งหมดที่ผมกล่าวถึงในโพสนี้ด้วย

ถ้าเปรียบกับการจ่ายรายคอร์สแล้ว Coursera Plus จะเหนือกว่าในด้านต่อไปนี้ 

  1. ค่าใช้จ่ายเฉลี่ยรายเดือนถูกกว่าเพราะแค่ $33.25 เทียบกับค่าใช้จ่ายรายเดือนทั่วไปของหลักสูตรใน Coursera ที่อยู่ที่ $39-$79 ต่อเดือน
  2. คุณมีอิสระในการเรียนถึง 1 ปีด้วยกัน โดยที่ไม่ต้องรีบเรียนให้จบเพื่อที่จะไม่ต้องจ่ายค่าใช้จ่ายเพิ่ม
  3. คุณสามารถเรียนคอร์สได้มากมายใน Coursera เหมาะมากสำหรับใครที่ต้องการเก็บ Certificate ต่างๆ จากมหาวิทยาลัยหรือบริษัทระดับโลก

Edureka

คอร์สที่ 3 อยู่ในแพลตฟอร์มของ Edureka

Edureka เป็นทางเลือกที่น่าสนใจมากสำหรับการเรียนความรู้ทางด้านเทคโนโลยี จุดเด่นสำคัญของแพลตฟอร์มนี้อยู่ตรงที่คอร์สจะเป็นรูปแบบสอนสดเกือบทั้งหมด ทำให้คุณสอบถามสิ่งที่คุณสงสัยได้ในทันที นอกจากนี้เนื้อหาก็จะสดใหม่ด้วยครับ  

การเรียนกับ Edureka นั้นจะเป็นรูปแบบสบายๆ เพราะคุณจะซื้อคอร์สไปตลอดชีพ ทำให้คุณสามารถกลับมาเรียนเมื่อไรก็ได้ ส่วนคอร์สสดนั้นถ้าคุณไม่ได้เข้าเรียนก็สามารถเรียนย้อนได้ในแพลตฟอร์ม หรือว่าเข้าคอร์สสดใน batch หน้าก็ได้เช่นกันครับ  

เราไปดูกันดีกว่าคอร์สสอน Big Data ของ Edureka มีคอร์สไหนบ้าง  

3. Big Data Architect Masters Program

หลักสูตรนี้เป็นหลักสูตรสอน Big Data ระดับ grand scale เพราะอัดแน่นด้วยเนื้อหามากกว่า 200 ชั่วโมงด้วยกันจากคอร์สย่อยมากกว่า 9 คอร์สครับ ซึ่งเน้นไปที่การให้ความรู้เกี่ยวกับเครื่องมือและระบบที่ผู้เชี่ยวชาญในสายงาน Big Data ใช้จริงในปัจจุบัน อย่างเช่น Scala, Spark, MapReduce เป็นต้น

คอร์สย่อยทั้ง 9 จะประกอบด้วย  

  1. Java Essentials (15 ชั่วโมง) – คอร์สแบบ Self Paced (ไม่สอนสด) ที่จะแนะนำพื้นฐานของ Java Programming ให้คุณเข้าใจอย่างละเอียด คอร์สนี้มีความยาว 15 ชั่วโมงครับ
  2. Big Data Hadoop Certification Training (30 ชั่วโมง) – คอร์สสอนการใช้งาน Apache Hadoop และ Ecosystem Tools อย่างเช่น YARN, Pig, Hive หรือ MapReduce นอกจากนี้ภายในคอร์สคุณจะได้ศึกษา Case Studies ที่มาจากอุตสาหกรรมต่างๆ มากมายครับ
  3. Apache Spark and Scala Certification Training (30 ชั่วโมง)- คอร์สนี้จะสอนเจาะลึกในส่วนของ Spark และ Ecosystem ที่เกี่ยวข้องอาทิเช่น Spark SQL, Spark RDD, Spark MLlib รวมไปถึง Scala Programming ด้วยครับ ตัวคอร์สนี้สามารถใช้ติวเข้มสำหรับการสอบ CCA 175 ของ Cloudera ได้ด้วยเช่นกัน
  4. Apache Cassandra Certification Training (30 ชั่วโมง) – ในคอร์สนี้คุณจะได้เรียนรู้วิธีการใช้งาน Apache Cassandra (ระบบ NoSQL Database Management ที่ทำหน้าที่จัดการข้อมูลผ่านหลาย server) และฟีเจอร์ต่างๆ อาทิเช่น Cassandra Data Model รวมไปถึง integration กับ Hadoop และ Spark
  5. Talend for Data Integration and Big Data (30 ชั่วโมง) – คอร์สนี้จะสอนการใช้งาน Talend Open Studio ที่ช่วยในการทำ Big Data Integration ให้ง่ายขึ้น
  6. Apache Kafka Certification Training (15 ชั่วโมง) – คอร์สที่จะแนะนำให้คุณรู้จักวิธีการใช้งาน Apache Kafka (หนึ่งใน stream-processing software platform) ตั้งแต่โครงสร้าง ไปจนถึงการจัดการ Kafka Cluster, Producer, Consumer, Monitoring ไม่เพียงเท่านั้นคุณจะได้เรียนรู้วิธีการ Integration กับ Apache Framework อื่นอย่างเช่น Hadoop และ Spark ด้วยครับ

คอร์สทั้ง 6 ด้านบนนี้จะเป็นคอร์สหลักของหลักสูตร โดยคอร์สที่ 2-5 จะเป็นแบบสอนสด ส่วนคอร์สแรกคอร์สเดียวที่จะเป็นแบบ Self-paced หรือเรียนด้วยตนเองครับ นอกจากนี้ Edureka ยังให้คุณเรียนได้อีก 3 คอร์สด้วยกัน โดยทุกคอร์สต่อไปจะเป็นแบบ Self-paced ทั้งหมด คอร์สเหล่านี้ได้แก่

  • Apache Storm Certification Training – เรียนคอนเซปต์การใช้งานของ Apache Storm รวมไปถึงโครงสร้างต่างๆ และ components อย่าง Spouts และ Bolts เช่นเดียวกับการใช้จริงในบริษัทและธุรกิจต่างๆ อย่างเช่น real-time analytics ครับ
  • MongoDB Training and Certification – คอร์สนี้จะสอนให้คุณใช้งาน database ยุคใหม่อย่าง MongoDB ในการเก็บรักษาและจัดการข้อมูล
  • MapReduce Design Patterns Certification – คอร์สนี้จะเจาะลึก MapReduce และ Design Patterns ต่างๆ รวมไปถึงโครงสร้างและรูปแบบต่างๆ ของ Summarization Patterns

นอกจากเนื้อหาเหล่านี้แล้ว คุณจะได้รับการประเมินผล และทำโปรเจคอย่างมากมายที่จะช่วยให้คุณพัฒนาทักษะ Big Data ที่นำไปใช้จริงได้ต่อไปครับ  

อย่างไรก็ดีนักเรียนบางคนเคยมีปัญหากับสำเนียงของครูผู้สอนของ Edureka ผมแนะนำให้ลองเรียนดูคร่าวๆ จากลิงค์ด้านล่าง ถ้าคุณไม่มีปัญหาอะไรถึงจะพิจารณาสมัครครับ 

สำหรับค่าเรียนหลักสูตรนี้ทั้งหลักสูตรจะอยู่ที่ $1,499 หรือประมาณ 44,970 บาท แต่ Edureka มีตัวเลือก Enroll now Pay Later หรือว่าเรียนก่อนแล้วค่อยจ่ายเงินสำหรับหลักสูตรนี้ด้วยครับ ดังนั้นถือว่าสะดวกสบายมากเลยทีเดียว

คอร์สสอน Big Data แบบรายทักษะ

สำหรับใครที่ต้องการจะพัฒนาทักษะที่เกี่ยวข้องกับ Big Data เพิ่มเติม ผมแนะนำให้ลองเรียนคอร์สในโพสเหล่านี้ครับ

  • Hadoop – Software Utilities ที่เป็นหัวใจสำคัญของ Big Data เลยก็วาได้
  • Scala and Apache Spark – ภาษาและ framework ที่สำคัญสำหรับ Big Data Analytics

error: Content is protected !!