Data Engineer Learning Path โดย Gemini
Data Engineer Learning Path โดย Gemini
เป็นระยะเวลานานที่ทิวได้ลองหาสายงานทางด้านข้อมูลที่สนใจ (รวม ๆ แล้วเกือบปี) ตอนนี้ก็ได้ตกลงปลงใจกับงานด้าน Data Engineer เพราะดูเป็นงานที่ดูสนุกที่สุดแล้วได้เล่นกับข้อมูลจำนวนมาก (Data สายอื่นก็เล่นกับข้อมูลจำนวนมากเหมือนกันนั้นแหละ)
คราวนี้ถึงเวลาที่จะต้องหา Learning PATH ให้กับตัวเองว่าจะเรียนอะไรก่อน ในบทความนี้ทิวจะแนะนำสัก 2–3 เว็บไซต์ที่ดัง ๆ กับ AI Prompt เจ้าดัง ๆ อย่าง Gemini และ Chat GPT ว่าจะแนะนำอะไรบ้างในบทบาท Data Engineering
ใน Blog นี้ทิวจะนำเสนอการสอบถามจาก Gemini ดู
ผลจาก Gemini
Learning Path สู่เส้นทางสาย Data Engineering
สายงาน Data Engineering เป็นที่ต้องการมากในยุคนี้ เส้นทางการเรียนรู้มีดังนี้ครับ
1. พื้นฐาน
- ความรู้พื้นฐานด้านคอมพิวเตอร์: เรียนรู้เกี่ยวกับโครงสร้างข้อมูล (Data Structure) และอัลกอริทึม (Algorithm) ซึ่งเป็นพื้นฐานสำคัญของการเขียนโปรแกรม
- ภาษาโปรแกรม: ภาษาที่นิยมใช้ในสายงาน Data Engineering ได้แก่ Python, SQL การเรียนรู้ภาษาเหล่านี้ เน้นการเขียนโปรแกรมเพื่อจัดการข้อมูล
- ระบบฐานข้อมูล (Database): ศึกษาประเภทของฐานข้อมูล เช่น Relational Database, NoSQL Database รวมถึงการเขียนคำสั่ง SQL เพื่อ query ดึงข้อมูล
พื้นฐานของ Data ก็คือออออ Data Structure และ SQL เมื่อก่อนในคาบเรียนทิวมักไม่สนใจการเรียน SQL เท่าไหร่ แต่โตมาแล้วเจอ SQL บ่อยมาก งานสาย Tech สิ่งที่สำคัญคือ SQL นี้แหละจะเป็นตัวเบิกทางงานทางด้าน Tech ได้ดีที่สุด เข้าใจ SQL ก็เป็นการเข้าใจการเขียน Code พื้นฐานเช่นกัน
2. เครื่องมือ
- Big Data Framework: เรียนรู้เฟรมเวิร์คสำหรับการประมวลผลข้อมูลขนาดใหญ่ เช่น Apache Spark, Hadoop ซึ่งมีประสิทธิภาพในการจัดการข้อมูลที่หลากหลาย
- Cloud Platform: ศึกษาแพลตฟอร์มคลาวด์ เช่น AWS, GCP, Azure เพราะปัจจุบันองค์กรส่วนใหญ่นำข้อมูลไปไว้บนคลาวด์
- Data Warehousing & Business Intelligence (DW/BI): เรียนรู้การออกแบบและสร้างคลังข้อมูล (Data Warehouse) เพื่อรองรับการวิเคราะห์ข้อมูล
ตัวนี้ทิวอาจจะยังเสริมอะไรไม่ได้มากนัก เนื่องจากยังไม่ได้ลงมือส่วนนี้ อารมณ์แบบค่อย ๆ เรียนไป
3. เสริมความรู้
- ระบบ version control: เรียนรู้ระบบควบคุมเวอร์ชันของโค้ด เช่น Git เพื่อติดตามการเปลี่ยนแปลงของโค้ด
- ระบบปฏิบัติการ (OS): ศึกษาเกี่ยวกับระบบปฏิบัติการ เช่น Linux เพราะเป็นระบบที่นิยมใช้ในการรันงานบน server
- Soft Skill: ฝึกฝน Communications (สื่อสาร) และ Teamwork (ทีมเวอร์ค) เพราะ Data Engineer ต้องทำงานร่วมกับทีม Data Scientist และ Analyst
ในส่วนของการเสริมความรู้ทิวแนะนำ Git และ พวกคำสั่งในระบบ Linux พื้นฐาน และอาจต้องฝึกการสื่อสารด้วยนิดนึง เนื่องจากเราต้องมีทักษะอธิบายภาษา Data เป็นภาษาคนทั่วไปให้สามารถเข้าใจซึ่งสำคัญในระดับนึง
แหล่งเรียนรู้
- Online Course มีเว็บไซต์ เช่น Coursera, edX, Udemy ที่เปิดสอนคอร์สด้าน Data Engineering ทั้งแบบเสียค่าใช้จ่ายและฟรี
- บทความ เว็บไซต์ เช่น DataCamp, Towards Data Science มีบทความเกี่ยวกับ Data Engineering ให้ศึกษาฟรี
- หนังสือ มีหนังสือด้าน Data Engineering เช่น “Data Engineering: Building Scalable Analytics Systems” โดย Martin Kleppmann
ตัวแหล่งเรียรู้ที่ทาง Gemini แนะนำมา ทิวเคยเรียนแค่ DataCamp เอง เนื่องจาก DataCamp นั้นรู้สึกเรียนสนุก คลิปไม่ยาวหน้าเบื่อ (ทิวแอบสมาธิสั้น เด็กยุคนี้เป็นหลายคน)
เพิ่มเติม
- ควบคู่กับการเรียนรู้ ลองฝึกฝีมือจริงด้วย Project เพื่อประเมินความเข้าใจและสร้างผลงานตัวอย่าง
เส้นทางสู่สายงาน Data Engineering อาจใช้เวลา แต่ถ้าตั้งใจเรียนรู้และฝึกฝีมืออย่างต่อเนื่อง ก็จะประสบความสำเร็จได้ครับ
อันนี้ก็เป็นการทิ้งทวนครับ ไม่แน่ใจว่า Gemini เอามาจากไหนหรือคิดเอง 555
เส้นทางสู่สายงาน Data Engineering
โดยหลัก Gemini จะแบ่งเป็น 3 หมวดความรู้หลัก คือ พื้นฐาน , เครื่องมือ และเสริมความรู้ พร้อมกับแนะนำแหล่งเรียนรู้ให้เราเพิ่มเติมครับ ทิวได้แปะลิ้งตัว Prompt ที่เขียนไปด้วยครับ