Data Science คืออะไร ?
“Data Science” หรือ “วิทยาการข้อมูล” เป็นศาสตร์ของการนำข้อมูลมาใช้ประโยชน์ผ่านวิธีการต่าง ๆ โดยการการรวบรวม จัดการ และวิเคราะห์ และนำเสนอข้อมูลขนาดใหญ่เพื่อนำข้อมูลเชิงลึกที่ได้มาใช้ประโยชน์ในการทำงานด้านธุรกิจ อุตสาหกรรม และด้านอื่น ๆ
กระบวนการทำงานของ Data Science
1.การรวบรวมข้อมูล
การรวบรวมข้อมูล (Capture) หรือการจับข้อมูลด้วยวิธีการต่าง ๆ เช่น การรวบรวมข้อมูล (Data Acquisition) การป้อนข้อมูล (Data Entry) และการดึงข้อมูล (Data Extraction) โดยจะรวบรวมทุกข้อมูลดิบ ( Raw Data) ทุกรูปแบบทั้งในรูปแบบที่มีโครงสร้าง กึ่งโครงสร้าง และไม่มีโครงสร้าง
2.การบำรุงรักษา
การบำรุงรักษา (Maintain) เนื่องจากข้อมูลที่รวบรวมมานั้นอาจหายไปตามเวลา จึงต้องมีการรักษาสภาพข้อมูล โดยวิธีการรักษาสภาพข้อมูลสามารถทำได้หลายวิธี เช่น การทำระบบคลังข้อมูล (Data Warehousing) เพื่อทำความสะอาดข้อมูลด้วยการตรวจสอบ แก้ไข หรือการลบ เพื่อให้รายการข้อมูลที่ไม่ถูกต้อง หรือไม่ต้องการใช้หายไปจากชุดข้อมูล และนำไปใช้ต่อได้ง่าย
3.การจัดการข้อมูล
การจัดการข้อมูล (Process) คือการจัดการกับข้อมูลมหาศาลให้อยู่ในรูปที่ต้องการ รวมถึงวิเคราะห์ว่าข้อมูลนั้น ๆ มีประโยชน์เพียงใดในการนำไปวิเคราะห์ เช่น การทำ Data Mining การทำ Data Modeling การทำ Data Integration และการสรุปข้อมูล เป็นต้น
4.การวิเคราะห์ข้อมูล
การวิเคราะห์ข้อมูล (Analyze) เป็นขั้นตอนสำคัญ สามารถทำได้ด้วยวิธีการทางวิทยาศาสตร์ โดยแบ่งออกได้เป็น 4 รูปแบบ ได้แก่ Descriptive Analytic, Diagnostic Analytic, Predictive Analytic และ Prescriptive Analytic ซึ่งอาจเป็นกระบวนการที่ทำต่อเนื่องกันหรือทำควบคู่กันไปก็ได้ เพื่อค้นหาข้อมูลเชิงลึกและนำไปใช้ประโยชน์ต่อไป
5. การนำเสนอข้อมูล
การนำเสนอข้อมูล (Communicate) เป็นขั้นตอนสุดท้ายคือการนำข้อมูลทั้งหมดที่รวบรวมและวิเคราะห์มาสรุปผลออกมาในรูปแบบที่เข้าใจง่าย ๆ เช่น แผนภูมิ กราฟ รายงาน หรือ Data Visualization รูปแบบอื่น ๆ
จัดทำโดย : นางสาววิมลรัตน์ ศรีโยหะ (Trainee)