Data Science คืออะไร ?

“Data Science”  หรือ “วิทยาการข้อมูล”  เป็นศาสตร์ของการนำข้อมูลมาใช้ประโยชน์ผ่านวิธีการต่าง ๆ โดยการการรวบรวม จัดการ และวิเคราะห์ และนำเสนอข้อมูลขนาดใหญ่เพื่อนำข้อมูลเชิงลึกที่ได้มาใช้ประโยชน์ในการทำงานด้านธุรกิจ อุตสาหกรรม และด้านอื่น ๆ

กระบวนการทำงานของ Data Science

1.การรวบรวมข้อมูล

การรวบรวมข้อมูล (Capture)  หรือการจับข้อมูลด้วยวิธีการต่าง ๆ เช่น การรวบรวมข้อมูล (Data Acquisition) การป้อนข้อมูล (Data Entry) และการดึงข้อมูล (Data Extraction) โดยจะรวบรวมทุกข้อมูลดิบ  ( Raw Data) ทุกรูปแบบทั้งในรูปแบบที่มีโครงสร้าง กึ่งโครงสร้าง และไม่มีโครงสร้าง

2.การบำรุงรักษา

การบำรุงรักษา (Maintain) เนื่องจากข้อมูลที่รวบรวมมานั้นอาจหายไปตามเวลา จึงต้องมีการรักษาสภาพข้อมูล โดยวิธีการรักษาสภาพข้อมูลสามารถทำได้หลายวิธี เช่น การทำระบบคลังข้อมูล (Data Warehousing) เพื่อทำความสะอาดข้อมูลด้วยการตรวจสอบ แก้ไข หรือการลบ เพื่อให้รายการข้อมูลที่ไม่ถูกต้อง หรือไม่ต้องการใช้หายไปจากชุดข้อมูล และนำไปใช้ต่อได้ง่าย

3.การจัดการข้อมูล

การจัดการข้อมูล (Process) คือการจัดการกับข้อมูลมหาศาลให้อยู่ในรูปที่ต้องการ รวมถึงวิเคราะห์ว่าข้อมูลนั้น ๆ มีประโยชน์เพียงใดในการนำไปวิเคราะห์ เช่น การทำ Data Mining การทำ Data Modeling การทำ Data Integration และการสรุปข้อมูล เป็นต้น

4.การวิเคราะห์ข้อมูล

การวิเคราะห์ข้อมูล (Analyze) เป็นขั้นตอนสำคัญ สามารถทำได้ด้วยวิธีการทางวิทยาศาสตร์ โดยแบ่งออกได้เป็น 4 รูปแบบ ได้แก่ Descriptive Analytic, Diagnostic Analytic, Predictive Analytic และ Prescriptive Analytic ซึ่งอาจเป็นกระบวนการที่ทำต่อเนื่องกันหรือทำควบคู่กันไปก็ได้ เพื่อค้นหาข้อมูลเชิงลึกและนำไปใช้ประโยชน์ต่อไป

5. การนำเสนอข้อมูล

การนำเสนอข้อมูล (Communicate) เป็นขั้นตอนสุดท้ายคือการนำข้อมูลทั้งหมดที่รวบรวมและวิเคราะห์มาสรุปผลออกมาในรูปแบบที่เข้าใจง่าย ๆ  เช่น แผนภูมิ กราฟ รายงาน หรือ Data Visualization รูปแบบอื่น ๆ

จัดทำโดย : นางสาววิมลรัตน์ ศรีโยหะ (Trainee)