097-113-5975
admin@datalentteam.co

Data Quality practice with Apache airflow

วันที่อบรม: วันที่ 25 กรกฎาคม 2569   | เวลา 9:00-16:00 น.

ราคา 8,900 บาท ลงทะเบียนก่อน 14 วันลด 10 % เหลือเพียง  8,010  บาท

📍 : Avani Ratchada Bangkok Hotel (MRT พระราม9)

วิทยากร : ว่าที่ร้อยตรี ธีรพัฒน์ กันสดับ

หน่วยพัฒนาปัญญาประดิษฐ์ กองเทคโนโลยีสารสนเทศ มหาวิทยาลัยมหิดล

หลักการและเหตุผล

ในยุคปัจจุบันที่ทุกองค์กรขับเคลื่อนด้วยข้อมูล (Data-Driven Organization) การสร้าง Data Pipeline ที่มีประสิทธิภาพไม่ได้จำกัดอยู่เพียงแค่การย้ายข้อมูลจากต้นทางไปยังปลายทางเท่านั้น แต่หัวใจสำคัญที่กำหนดความสำเร็จของโครงการ Data Analytics และ AI คือ “คุณภาพของข้อมูล” (Data Quality) หากข้อมูลที่ไหลเข้าสู่ระบบไม่มีการตรวจสอบ หรือมีข้อผิดพลาด (Garbage In, Garbage Out) จะส่งผลกระทบโดยตรงต่อการตัดสินใจทางธุรกิจและการทำงานของโมเดลต่าง ๆ ดังนั้นการนำเครื่องมือด้าน Workflow Orchestration ระดับโลกอย่าง Apache Airflow มาใช้ร่วมกับการวางระบบตรวจสอบคุณภาพข้อมูล จึงเป็นทักษะที่สำคัญอย่างยิ่งสำหรับ Data Engineer และ Data Architect

วัตถุประสงค์

  • เพื่อให้เข้าใจพื้นฐานและสถาปัตยกรรม: ผู้เรียนเข้าใจหลักการทำงานของ Apache Airflow และการติดตั้งใช้งาน (Deploy)
  • เพื่อสร้างทักษะการเขียนโปรแกรมที่จำเป็น: ปรับพื้นฐาน Python และการใช้เครื่องมือ VSCode สำหรับงาน Data Pipeline
  • เพื่อฝึกปฏิบัติการตรวจสอบคุณภาพข้อมูล (Workshop): ผู้เรียนจะได้ลงมือทำ Workshop จริง ตั้งแต่การตรวจสอบความถูกต้องของไฟล์, การตรวจสอบรหัสลูกค้า (ID Validation) ไปจนถึงการตรวจจับความผิดปกติของข้อมูลในเชิงสถิติ (Statistical Anomaly Detection)
  • เพื่อป้องกันปัญหาในระยะยาว: เรียนรู้วิธีรับมือกับ Schema Drift (การเปลี่ยนแปลงของโครงสร้างข้อมูล) เพื่อให้ Pipeline มีความยืดหยุ่นและเสถียร

ความรู้พื้นฐาน

ผู้เรียนควรมีพื้นฐานความเข้าใจเรื่อง Data Quality เช่น ความสำคัญของคุณภาพข้อมูล มิติของ Data Quality รวมถึงปัญหาคุณภาพข้อมูลที่พบบ่อย และควรใช้ SQL พื้นฐานในการตรวจสอบข้อมูลได้

ลงทะเบียนได้ทันทีคลิก  [https://forms.gle/bGkYV7PeeHqaeFSA7]

กำหนดการ

เวลาหัวข้อเนื้อหา
9.00 – 10.30Data Pipeline Apache Airflowปัญหาที่ Airflow แก้ไขได้Apache Airflow คืออะไร?สถาปัตยกรรมหลักของ Airflow
10.30-10.45Break
10.45 – 11.00Data Pipeline Apache Airflowฟีเจอร์เด่นของ Apache Airflowการ Deploy Apache Airflowการกำหนดค่า Default Arguments ใน Apache Airflow DAG
11.00-12.00Tool & Python Introductionพื้นฐาน Pythonแนะนำเครื่องมือ VSCode
12.00 – 13.00Lunch
13.00 – 14.30WorkshopHello from AirflowCheck file errorProject code validationpersonal data validation
14.30-14.45Break
13.00 – 16.00WorkshopCheck files in the ZIP.Check customer_ID in Order tableSchema Drift DetectionStatistical Anomaly Detection

*กำหนดการอาจมีการเปลี่ยนแปลงตามความเหมาะสม

Read more

Python for AI Beginner & AI Assisted Coding

วันที่อบรม: วันที่ 6 – 7 มิถุนายน 2569   | เวลา 9:00-16:00 น.

ราคา 6,900 บาท ลงทะเบียนก่อน 14 วันลด 10 % เหลือเพียง  6,210  บาท

📍 : Online Training

วิทยากร : ว่าที่ร้อยตรี ธีรพัฒน์ กันสดับ

หน่วยพัฒนาปัญญาประดิษฐ์ กองเทคโนโลยีสารสนเทศ มหาวิทยาลัยมหิดล

หลักการและเหตุผล

ในยุคปัจจุบันที่ปัญญาประดิษฐ์ (Artificial Intelligence) และวิทยาการข้อมูล (Data Science) เข้ามามีบทบาทสำคัญในการขับเคลื่อนองค์กรและอุตสาหกรรม ภาษา Python ได้กลายเป็นทักษะพื้นฐานที่สำคัญที่สุดเนื่องจากเป็นภาษาที่ยืดหยุ่น มีห้องสมุดซอฟต์แวร์ (Packages) ที่ครอบคลุม และเป็นรากฐานของการพัฒนา AI

             อย่างไรก็ตาม การเรียนรู้การเขียนโปรแกรมแบบดั้งเดิมมักประสบปัญหาเรื่องความซับซ้อนและระยะเวลาในการฝึกฝน หลักสูตรนี้จึงถูกออกแบบมาเพื่อ “ทลายกำแพงการเรียนรู้” โดยการนำเทคนิค Prompt Engineering และ AI Assisted Coding เข้ามาประยุกต์ใช้ ช่วยให้ผู้เรียนที่ สามารถเขียนโค้ดได้อย่างมีประสิทธิภาพ เข้าใจโครงสร้างภาษา และสามารถใช้ AI เป็นคู่คิดในการแก้ปัญหาและสร้างสรรค์นวัตกรรมด้านข้อมูลได้อย่างรวดเร็ว

วัตถุประสงค์

  • เพื่อให้ผู้เรียนสามารถเขียนโปรแกรม Python เบื้องต้นเพื่อจัดการข้อมูลได้ด้วยตนเอง
  • เพื่อให้ผู้เรียนสามารถใช้ AI ช่วยในการเขียนโค้ดและแก้ไขข้อผิดพลาด (Debug) ได้อย่างเชี่ยวชาญ
  • เพื่อให้ผู้เรียนสามารถเปลี่ยนข้อมูลดิบ (Raw Data) ให้กลายเป็นภาพที่เข้าใจง่าย (Insights) เพื่อใช้ในการตัดสินใจ
  • เพื่อให้ผู้เรียนมีพื้นฐานที่แข็งแกร่งพร้อมที่จะต่อยอดไปสู่การพัฒนา AI หรือ Model Machine Learning ในระดับสูงต่อไป

ความรู้พื้นฐาน

ผู้เข้าอบรมไม่จำเป็นต้องมีพื้นฐานด้านการเขียนโปรแกรม โดยควรมีความเข้าใจเบื้องต้นเกี่ยวกับการใช้งาน AI และแนวคิดของ Prompt Engineering เพื่อให้สามารถเรียนรู้และประยุกต์ใช้งานได้อย่างมีประสิทธิภาพ

ลงทะเบียน

ได้ทันทีคลิก  [https://shorturl.asia/279tc]

กำหนดการ

เวลาหัวข้อ
วันที่ 1
9.00 – 10.30Introduction to Data ScienceIntroduction to Python and GoogleCo-LabPython PackagesPython VariablesDescriptive Statistics Measurement
10.30-10.45Break
10.45 – 12.00Advanced Data TypesControl Flow
12:00 – 13:00Lunch
13.00 – 14.30Data Types and ConversionData Importing and Visualization
14.30-14.45Break
14.45 – 16.00Introduction to Data VisualizationMachine Learning and Data Science Overview
เวลาหัวข้อ
วันที่ 2
9.00 – 10.30: Missing values and Outlier handling
10.30-10.45Break
10.45 – 12.00Single Chart » Line chart » Bar chart
12:00 – 13:00Lunch
13.00 – 14.30» Pie chart » Scatter diagram
14.30-14.45Break
14.45 – 16.00Interactive diagram Geolocation Visualization

*กำหนดการอาจมีการเปลี่ยนแปลงตามความเหมาะสม

Read more