เมื่อพูดถึง Data Skills แล้ว หลายๆคน น่าจะเคยค้นหาดูว่า ถ้าอยากทำงานสาย Data เช่น Data Analyst หรือ Data Analytics แล้ว เราจำเป็นต้องมี Skills อะไรบ้าง ซึ่งส่วนมากน่าจะได้คำตอบในเชิง Technical Skills ต่างๆ เช่น SQL, Python, R, BI Tools, PowerBI, Tableau, SAS, Statistics, Data Visualization และอื่นๆ
วันนี้เลยขอนำเสนออีกมุมมองนึงในการแบ่ง Skill สำหรับสายงาน Data Analyst / Analytics ด้วยการแบ่งตามเนื้องาน เผื่อจะเป็นประโยชน์กับคนที่สนใจงานสายนี้ให้เห็นภาพมากขึ้นครับ
Table of Contents
1. การวิเคราะห์และสร้างรายงาน (Reporting, Analysis, and Insight)
เป็นสิ่งที่ทั้งคนจ้างและคนทำ น่าจะคาดหวังว่าจะได้ทำมากที่สุด โดยเฉพาะการหา Actionable Insight เพื่อให้สามารถนำไปใช้ต่อยอดได้ ซึ่ง Skills ที่ต้องใช้ในงานส่วนนี้ โดยมากแล้วก็จะเป็นการทำความเข้าใจ Context ของ Data หรือการตั้งคำถามในมุมต่างๆ เพื่อตั้งสมมติฐาน จากนั้นก็ทำ Data Wrangling เพื่อจัดการข้อมูลให้อยู่ในรูปแบบที่นำไปใช้วิเคราะห์ต่อได้ ก่อนจะทำการวิเคราะห์ด้วยเทคนิคต่างๆ เช่น การทำ Data Visualization เพื่อหา Insight ต่อ ซึ่ง Skills ที่สำคัญก็คือ Data Interpretation และ Sense of Numbers ที่เราจะสามารถบอกได้ว่า ข้อมูลหรือตัวเลขที่เราได้มา ผลลัพธ์ถือว่าดีหรือไม่ดี และตัวเลขพวกนี้กำลังบอกอะไรกับเราบ้าง
2. การทำระบบจัดการข้อมูลอัตโนมัติ (Automation)
อาจจะเป็นงานส่วนที่หลายๆ คน ไม่ได้คาดหวังว่าจะได้ทำ หรืออยากทำ และ ผู้บริหารหรือ User ก็อาจไม่ได้คิดว่าจะเป็นต้องทำ แต่จริงๆ แล้ว เป็นงานส่วนที่สำคัญมากๆ เพราะจะช่วยให้การจัดการข้อมูลเพื่อไปทำข้อ 1 นั้น ง่าย สะดวก รวดเร็วขึ้นในภายหลัง แม้อาจจะงานหนักตอนแรกก็ตาม
ซึ่งการทำ Automation นี้ อาจจะไม่ได้เต็มสตรีมแบบ Data Engineer แต่อย่างน้อย การค่อยๆ ปรับแต่ละขั้นตอนที่ Manual ใน Pipeline, Process ให้ Automate มากขึ้น ก็ถือว่ามาส่วนช่วยในการทำงานได้ เช่น
– เปลี่ยนจากสูตรคำนวณทั่วไปใน Excel ไปใช้ Pivot Table
– เปลี่ยนจากการกรอกข้อมูลใน Excel ไปใช้ระบบรับส่งข้อมูลอัตโนมัติ
– เปลี่ยนจากการประมวลผลข้อมูลด้วย Excel ไปใช้ SQL, Python, R
– การต่อ SQL เข้าไปใช้ BI Tools เพื่ออัพเดตข้อมูลและกราฟ
เพื่อที่เราจะได้ประหยัดเวลาและเพิ่มความยืดหยุ่น ในการทำข้อแรก ซึ่งเป็นการสร้าง Business Value กันแบบเน้นๆ โดยไม่เสียเวลากับขั้นตอน Manual ต่างๆ มากไป
อย่างไรก็ตามแต่ หลายครั้งเรามักถูกสั่งงานโดยไม่มีเครื่องมือ หรือ โดนสั่งทำ Ad-Hoc ที่ระบบไม่สามารถ Automate ได้เต็มที่ เราก็ควรจะเข้าใจการทำ Data Wrangling แบบ Manual เอาไว้บ้าง เพราะยังไงก็ได้ใช้แน่ๆ
3. การจัดการคุณภาพของข้อมูล (Data Quality)
การจัดการคุณภาพของข้อมูล ถือเป็นปัจจัยที่สำคัญมากๆ ในการวิเคราะห์ข้อมูล และ Data ที่ไม่มีคุณภาพ ถือเป็นอุปสรรคอันยิ่งใหญ่ที่สุดของข้อ 1,2 และเป็นงานที่หลายครั้งจำเป็นที่สุด และก็เป็นงานที่หลายคนเกลียดมากที่สุดด้วย เพราะเป็นงานที่ค่อนข้างถึก และในหลายๆ ครั้ง ผู้บริหารหรือ User ไม่ค่อยเห็นคุณค่าพอที่จะทุ่มทรัพยากรมาจัดการตรงนี้
ทำให้การแก้ปัญหาเรื่อง Data Quality ตกมาอยู่ที่การทำ Data Cleaning เสียมาก แต่จริงๆ แล้ว ปัญหาเรื่อง Data Quality ควรจะแก้โดยการออกแบบระบบ Input ข้อมูลให้ดีแต่แรก เพราะการแก้ปัญหาเหล่านี้ทีหลังนั้น อาจทำได้ยาก หรือ ทำไม่ได้เลยก็ได้
อย่างไรก็ตาม หลายๆ ครั้ง สโคปงานของ Data Analyst อาจจะไม่สามารถแก้ปัญหาที่ต้นทางได้ เช่น ถ้ามีคนพิมพ์ Input จังหวัดว่า
– กรุงเทพ
– กรุงเทพฯ
– กรุงเทพมหานคร
– กทม
– กทม.
– กทม 1xx00
เราก็ต้องรวบรวมให้เป็นอันเดียวกันให้ได้ หรือ สมมติข้อมูลซื้อขายจากระบบซื้อขาย กับ ระบบเก็บเงินไม่ตรงกัน มีข้อผิดพลาดที่ตรงไหน
สรุป
หลังจากที่อ่านทั้งสาม Skill, Scope งานแล้ว คุณจะคิดว่างาน Data Analyst เหมาะหรือดีกับคุณมั้ย ก็ขึ้นอยู่กับคุณแล้วครับ อย่างหลายๆ คนที่เป็น Data Analyst ในตอนที่เราสามารถแก้ปัญหาเหล่านี้ได้ แล้วรู้สึกว่างานสำเร็จ มันก็เป็นสิ่งที่ทำให้พวกเรายังทำงานสายนี้ตรงนี้กันอยู่นี่แหละครับ